OpenAI مدل هوش مصنوعی جدیدی با نام o1 را معرفی کرده که اولین مدل این استارتاپ از سری مدلهای دارای قابلیت «استدلال» برای پاسخدادن به سؤالات پیچیدهتر است. علاوهبراین، یک نسخه کوچکتر و ارزانتر از آن با نام o1-mini نیز منتشر شده است. در شایعات مربوط به این استارتاپ، به این مدل با نام «توتفرنگی» اشاره شده بود.
o1 گام مهمی برای OpenAI در جهت هدف تولید مدلهای هوش مصنوعی شبیه انسان است. این مدل نسبت به مدلهای قبلی در نوشتن کد و حل مسائل چند مرحلهای بهتر عمل میکند، اما گرانتر و کُندتر از GPT-4o است. همچنین OpenAI از o1 بهعنوان یک نسخه «پیشنمایش» نام برده است تا بر نوظهور بودن آن تأکید داشته باشد.
ویدیوی زیر قابلیت o1 در تولید کد مربوط به یک بازی ویدیویی از دستور متنی ساده را نشان میدهد:
هزینه و زمان دسترسی به مدل o1
کاربران ChatGPT Plus و Team هماکنون به o1 و o1-mini دسترسی دارند و کاربران Enterprise و Edu در اوایل هفته آینده به آن دسترسی پیدا میکنند. همچنین OpenAI قصد دارد o1-mini را در دسترس تمام کاربران رایگان ChatGPT قرار دهد، اما هنوز زمان آن را اعلام نکرده است.
برای توسعهدهندگان این مدل با قیمت تقریباً بالایی ارائه شده است و API آن به ازای هر 1 میلیون توکن ورودی 15 دلار و به ازای هر 1 میلیون توکن خروجی 60 دلار هزینه دارد. برای مقایسه، GPT-4o به ازای هر 1 میلیون توکن ورودی 5 دلار و به ازای هر 1 میلیون توکن خروجی 15 دلار هزینه دارد.
همچنین روش آموزش این مدل نسبت به مدلهای قبلی OpenAI متفاوت است، هرچند این استارتاپ در مورد جزئیات آن توضیحی دقیقی ارائه نکرده است. «جری تورک»، سرپرست تحقیقات OpenAI، میگوید که o1 با استفاده از یک الگوریتم بهینهسازیشده کاملاً جدید و مجموعه دادههای آموزشی جدیدی که بهطورخاص برای آن طراحی شدهاند، آموزش داده شده است.
درواقع برای o1 از تکنیکی با نام «یادگیری تقویتی» استفاده شده است که باعث میشود مدل با پاداش و جریمه مسائل را به تنهایی حل کند. سپس مانند انسانها که مشکلات را با مرور مرحلهبهمرحله پردازش میکنند، از یک «زنجیره فکر» برای پردازش سؤالات استفاده میکند.
با وجود این روش آموزش جدید، OpenAI میگوید که این مدل دقیقتر عمل میکند و توهم کمتری دارد.
ویدیوی زیر قابلیت استدلال این مدل را نشان میدهد:
طبق توضیحات OpenAI، مهمترین نکتهای که این مدل جدید را نسبت به GPT-4o متمایز میکند، توانایی آن در حل مسائل پیچیده، مانند کدنویسی و ریاضی است که بسیار بهتر از مدلهای قبلی عمل میکند و همچنین توضیح استدلال آن است. درعینحال، o1 در بسیاری از حوزهها بهاندازه GPT-4o توانایی ندارد. o1 در دانش واقعی درباره جهان به خوبی عمل نمیکند و همچنین توانایی مرور وب یا پردازش فایلها و تصاویر را ندارد.