OpenAI روز گذشته o1، اولین مدل هوش مصنوعی خود با قابلیت استدلال، را منتشر کرد. نکته قابلتوجهی که درباره این مدل وجود دارد، مکث کوتاه آن برای «فکرکردن»هنگام ارائه پاسخ موردنیاز کاربران است. اخیراً اولین نگاهها به این مدل موردانتظار و جذاب منتشر شده است.
o1 در مقایسه با GPT-4o برتریها و ضعفهای خاص خودش را دارد. OpenAI میگوید o1 در استدلال و پاسخدادن به سؤالات پیچیده برتری دارد اما استفاده از آن تقریباً 4 برابر گرانتر از GPT-4o است. همچنین مدل جدید OpenAI ابزارها (نظیر ویژگی تجزیهوتحلیل داده و آپلود فایل)، قابلیتهای چندوجهی و سرعتی را که باعث محبوبیت GPT-4o شده، ندارد.
حتی در وبسایت OpenAI نوشتهشده «GPT-4o همچنان بهترین گزینه برای اکثر درخواستهاست» و o1 در انجام وظایف ساده ضعف دارد.
«کیان کتانفروش»، مدیرعامل ایرانیالاصل Workera و استاد یادگیری ماشین دانشگاه استنفورد، ازجمله کارشناسانی است که درباره o1 با تککرانچ صحبت کرده است:
«هیجان زیادی در جامعه هوش مصنوعی وجود دارد. اگر بتوانید الگوریتم یادگیری تقویتی را در ترکیب با برخی از تکنیکهای مدل زبانی که OpenAI دارد آموزش دهید، از نظر فنی میتوانید تفکر گامبهگام ایجاد کنید و به مدل هوش مصنوعی اجازه بدهید بهصورت معکوس از ایدههای بزرگی که میخواهید روی آنها کار کنید، پیش برود.»
چند مثال از تجربه کار با هوش مصنوعی o1
در نمونهای، از هوش مصنوعی o1 خواسته شد در برنامهریزی مهمانی خانوادگی روز شکرگزاری به کاربر کمک کند و سؤالاتی از آن شده بود؛ ازجمله پرسشی درباره کافی بودن 2 اجاق گاز برای پخت شام 11 نفر و نیاز به اجاره اجاق سوم.
پس از 12 ثانیه «فکرکردن»، o1 پاسخی دارای بیش از 750 کلمه نوشت که در آن به کاربر گفته شده بود دو اجاق گاز کافی است و در هزینههای شما صرفهجویی میکند.
در مثال دیگری، از o1 خواسته شد برای یک روز کاری شلوغ که شامل جلسات متعدد و سفر میشود، برنامهریزی کند. هوش مصنوعی OpenAI برای این درخواست برنامهای بسیار دقیق ارائه کرده که البته خروجی آن ظاهراً بسیار گسترده بوده است.
بهطورکلی، ظاهراً o1 عادت دارد برای حتی سادهترین سؤالها نیز پاسخهای طولانی تولید کند. زمانی که از این هوش مصنوعی سؤال شد در کدام منطقه آمریکا میتوان درخت سرو پیدا کرد، o1 پاسخی بیشتر از 800 کلمهای تولید کرد که شامل تمام گونههای سرو کشور و نام علمی آن را میشد.
بنابراین اگر بهدنبال پاسخهای مستقیم و کوتاهید، GPT-4o در این زمینه بهتر عمل میکند. از سویی توجه کنید که o1 مدلی گران است؛ بنابراین کاربران باید در استفاده از آن بیشتر دقت کنند و برای سؤالات ساده هزینه زیادی نپردازند. همچنین برخی کارشناسان o1 را کمتر تصمیمگیرنده و بیشتر ابزاری برای زیر سؤال بردن تفکر شما درمورد تصمیمات بزرگ میدانند.