اولین نگاه به مدل OpenAI o1؛ هوش مصنوعی که دارای وسواس فکری است

OpenAI روز گذشته o1، اولین مدل هوش مصنوعی خود با قابلیت استدلال، را منتشر کرد. نکته قابل‌توجهی که درباره این مدل وجود دارد، مکث کوتاه آن برای «فکرکردن»هنگام ارائه پاسخ موردنیاز کاربران است. اخیراً اولین نگاه‌ها به این مدل موردانتظار و جذاب منتشر شده است.

o1 در مقایسه با GPT-4o برتری‌ها و ضعف‌های خاص خودش را دارد. OpenAI می‌گوید o1 در استدلال و پاسخ‌دادن به سؤالات پیچیده برتری دارد اما استفاده از آن تقریباً 4 برابر گران‌تر از GPT-4o است. همچنین مدل جدید OpenAI ابزارها (نظیر ویژگی تجزیه‌وتحلیل داده و آپلود فایل)، قابلیت‌های چندوجهی و سرعتی را که باعث محبوبیت GPT-4o شده، ندارد.

حتی در وب‌سایت OpenAI نوشته‌شده «GPT-4o همچنان بهترین گزینه برای اکثر درخواست‌هاست» و o1 در انجام وظایف ساده ضعف دارد.

«کیان کتان‌فروش»، مدیرعامل ایرانی‌الاصل Workera و استاد یادگیری ماشین دانشگاه استنفورد، ازجمله کارشناسانی است که درباره o1 با تک‌کرانچ صحبت کرده است:

«هیجان زیادی در جامعه هوش مصنوعی وجود دارد. اگر بتوانید الگوریتم یادگیری تقویتی را در ترکیب با برخی از تکنیک‌های مدل زبانی که OpenAI دارد آموزش دهید، از نظر فنی می‌توانید تفکر گام‌به‌گام ایجاد کنید و به مدل هوش مصنوعی اجازه بدهید به‌صورت معکوس از ایده‌های بزرگی که می‌خواهید روی آن‌ها کار کنید، پیش برود.»

چند مثال از تجربه کار با هوش مصنوعی o1

در نمونه‌ای، از هوش مصنوعی o1 خواسته شد در برنامه‌ریزی مهمانی خانوادگی روز شکرگزاری به کاربر کمک کند و سؤالاتی از آن شده بود؛ ازجمله پرسشی درباره کافی‌ بودن 2 اجاق گاز برای پخت شام 11 نفر و نیاز به اجاره اجاق سوم.

بخوانید! دوربین‌های نظارتی برای رصد محیط‌های صنعتی به هوش مصنوعی مسلح می‌شوند

پس از 12 ثانیه «فکرکردن»، o1 پاسخی دارای بیش از 750 کلمه‌ نوشت که در آن به کاربر گفته شده بود دو اجاق گاز کافی است و در هزینه‌های شما صرفه‌جویی می‌کند.

در مثال دیگری، از o1 خواسته شد برای یک روز کاری شلوغ که شامل جلسات متعدد و سفر می‌شود، برنامه‌ریزی کند. هوش مصنوعی OpenAI برای این درخواست برنامه‌ای بسیار دقیق ارائه کرده که البته خروجی آن ظاهراً بسیار گسترده بوده است.

به‌طورکلی، ظاهراً o1 عادت دارد برای حتی ساده‌ترین سؤال‌ها نیز پاسخ‌های طولانی تولید کند. زمانی که از این هوش مصنوعی سؤال شد در کدام منطقه آمریکا می‌توان درخت سرو پیدا کرد، o1 پاسخی بیشتر از 800 کلمه‌ای تولید کرد که شامل تمام گونه‌های سرو کشور و نام علمی آن را می‌شد.

بنابراین اگر به‌دنبال پاسخ‌های مستقیم و کوتاهید، GPT-4o در این زمینه بهتر عمل می‌کند. از سویی توجه کنید که o1 مدلی گران است؛ بنابراین کاربران باید در استفاده از آن بیشتر دقت کنند و برای سؤالات ساده‌ هزینه زیادی نپردازند. همچنین برخی کارشناسان o1 را کمتر تصمیم‌گیرنده و بیشتر ابزاری برای زیر سؤال‌ بردن تفکر شما درمورد تصمیمات بزرگ می‌دانند.