شرکت آمریکایی Cerebras بهتازگی جدیدترین تراشه استنتاج هوش مصنوعی خود با نام CS-3 را معرفی کرده و ادعا میکند که این تراشه ازجمله سریعترین تراشههای هوش مصنوعی جهان است.
همزمان با افزایش کاربرد هوش مصنوعی در صنایع و دستگاههای مختلف، ساخت تراشههایی برای پردازش این فعالیتها به تمرکز جدید شرکتهای تولیدکننده تراشه تبدیل شده است. انویدیا درحالحاضر پادشاه بیرقیب بازار تراشههای هوش مصنوعی است و توانسته سهم قابلتوجهی از این بازار را نصیب خود کند. اما Cerebras ادعا میکند که توانسته تراشهای برای رقابت با تراشه DGX100 انویدیا توسعه دهد.
تراشه جدید Cerebras رقیب DGX100 انویدیا است
به گزارش تکرادار، تراشه جدید Cerebras به ۴۴ گیگابایت حافظه پرسرعت مجهز است که به آن امکان میدهد مدلهای هوش مصنوعی را با میلیاردها یا تریلیونها پارامتر هندل کند. برای مدلهایی که از ظرفیت این تراشه فراتر میروند نیز Cerebras میگوید که میتواند آنها را در مرزهای هر لایه تقسیم و در چند سیستم CS-3 توزیع کند. یک سیستم CS-3 میتواند مدلهای دارای ۲۰ میلیارد پارامتر را هندل کند، درحالیکه مدلهای ۷۰ میلیارد پارامتری تنها با چهار سیستم CS-3 قابل مدیریت هستند.
برای بالابردن دقت، Cerebras روی استفاده از مدلهای ۱۶ بیتی تأکید دارد. به گفته این شرکت، مدلهای ۱۶ بیتی میتوانند در مکالمات چندنوبتی، ریاضی و کارهای استدلالی تا ۵ درصد عملکرد بهتری نسبت به مدلهای ۸ بیتی داشته باشند و خروجیهای مطمئنتر و دقیقتری ارائه کنند.
پلتفرم استنتاج Cerebras از طریق چت و دسترسی API در دسترس توسعهدهندگان قرار دارد. این پلتفرم همچنین بهصورتی طراحی شده که توسعهدهندگان آشنا به Chat Completions شرکت OpenAI بتوانند بهراحتی آن را در محصولات خود ادغام کنند. این پلتفرم ادعا دارد که میتواند مدلهای Llama3.1 70B را با سرعت ۴۵۰ توکنبرثانیه اجرا کند.
همچنین، این پلتفرم در ابتدا با پشتیبانی از مدلهای Llama3.1 8B و 70B در دسترس قرار میگیرد. در آینده نیز پشتیبانی از Llama3 405B و Mistral Large 2 به آن اضافه میشود.