مایکروسافت امروز خبر داده تکنولوژی کپشننویسی تصویرش که بر هوش مصنوعی متکی است، اکنون از طریق سرویسهای ادراکی آژور (Azure Cognitive Services) در دسترس است. این کمپانی ضمنا مدعی شده که سیستم جدیدش میتواند با مهارتی مشابه انسانها، تصاویر مختلف را توصیف کند.
این دستاورد جدید میتواند به توسعهدهندگان کمک کند تا دسترسیپذیری را در اپلیکیشنهای خود بهبود ببخشند. با استفاده از کپشننویسی مبتنی بر هوش مصنوعی، کاربران حالا میتوانند محتویات مهم درون تصاویر موتورهای جستجو و تصاویر موجود در ارائهها را مشاهده کنند. اما این شرکت غول حوزه تکنولوژی هشدار داده که گاهی از اوقات، نتایج آنقدرها هم بینقص نخواهند بود.
مهمتر از همه اینها، صغیب شیخ، یکی از مهندسین نرمافزار در گروه پلتفرم هوش مصنوعی مایکروسافت، میگوید که این قابلیت به افرادی که مشکلات بینایی دارند کمک خواهد کرد تا از طریق کپشنهای دقیق، از محتویات موجود در تصاویر وب و مستندات مختلف باخبر شوند. تیم او از این سیستم برای اپلیکیشن تصویربرداری Seeing AI نیز استفاده میکند که تصاویر را برای افراد نابینا یا دچار به کمبینی، توصیف میکند.
شیخ میگوید: «در حالت ایدهآل، هرکسی باید برای تصاویر موجود در مستندات، در وب و در شبکههای اجتماعی را کپشننویسی کند تا افراد نابینا هم به آن محتویات دسترسی داشته و در مباحثات شرکت کنند. اما همه چنین کاری نمیکنند. بنابراین چندین اپلیکیشن داریم که وقتی خبری از کپشن برای تصاویر نیست، همین کار را با قابلیت تشخیص تصویر به انجام میرسانند.
مایکروسافت مدعی شده که سیستم جدیدش تا دو برابر بهتر از هر مدل کپشننویسی تصویری است که از سال ۲۰۱۵ تاکنون استفاده شده است. کمپانی ساکن ردموند میگوید هوش مصنوعیاش توانسته کپشنهایی برای تصاویر بنویسد که حتی از نمونههای نوشته شده توسط افراد واقعی «شفافتر و دقیقتر» هستند.
ناگفته نماند که اواخر سال جاری میلادی، این تکنولوژی کپشننویسی راهش را به دیگر سرویسهای مایکروسافت مانند Word ،Outlook و پاورپوینت باز خواهد کرد. جالب است که برای این قابلیت منتظر بمانیم و ببینیم که در دنیای واقعی و غیر ایدهآل چه عملکردی از خود به نمایش میگذارد.