بینایی ماشین شاخهای از تکنولوژی است که به کمک آن کامپیوترها و رباتها میتوانند تصاویر دنیای اطراف را دیده و آن را تجزیه و تحلیل کنند. حتما انیمیشن وال-ای را دیدهاید؛ رباتی کوچک و دوست داشتنی که به تنهایی (اگر سوسک کوچکش را حساب نکنیم) در برهوت سیارهی زمین زندگی میکند و از زبالههای باقی مانده برج میسازد. وال-ای تا قبل از آغاز سفر اکتشافی و هیجان انگیز خود، هر روز طبق برنامه به سراغ زبالهها رفته، آنها را مشاهده و به دقت بررسی میکند، هر چیزی که توجهاش را جلب کند برای خودش بر میدارد و بقیه را به مکعبی از زباله تبدیل میکند.
اما داستان از جایی جالب میشود که در یکی از همین روزهای تکراری، ربات کوچک ما با یک پدیدهی نا آشنا اما خیره کننده مواجه میشود، یک گیاه. و سفر پرهیایو و ماجراجویانهی وال-ای آغاز میشود. اما تا به حال به این فکر کردهاید که چرا وال-ای گیاه را مثل زبالهها نابود نکرد؟ پاسخ در تکنولوژی بینایی ماشین نهفته است.
بینایی ماشین چیست؟
سادهترین راه برای درک مفهوم بینایی ماشین این است که این تکنولوژی را به جای «چشم» ماشین در نظر بگیریم. بینایی ماشین یک تکنولوژی پیشرفته است که امکان جستوجو و تجزیه و تحلیل خودکار محیط پیرامون را برای سیستمهای هوشمند فراهم میکند. به کمک این تکنولوژی، بررسی خودکار اطراف، کنترل فرآیندها و راهنمای رباتیک از طریق پردازش تصویر ممکن میشود.
مهم است بدانید زمانی که از بینایی ماشین صحبت میکنیم میتوانیم ردپای آن را در شاخههای مختلف تکنولوژی مانند محصولات نرمافزار و سختافزاری، سیستمهای یکپارچه، اقدامات، روشها و تخصصهای گوناگون پیدا کنیم. بینایی ماشین یک توانایی جدید برای سیستمهای رایانهای است که در کنار سایر تکنولوژیها کمک میکند تا با روشهای جدیدی برای حل مشکلات و مسائل پیدا کنیم.
البته این مفهوم را نباید با بینایی کامپیوتر اشتباه گرفت. بینایی ماشین به وجود یک دوربین یا سیستمی مشابه آن وابسته است که به ربات متصل میشود و تصاویر دنیای پیرامون را دریافت میکند. برای فهم بهتر به زبان ساده میتوانیم این طور در نظر بگیریم که بینایی ماشین به عنوان چشم دستگاه کار میکند و بینایی کامپیوتر به عنوان مغز، تصاویر دریافتی از چشم را پردازش میکند. در نتیجه، بدون بینایی کامپیوتر، بینایی ماشین اصلا وجود ندارد! پس تا اینجای کار، فهمیدیم که بینایی ماشین کاری میکند تا رباتها اطراف خود را ببینند.
به داستان وال-ای برگردیم، پس وال-ای به کمک تکنولوژی بینایی ماشین میتواند اطراف و اجسام را ببیند. به کمک همین دانش او اشیایی که دوست دارد را برای خودش برمیدارد و بقیه را نابود میکند. بیایید کمی دقیق شویم؛ اگر یک نگاه سرسری به کلکسیون اشیا وال-ای بیندازیم، متوجه میشویم که وسایل مورد علاقهی او، چیزهایی هستند که نمیتواند هر روز مشابه آنها را پیدا کند، وسایلی که به نوعی «متفاوت» و «کمیاب» هستند! اما یک ربات این چیزها را از کجا میفهمد؟! برای رسیدن به پاسخ این سوال، اول باید ببینیم که اصلا بینایی ماشین چطور کار میکند!
بینایی ماشین چطور کار میکند؟
از آنجایی که دانش بینایی ماشین توسط خود ما انسانها طراحی شده، در نتیجه فرایند آن هم تا حد زیادی مشابه فرآیند بینایی انسانها است. اگر هنوز هم متوجه نشدید که بینایی ماشین چطور کار میکند نگران نشوید؛ به جای آن بیایید کمی با روش کار کردن قوهی بینایی خودمان آشنا شویم! برای دیدن هر چیزی، ابتدا به نور نیاز است. نور به جسم خورده و به چشم ما برمیگردد، تا این مرحله فرایند دیدن توسط انسان و ماشین (که دوربین نقش چشم را ایفا میکند) یکسان است.
در چشم انسان سلولهای گیرندهای وجود دارند که نور دریافت شده از شی را گرفته، آن را به سیگنال الکتریکی تبدیل کرده و و این سیگنال را به مغز میفرستند (بله، مغز ما هم با نیروی الکتریسیته کار میکند!). از این مرحله به بعد، مغز زحمت پردازش تصویر دریافت شده را میکشد، به این صورت که آن را با سایر اطلاعات موجود مقایسه کرده و هویت شی را تشخیص میدهد.
با کمی اغراق میتوان ادعا کرد که در بینایی ماشین هم همین فرایند اتفاق میافتد. نور بازتاب شده توسط دوربین دریافت شده، به سیگنال دیجیتال تبدیل شده و به مدار پردازنده میرود. در این قسمت، عمل پردازش تصویر آغاز میشود و پردازنده اطلاعات تصویر را با دادههایی که از قبل دارد مقایسه کرده و اگر مورد مشابهی پیدا کند، هویت شی را تشخیص داده و اعلام میکند. اما اگر تا به حال چنین وسیلهای را مشاهده نکرده بود چه؟
خب اینجا باید دست به دامن تکنولوژی یادگیری ماشین شویم! چنانچه نرمافزار کنترل کنندهی ماشین به یادگیری ماشین مجهز شده باشد، این شی را به عنوان یک وسیلهی جدید در خود ثبت کرده، و در اصل خصوصیات این وسیله را «میآموزد». تا الان به طور خلاصه فهمیدیم که بینایی ماشین چطور کار میکند، اما چیزی که تا الان مطرح شد قطرهای از دریای این علم است! هنوز چیزهای زیادی هست که دربارهی نحوهی کار بینایی ماشین نمیدانیم، پس بیایید کمی دقیقتر عملکرد آن را بررسی کنیم.
فرایند تصویر برداری بینایی ماشین
گام اول در بینایی ماشین، تصویر برداری است. سیستمی که به تکنولوژی بینایی ماشین مجهز شده (برای مثال یک بازوی رباتیک) از یک وسیله برای عکس برداری از محیط استفاده میکند. این وسیله اغلب نوعی دوربین است که میتواند از واحد پردازش تصویر جدا باشد یا در ترکیب با آن یک دوربین هوشمند یا سنسور هوشمند را به وجود آورد. با توجه به کاربرد مورد نظر، از ابزار مختلفی مانند مقاومتهای نوری (فتوسل)، دوربینهای دیجیتال، دوربینهای سه بعدی، دوربینهای دمایی و دوربینهای هوشمند میتوان استفاده کرد.
به طور معمول یک سیستم بینایی ماشین از تصویر برداری دو بعدی معمولی در شرایط روشنایی استاندارد استفاده میکند. با این وجود اگر برای تشخیص جزئیات یک قطعه به نورپردازی یا تصویر برداری خاصی نیاز باشد، میتوان از تصویربرداری چند طیفی، ابر طیفی، مادون قرمز، تصویر برداری خطی، سه بعدی و تصویر برداری با اشعه ایکس استفاده کرد. تفاوت اساسی این است که تصاویر به دست آمده از نورپردازی دو بعدی اغلب تک رنگ هستند، در حالی که تصویر برداری پیچیده اطلاعاتی مانند رنگ، نرخ فریم و وضوح را ثبت میکنند. از تصویرپردازی پیچیده برای ردیابی موارد متحرک استفاده میشود.
خب دربارهی وال-ای، تقریبا میتوانیم مطمئن باشیم که ربات کوچک ما از دوربینهای پیشرفتهای برخوردار بوده اما در مورد قدرت تشخیص رنگ، خب مطمئن نیستیم! چرا؟ تصویر زیر دنیا را از نگاه وال-ای نشان میدهد و همانطور که میبینید دنیا از نگاه وال-ای تک رنگ است!
سوالی که مطرح میشود این است که پس وال-ای چطور تفاوت گیاه از زبالهها را (یا خاص بودن آن، سخت نگیرید!) متوجه شد؟ مهم است بدانید که بینایی ماشین چیزی بیش از عکس برداری، پردازش تصاویر و تشخیص اجسام از روی رنگ آنها است! پس برای حل معما، به خواندن این مقاله ادامه دهید!
پردازش تصویر
زمانی که عکس گرفته شود، برای پردازش شدن به یک واحد پردازندهی مرکزی از نوع CPU ، GPU و FPGA یا ترکیبی از اینها فرستاده میشود. با توجه به ابعاد و میزان پیچیدگی سیستم نوع و دقت ابزار بینایی ماشین، پردازندهی سیستم تعیین میشود. برای مثال، پردازندهی مورد نیاز برای بررسی تعداد ۱۲ قطعه در روز با پردازندهی مناسب یک فرایند پیچیدهتر، برای نمونه بررسی ۱۲ قطعه در دقیقه متفاوت خواهد بود.
در مورد پردازندهی دوم حجم دیتا به میزان زیادی افزایش پیدا کرده و واضح است که پردازندهی دوم از پیچیدگی و دقت بالاتری برخوردار خواهد بود. اگر قرار باشد که سیستم بینایی ماشین تکنولوژیهای یادگیری ماشین و یادگیری عمیق را نیز پیاده سازی کند، به طور قطع به پردازندهای پیشرفته و پیچیدهتر نیاز خواهد داشت. پردازش تصویر دومین مرحله و یکی از مهمترین مرحلههای فرایند بینایی ماشین است و اطلاعات به دست آمده در این قسمت برای تکمیل نتیجهی نهایی که به کاربر نشان داده میشود مورد استفاده قرار میگیرد.
یک فرایند پردازش تصویر معمولی به طور کلی با استفاده از ابزاری مانند فیلترها انجام میشود که برای اصلاح تصویر روی آن اعمال میشوند. سپس خصوصیات اشیا در تصویر مانند شکل و جزئیات آنها استخراج میشود، در ادامه دیتای مورد نظر مانند بارکد، اندازه، کد پستی و سایر اطلاعاتی که در تصویر گنجانده شده خوانده میشوند، درست مانند زمانی که بارکد یک محصول در فروشگاه اسکن شده و اطلاعات آن در سیستم ثبت میشود.
در مرحلهی بعد این دیتا به واحد پردازش منتقل شده و در نهایت پردازنده تصمیم گیری میکند که با این قطعه یا شیء چه کار کند. گسترهی وسیعی از فیلترها و روشهای پردازش تصویر وجود دارد که توسط تکنولوژی بینایی ماشین میتوان آن را روی تصاویر اعمال کرد و اطلاعات مختلفی را از دل آن بیرون کشید. اینکه کدام فیلتر و کدام روش باید استفاده شود، به هدف و کاربرد سیستم بستگی دارد. فرایند پردازش تصویر به بخشهای زیر تقسیم میشود:
آستانه گذاری و شمارش پیکسل
در این قسمت بخشهایی از تصویر در صورت نیاز بریده میشود. انجام این کار نیازمند این است که سیستم یک مقدار پایه را برای رنگی بین سیاه و سفید (یعنی خاکستری) در نظر بگیرد و به کمک این مقدار پایه، بخشهای سیاه و سفید تصویر را از هم تشخیص دهد. این عمل که آستانه گذاری نام دارد به سیستم کمک میکند تا اشیا را داخل تصویر تشخیص دهد و بتواند آن را از سایر جزئیات موجود در تصویر جدا کند. پس از آستانه گذاری، مرحلهی شمارش پیکسل آغاز میشود.
همانطور که میدانید تصاویر دیجیتال از مربعهای رنگی یا سیاه و سفید بسیار کوچکی به نام پیکسل تشکیل شدهاند که به کل عکس شکل میدهند. در مرحلهی شمارش پیکسل تعداد خانههای سفید و سیاه به صورت جداگانه شمرده میشوند، این عمل معمولا به کمک سنسورهای شمارش پیکسل انجام میشود. از فرایند شمارش پیکسل در سیستمهای بسته بندی خودکار استفاده میشود؛ به این صورت که سنسور شمارنده پیکسلها برچسبهای بطری را از به کمک ترکیب پیکسلهای سیاه و سفید تشخیص میدهد و تصویری از کل بطری به دست میآورد.
بخش بندی، تشخیص لبه و پردازش رنگ
در این قسمت از فرایند پردازش تصویر، تصویر دیجیتالی به بخشهای مختلفی تقسیم میشود تا با ساده سازی یا تغییر عکس بتوان آن را سادهتر آنالیز کرد یا معنای بیشتری را از دل آن بیرون کشید. همچنین با بخش بندی تصویر سیستم پردازنده میتواند اشیا موجود در عکس را آسانتر دسته بندی کند. به کمک تشخیص لبه، سیستم بینایی ماشین میتواند لبههای هر قطعه یا شیء موجود در عکس را تشخیص دهد و آن وسیله را از دیگری متمایز کند.
شاید به نظر ساده بیاید، اما تشخیص اشیا برای کامپیوترها به آسانی مغز انسان نیست! در فرایند یادگیری ماشین، قابلیت تشخیص لبه به سیستم کمک میکند تا نحوهی تشخیص لبهی اشیا مختلف را یاد بگیرد و آنها را سادهتر دسته بندی کند. اگر سیستم به دوربینهای رنگی یا سنسورهای تشخیص رنگ مجهز باشد، بسیار سادهتر میتواد قطعات و اشیا را از یکدیگر تشخیص داده و آنها را دسته بندی کند.
یادگیری ماشین، یادگیری عمیق و شبکههای عصبی
در اینجا پردازش تصویر به پایان رسیده و با کمک اطلاعات خامی که از تصویر به دست آمده، پردازش اطلاعات آغاز میشود. به کمک سه تکنولوژی یادگیری ماشین، یادگیری عمیق و شبکههای عصبی، اطلاعات خام در سیستم بینایی ماشین با سرعت و دقت بالاتر پردازش میشوند. سه تکنولوژی نامبرده به سیستم بینایی ماشین کمک میکنند تا با قدرت بیشتری اطلاعات را پردازش کند. به کمک این سه تکنولوژی، سیستم بینایی ماشین میتواند بهتر بفهمد که کدام دیتا با ارزش است و این قابلیت در مواردی که پای تعداد زیاد و فرایندهای پیچیده در میان باشد به سیستم کمک زیادی میکند.
تشخیص الگو و خواندن اطلاعات
با کمک قابلیت تشخیص الگو، سیستم بینایی ماشین میتواند الگوهای مشخصی را طی فرایند پیدا کرده، تشخیص دهد و بشمارد. تشخیص الگوهای مختلف از یکدیگر یا پیدا کردن الگوهای پیچیده را میتوان به کمک فناوری یادگیری ماشین یا یادگیری عمیق به ماشین آموزش داد. نمونههایی از این مورد میتواند اشیایی باشد که چرخانده شدهاند، پشت جسم دیگری پنهان شدهاند یا ابعاد مختلفی دارند.
خواندن اطلاعات قابلیتی است که به کمک آن سیستم بینایی ماشین میتواند اطلاعات روی برچسبها یا اشیا را از طریق یک ماتریس دیتا مانند کیوآرکد (QRcode)، بارکد یا تگهای رادیو فرکانسی (RFID) بخواند. مثالهایی از کاربرد این قابلیت را در فروشگاهها به فراوانی میتوان مشاهده کرد؛ برای مثال برخی از لباسهای روی تگ خود بارکدی دارند که با اسکن کردن آن میتوان به اطلاعاتی مانند کشور سازنده، جنس و الزامات شستوشو دسترسی پیدا کرد. سطح اطلاعاتی که یک سیستم بینایی ماشین میتواند بخواند متفاوت است، برای نمونه اطلاعات داخل تگ RFID نسبت به بارکد از جامعیت و پیچیدگی بیشتری برخوردار است.
تشخیص کاراکترها و سنجش
مشابه قابلیت خواندن اطلاعات، تشخیص کاراکتر امکان خواندن متن و اعداد مانند شماره سریال محصول را برای سیستم فراهم میکند. هرچقدر متن پیچیدهتر باشد، ارتقا دادن ظرفیتهای سیستم بینایی ماشین به کمک آموزش دادن آن از طریق یادگیری ماشین یا یادگیری عمیق از اهمیت بیشتری برخوردار خواهد شد. قابلیت سنجش این امکان را فراهم میکند تا سیستم بتواند ابعاد و اندازه اجسام موجود در تصویر را اندازه گیری کند. به کمک توانایی سنجش، سیستم قادر است ابعاد شیء را در حالتهای مختلف اندازه گیری مانند پیکسل، اینچ، میلیمتر، طول، زمان، وزن و غیره را شناسایی کند.
تصمیم گیری دربارهی نتیجه
در این مرحله کار تمامی مراحل قبل به بار مینشیند! حالا به کمک اطلاعات به دست آمده از مرحلههای پیشین، سیستم تصمیم میگیرد که باید با این قطعه چه کار کرد. برای مثال، خصوصیات قطعه با استانداردهای لازم سنجیده میشود و اگر کیفیت لازم را نداشته باشد، به قسمت قطعات دارای ایراد فرستاده میشود، در غیر این صورت در خط تولید به راه خود ادامه خواهد داد. مثال دیگر این است که گاهی در خط تولید با قطعات مختلفی سروکار داریم و لازم است که هر کدام به مقصد مشخصی هدایت شوند. در این مورد سیستم بینایی ماشین هویت هر قطعه را تشخیص داده و آن را به مقصد مورد نظر میفرستد.
خب! اکنون که عملکرد بینایی ماشین را با جزئیات کامل درک کردیم، وقت رسیدن به پاسخ معمای وال-ای است! برای فهمیدن جواب آمادهاید؟ احتمالا تا این لحظه خودتان به جواب رسیدهاید، ولی برای اطمینان بیشتر، بیایید این معما را یک بار دیگر بررسی کنیم. سوال این است که چرا وال-ای گیاه را از زبالهها جدا کرد؟
با دانستن عملکرد سیستم مجهز به بینایی ماشین (که در این مسئله وال-ای است) میدانیم که سیستم تصویر قطعات را بررسی میکند و با کمک جزئیات، هویت آن را تشخیص میدهد. وال-ای بیچاره سالهای سال است که به تفکیک زبالهها مشغول است، پس به خوبی با خصوصیات آنها آشنا است! هر زبالهای مانند قوطی نوشابه یا کاغذ یا وسایل الکترونیکی خراب که باید منهدم شود بارها به چشم وال-ای خورده و در حافظهاش به عنوان یک زباله ثبت شده است.
پس هر بار که وال-ای با زبالهای تکراری روبهرو شود، با الگوی تشخیص زباله که سالها پیش آموخته (احتمالا با کمک یادگیری ماشین) آن را تشخیص داده و منهدم میکند. حالا در روزی از روزهای تکراری، وال-ای با چیزی مواجه میشود که تاکنون مشابه آن را ندیده؛ یک گیاه. وال-ای تصویر آن را ثبت کرده، با الگوی زبالهها و هر وسیله دیگری که تاکنون دیده مقایسه میکند، اما بدون پاسخ میماند! در حافظهی وال-ای هیچ خاطره یا دیتایی مربوط به گیاه وجود ندارد!
در نتیجه، هویت گیاه به عنوان یک زباله تایید نمیشود و وال-ای آن را از بین بقیه چیزها جدا میکند، و با تشکر از دانش بینایی ماشین، سرنوشت سیارهی زمین عوض میشود! میتوان انیمیشن وال-ای را درس کاملی دربارهی رباتیک، بینایی ماشین و یادگیری ماشین به حساب آورد؛ در این فیلم کاربردهای مختلفی از تکنولوژی بینایی ماشین میبینیم که شاید اغراق آمیز به نظر برسند، اما ریشه در واقعیت دارند. اما در دنیای امروز از بینایی ماشین در چه کارهایی استفاده میشود؟
کاربردهای بینایی ماشین
کاربرد اولیهی تکنولوژی بینایی ماشین بازرسی، مرتب سازی و راهنمای رباتیک مبتنی بر تصویر است. تکنولوژی بینایی ماشین روی یک ربات تعبیه میشود تا به کمک آن، ربات تشخیص دهد که قطعات را کجا قرار داده یا از کجا بردارد. به کمک این فناوری میتوان خطوطی هوشمند از رباتهایی را ایجاد کرد که به طور خودکار قطعات را در مسیر خط تولید بررسی و آنالیز کرده، در صورت لزوم برداشته و در جای دیگری قرار میدهند و در نهایت کل خط محصول را کنترل و هدایت میکنند.
در صورتی که یک دوربین طیف سنج به سیستم اضافه کنیم، خط رباتیک قادر خواهد بود تا در طی فرایند سنجش و بررسی قطعات رنگها را نیز تشخیص داده و از این اطلاعات در جهت سنجش بهتر اشیا استفاده کند. هرچند اضافه کردن این قبیل جزئیات باعث کاهش زمان پاسخدهی سیستم میشود، به این خاطر که بخش پردازنده برای پردازش اطلاعات به زمان بیشتری نیاز خواهد داشت. با پیشرفت علم، دنیای برنامه نویسی برای نرمافزارها آنقدر بی حدومرز شده که میتوانیم با توجه به نیازهای خاص هر صنعت، از صنایع مواد غذایی گرفته تا خودرو، سیستمهای کنترلی مختلفی طراحی و پیاده سازی کنیم.
سیستمی که به تکنولوژی بینایی ماشین مجهز باشد میتواند گسترهی وسیعی از اشیا و قطعات را با توجه به صنعت مورد نظر سنجیده و مرتبط کند. از بینایی ماشین در طیف بسیار گستردهای از صنایع مانند خودروسازی، الکترونیک و نیمه هادیها، مواد غذایی و نوشیدنی، ترافیک جادهای، وسایل نقلیه و سیستمهای هوشمند حمل و نقل، تصویر برداری پزشکی، بسته بندی، برچسب زنی و چاپ، علوم دارویی، توسعه علمی و پخش تلویزیونی میتوان استفاده کرد.
این تکنولوژی در کنار سایر حوزههای علم مانند یادگیری عمیق و یادگیری ماشین قرار میگیرد و به کسبوکارها کمک میکند تا دیتاهای موجود را بهتر فهمیده و پردازش کنند، همچنین به آن ها کمک میکند تا کارایی محصولات موجود را افزایش دهند؛ برای مثال شرکت بیامدبلیو از این تکنولوژیهای مرتبط با هوش مصنوعی و یادگیری ماشین اسفاده میکند تا عملکرد خودروهای خود را بهبود ببخشد، مشابه همین کار در شرکت خودروسازی تسلا رخ میدهد که بر تولید خودروهای خودران تمرکز دارد.
بینایی ماشین در رباتیک
امروزه استفاده از رباتها به شکل قابل توجهای افزایش یافته و به همین خاطر استفاده از تکنولوژی بینایی ماشین روی رباتها اهمیت ویژهای یافته است. تجهیز شدن به این تکنولوژی به رباتها کمک میکند تا از دقت بالاتر، جهت یابی بهتر و فهم آسانتر مسائل برخوردار شوند. در نتیجه قادر خواهند بود تا با دقت بیشتری یک قطعه را بررسی کنند، آن را سریعتر در موقعیت مناسب قرار دهند و وظایف پیچیدهتر را در مدت زمان کمتری حل و فصل کنند. این قابلیت به اپراتورها اجازه میدهد تا رباتها را آسانتر و در دو محور حرکتی کنترل نمایند.
در بیشتر موارد یک دوربین روی ربات نصب میشود یا از یک سیستم با دو دوربین استفاده میشود تا دقت بالاتر برای فعالیتهای پیچیده مانند مرتب کردن محصولات یا گذاشتن و برداشتن محصول با کمک بازوهای رباتیک تامین شود. اگرچه، اسکن با لیزر امکان دیگری است که برای میتواند برای تاباندن نور راه راه و مشخص کردن محصول معیوب استفاده شود. به صورت مشابه، دوربینهای سه بعدی میتوانند برای تهیه یک نقشه سه بعدی از محصول یا قسمتی از آن مورد استفاده قرار گیرند.
ردپای بینایی ماشین در زندگی روزمره
با وجود استفاده گسترده از رباتها در صنعت، هنوز پای رباتها چندان به زندگی روزمرهی ما باز نشده است. با این حال چنین روزی دور نیست. همین حالا که مشغول خواندن این مقاله هستید تکنولوژیهایی که از بینایی کامپیوتر استفاده میکنند دور تا دور شما را فرا گرفتهاند. برای مثال، نرمافزار Google Translate میتواند عکسی از یک متن دست نویس را به آسانی ترجمه کند، قفل تلفن هوشمند که با تشخیص چهره باز میشود و برنامههای سلامت تلفنهای هوشمند، همگی از تکنولوژی بینایی کامپیوتر بهره میبرند.
نمونهای از بینایی ماشین در زندگی انسانها، ربات کوچک و با نمکی به نام کوزمو (Cozmo) است که بیشتر برای سرگرمی ساخته شده و میتواند موقعیت خود را تشخیص داده، حرکت کند، بازی کند، در صورت افتادن خود را به حالت درست برگرداند و به تلفن همراه و دستیار شخصی صوتی وصل شود. جالب است بدانید که در طراحی کوزمو از یکی از رباتهای فیلم وال-ای الهام گرفته شده است. (این کوچولوی وسواسی را یادتان هست؟) کوزمو میتواند به سیستم خانهی هوشمند شما متصل شود و ویژگیهای محیطی مانند نور و دما را کنترل کند.
اگر به فیلمهای علمی تخیلی علاقه داشته باشید، به احتمال قوی تا الان بارها به شخصیتهایی با تکنولوژی بینایی ماشین برخوردهاید. دنیای سرتاسر کامپیوتری فیلم ماتریکس (۱۹۹۹)، شخصیت منفی فیلم اودیسهی فضایی (۱۹۶۸) یا همان کامپیوتر هال۹۰۰۰، دیوید پسربچه رباتیکی فیلم هوش مصنوعی (۲۰۰۱) و خیلی شخصیتهای دیگر همگی از بینایی ماشین بهره بردهاند. با این حساب به یک حقیقت جالب میرسیم (برای غافلگیری آمادهاید؟) : شما حتی قبل از خواندن این مقاله هم با بینایی ماشین آشنا بودهاید!
پیشرفت حیرت انگیز تکنولوژی هم میتواند ترسناک باشد و هم امیدوار کننده؛ شاید روزی برسد که دنیای ترسناک فیلم ماتریکس به واقعیت بپیوندد و انسانها مغلوب ماشینها شوند، یا شاید هم برعکس؛ روزی یک ربات کوچک مثل وال-ای بتواند کاری کند که انسانها یک بار دیگر دستان یکدیگر را بگیرند و برای احیا کردن زندگی در زمین با هم متحد شوند. شما چه فکر میکنید؟ به نظر شما پیشرفت دنیای ماشینها چه آینده را در پیش خواهد داشت؟ شما میتوانید نظرات خود را در پایین همین صفحه به اشتراک بگذارید. منتظر نظرات شما هستیم!