نگاهی به یادگیری عمیق و ۲۳ کاربرد جالب آن

۱۳۹۷ جمعه ۱۸ آبان

رویاهایی که حتی به ذهن ژول ورن هم خطور نمی‌کرد، حالا به واسطه هوش مصنوعی و یادگیری عمیق یکی یکی در حال پدیدار شدن هستند.

همزمان با تکامل سریع فناوری و در کنار ترس و هیجان ناشی از آن واژگانی مثل هوش مصنوعی، یادگیری عمیق و ماشینی زیاد به گوش می خورند. این موارد شامل کاربردهای گسترده ای است که توسط نیروی انسانی متخصص در کارخانه ها، بیمارستان ها، انبارها، ادارات و منازل انجام می شوند. در ادامه این مطلب مفهوم یادگیری عمیق و کاربردهای آن را توضیح داده ایم.

یادگیری عمیق چیست؟

کلیک کنید

اصطلاح هوش مصنوعی زمانی به کار می رود که یک دستگاه توانایی انجام کارها بدون نیاز به هوش بشری را دارد. زمانی که ماشین قابلیت فراگیری موارد جدید و کسب مهارت از طریق تجربه و بدون دخالت کاربر را داشته باشد، از عبارت یادگیری ماشین استفاده می شود. یادگیری عمیق نیز زیر مجموعه ای از همین فناوری است که در آن شبکه های عصبی مصنوعی و الگوریتم های مشابه مغز بشر از مجموعه های عظیم داده مهارت های مورد نظر را فرا می گیرند. در یادگیری عمیق بر خلاف یادگیری ماشین مساله به قسمت های کوچکتر تقسیم نشده و به صورت کامل حل می شود.

همانطور که ما از طریق تجربه چیزهای جدید یاد می گیریم، الگوریتم یادگیری عمیق نیز با هر بار تکرار یک کار، مهارت خود را نسبت به دفعات قبلی بهبود می بخشد. دلیل استفاده از عبارت یادگیری عمیق این است که شبکه های عصبی لایه های مختلف یا عمیقی دارند که یادگیری را ممکن می سازد.

همانطور که گفتیم در یادگیری عمیق از داده ها برای آموزش الگوریتم استفاده می شود و یکی از دلایل بهبود این قابلیت در سال های اخیر افزایش میزان داده تولیدی است. حجم این داده به لطف گسترش شبکه اینترنت و ابزارها و پلتفرم های ارتباطی هر روزه در حال افزایش است و اخیرا به ۲.۶ کوینتیلیون (۱۰به توان ۱۸) بایت در روز رسیده است.

یادگیری عمیق علاوه بر داده های بیشتر از افزایش قدرت سخت افزارها و توان محسابتی نیز بهره می برد چرا که امکان حل مسائل پیچیده و دشوار در زمانی کوتاه ممکن شده است. این الگوریتم ها حالا می توانند مسائل پیچیده را حتی با استفاده از مجموعه داده های متنوع، غیرساختارمند و به هم پیوسته حل کنند.

در ادامه به بررسی کاربردهای یادگیری عمیق پرداخته ایم.

۱. دستیار مجازی

دستیارهای هوشمندی نظیر کورتانا، سیری و الکسا از غول های فناوری دنیا برای درک بهتر سخنان و دستورات حین تعامل با کاربر از الگوریتم های یادگیری عمیق بهره می برند.

۲. ترجمه

ترجمه همزمان صوتی یکی دیگر از کاربردهای قابل توجه الگوریتم های مورد بحث است که در سال های اخیر رشد گسترده ای یافته و به مسافران، توریست ها، صاحبان کسب و کار و دولتمردان در درک سخنان افراد خارجی کمک بسیاری می کند. یکی از نمونه های خاص در این زمینه اپلیکیشن ترجمه گوگل است که قابلیت برگردان متون درون تصویر را هم دارد. مدیر واحد یادگیری عمیق گوگل دو سال پیش مدعی شد که در 10 سال آینده هدفون ها هر زبانی را ترجمه خواهند کرد.

۳. پهپادها و ماشین های خودران

قابلیت مشاهده محیط اطراف توسط ماشین ها یا پهپادهای خودران، تشخیص موارد مختلف از قبیل علامت توقف، شی، موجود زنده یا ماشین های دیگر و انجام واکنش مناسب همه و همه مدیون الگوریتم های یادگیری عمیق است.

هرچه میزان داده های تزریق شده به الگوریتم بیشتر باشد، واکنش ها بیشتر انسانی شده و حتی قابلیت تشخیص علامت توقف پنهان شده زیر برف را نیز خواهند داشت. 

۴. رباتیک

امروزه صنعت رباتیک به صورت گسترده ای به یادگیری عمیق روی آورده است. یکی از کمپانی های شاخص در این زمینه بوستون داینامیکس و دو ربات معروف آن، اسپات مینی و اطلس هستند. این ربات ها در برابر نیروهای وارده از اطراف مقاومت کرده و پس از سقوط از زمین بلند می شوند. ربات های این شرکت کارهای نیازمند دقت و تشخیص محیط اطراف نظیر پشت سر گذاشتن موانع و باز کردن در را نیز به راحتی صورت می دهند.

۵. بات های خدماتی و چت

کمپانی های بسیاری در سراسر دنیا از بات های ویژه چت برای ارائه پاسخ های هوشمند به سیل درخواست های مشتریان استفاده می کنند که به صرفه جویی بسیاری در زمان و هزینه منجر می شود. در این نرم افزارها ابتدا امکان پاسخ دهی به درخواست مشتری توسط یک شبکه عصبی مصنوعی ساده بررسی شده و در صورتی که این کار میسر باشد یک شبکه عصبی بازگشتی ژرف پاسخ مناسب را ارائه می کند.

۶. تشخیص چهره

استفاده از هوش مصنوعی و به صورت ویژه یادگیری عمیق برای تشخیص چهره افراد کاربردهای بسیاری از زمینه های امنیتی و بازکردن قفل موبایل گرفته تا تگ کردن خودکار افراد حاضر در تصویر دارد و حالا شرکت ها به دنبال استفاده از این قابلیت برای خرید بدون نیاز به کارت اعتباری هستند. چالش های اصلی این زمینه شامل شناسایی افراد حتی در صورت ایجاد تغییراتی مثل بلند یا کوتاه کردن مو و ریش و بی کیفیت بودن تصویر است.

دولت چین مدعی شده که در سال گذشته صدها مجرم  را به لطف همین فناوری حین تردد در خیابان ها شناسایی و دستگیر کرده است

۷. رنگی کردن تصاویر و ویدیوهای سیاه و سفید

تبدیل تصاویر و کلیپ های قدیمی سیاه و سفید به رنگی کاری زمانبر است که توسط افراد متخصص و با صرف ساعت ها زمان صورت می گرفت، حالا اما الگوریتم های یادگیری عمیق با بررسی زمینه و اشیاء حاضر در یک عکس و تطبیق آن با تجارب قبلی به شکلی فوق العاده آنها را رنگ می کنند.

۸. پزشکی و داروسازی

از تشخیص بیماری و تومور گرفته تا تولید و تجویز داروی سفارشی بر اساس یک ژنوم خاص، یادگیری عمیق توجه بسیاری از شرکت های عظیم داروسازی و پزشکی مثل غول داروسازی انگلیسی «GlaxoSmithKline» را به خود جلب کرده است. این الگوریتم ها حتی توانایی پیش بینی احتمال مرگ بیماران را نیز دارند.

۹. ارائه پیشنهادات شخصی

تاکنون فکر کرده اید چگونه شبکه های تلویزیونی اینترنتی یا فروشگاه های تحت وب پیشنهاداتی را دقیقا بر اساس علایق و سلایق شما ارائه می کنند تا حدی که انگار از تفکرات شما باخبرند؟ بله، پشت این پیشنهادات الگوریتم های یادگیری عمیق پنهان شده اند.

۱۰. تولید خودکار مقالات ویکی پدیا، ریاضی، کدهای کامپیوتری

سیستم ها پس از فراگیری نشانه گذاری، گرامر و سبک یک قطعه متن بر اساس آن متن کاملا جدیدی را با همان سبک و سیاق تولید می کنند. این متن می تواند هر چیزی از مقالات ویکی پدیا گرفته تا آثار شکسپیر باشد.

۱۱. توصیف عکس

برچسب گذاری تصاویر و تشخیص افراد و اشیاء آن تنها بخشی از قابلیت های الگوریتم های مورد بحث است و در گام بعد نوبت به توصیف عناصر مختلف و حالت های آنها می رسد. Li Fei-Fei الگوریتمی را توسعه داده که امکان تشخیص یک دوجین ناحیه مختلف از یک تصویر خاص و نوشتن جملاتی درباره آنها را دارد. در تصویر زیر توصیف یک انسان و دو مدل مختلف از تصویر را می بینید.

۱۲. لب خوانی

لب خوانی مهارتی دشوار و پیچیده است و به صورت میانگین شخص عادی با نگاه به چهره دیگران، می تواند از هر ۱۰ واژه یکی را به درستی حدس بزند. این فرایند از تشخیص سخنان محرمانه دیپلمات ها در نشست های سیاسی تا سخنان یک بازیکن فوتبال در برنامه هایی مثل نود کاربرد دارد.

محققین دانشگاه آکسفورد با بکارگیری روش یادگیری عمیق را در لب خوانی نرم افزاری به نام LipNet را توسعه داده اند که در شرایط آزمایشگاهی با دقت ۹۳.۴ درصدی لغات را لب خوانی می کند و این در حالی است که متخصصین اینکار در شرایطی مشابه حداکثر ۵۲.۳ درصد واژه ها را به درستی شناسایی کردند.

۱۳. رتبه بندی صفحات وب

یکی از مهمترین ابزارهای قدرت گوگل، موتور جستجوی کارآمد آن است که درآمد، شهرت و محبوبیت چشمگیری را برای این شرکت به ارمغان آورده است. گوگل برای ارائه بهترین و مرتبط ترین پاسخ به جستجوی کاربران از ۱۰۰ معیار مختلف بهره می برد که ماهیت دقیق آنها تا کنون یک راز سر به مهر باقی مانده اما در بین این موارد الگوریتم های هوشمندی از قبیل RankBrain، Fred، Penguin و Panda وجود دارند. عملکرد الگوریتم یادگیری عمیق RankBrain به این صورت است که کلمات را به موجودیت های ریاضی تبدیل می کند و سپس موتور جستجوی گوگل از آنها برای یافتن کلمات یا عبارات مشابه بهره می گیرد.

۱۴. ترمیم تصاویر

این قابلیت یادگیری عمیق نیز در زمینه های مختلف امنیتی، شناسایی مجرمان یا افزایش کیفیت یک تصویر خانوادی کاربرد دارد. سیستم هایی نظیر EnhanceNet از تیم تحت هدایت دکتر «مهدی سجادی» یا تیم مشترک انویدیا، MIT و دانشگاه آلتو تنها با استفاده از داده های ناقص یا دو تصویر غیر واضح به افزایش کیفیت تصاویر می پردازد. این سیستم ها نحوه بازیابی تصاویر دارای نویز را از طریق کنار هم قرار دادن تصاویر، متون یا ویدیوها را فرا می گیرد.

۱۵. پیش بینی زمین لرزه

متخصصان گوگل و هاروارد از طریق آموزش شبکه عصبی روشی را برای پیش بینی مکان وقوع پس لرزه ها ابداع کرده اند. به گفته این تیم تحقیقاتی شبکه عصبی توانسته نسبت به روش های معمولی نظیر «تغییر تنش شکست کولمب» به نتایج بسیار بهتری دست یابد. اگر برای تعیین دقت این پیش بینی ها امتیازی بین صفر تا یک در نظر بگیریم، امتیاز روش کولمب برابر ۰.۵۸۳ بوده در حالی که شبکه عصبی موفق به کسب امتیاز ۰.۸۴۹ شده که به مراتب بهتر است.

۱۶. توسعه تصویر

الگوریتم ها با تجزیه و تحلیل تصویر قابلیت افزایش عرض یا طول از طریق اضافه کردن جزییات ساختگی به آن را دارند. الگوریتم های دیگری نیز به شکل مشابه امکان بازسازی بخش های حذف شده از تصاویر را دارند.

۱۷. تولید تصاویر ساختگی

الگوریتم های هوش مصنوعی می توانند تصاویر جدیدی را از چهره افراد اشیاء و مناظری که هرگز وجود نداشته اند تولید کنند که در زمینه های گرافیک، بازی سازی و تولید فیلم کاربرد دارند.

۱۸. گیم

یادگیری عمیق علاوه بر تولید محتوا می تواند بازیکنان واقعی را هم به چالش بکشد. تا کنون الگوریتم هایی برای رقابت با گیمرها در بازی هایی مثل دوتا ۲، Space Invaders, Doom, Pong, Gathering و غیره توسعه یافته است.

۱۹. کشاورزی

کمپانی Atomwise با استفاده از الگوریتم های مورد بحث مولکول هایی را شناسایی می کند که از گیاهان در مقابل بیماری ها و آفات محافظت می کنند. مزیت اصلی این روش در شناسایی سریع مولکول ها و افزایش سرعت تولید آفت کش ها و سموم مناسب است که منجر به یک صرفه جویی عظیم در زمان و هزینه می شود.

۲۰. ویدیوهای تقلبی

یکی از دردسرساز ترین کاربردهای هوش مصنوعی تولید ویدیوهای تقلبی است که در آن تصویر و صدای فردی مثل ترامپ با حالت چهره و لحن صدای اوباما جایگزین می شود. این کاربرد می تواند روی دیدگاه مردم به یک فرد خاص و حتی نتایج انتخابات اثر گذار باشد. اخیرا آژانس پروژه‌های تحقیقاتی پیشرفتهٔ دفاعی (DARPA) برای مقابله با اقداماتی از این دست پروژه MediFor راه اندازی کرده که جزئیات دقیقی را از چگونگی و میزان تحریف محتوا ارائه می کند.

۲۱. تولید خودکار صدا

شبکه های یادگیری عمیق نظیر «ویونت» گوگل یا «دیپ اسپیچ» کمپانی بایدو با تکیه بر هوش مصنوعی توانایی تولید خودکار صوت را دارند. این سیستم ها توانایی تقلید صدای انسان و بهبود مهارتشان را دارند تا حدی که تمایز صدای آنها از انسان برای مخاطب دشوار است. دو محقق به نام های Merlijn Blaauw و Jordi Bonada سیستمی را توسعه داده اند که حتی قابلیت خوانندگی را هم دارد.

۲۲. آهنگسازی

با تزریق شاهکارهای هنرمندانی مثل بتهوون، موتزارت و شوبرت به هوش مصنوعی می توان آهنگ هایی با همان سبک و سایق را تحویل گرفت.

۲۳. نقاشی

هوش مصنوعی مایکروسافت می تواند به راحتی از روی توصیفات متنی به ترسیم نقاشی بپردازد. علاوه بر این با ارائه چندین مثال از آثار هنرمندان واقعی می توان نقاشی های قابل قبولی را از هوش مصنوعی تحویل گرفت و اخیرا یک نمونه از همین آثار در یک حراجی با قیمت باورنکردنی ۴۳۲ هزار دلاری به فروش رسید.