دنیای دوربین شماره 185
هنر جدید گوگل: ببین و بگو!
اینکه کامپیوتر بتواند تصاویر را با زبانی مشابه زبان محاوره‌ای توصیف کند، هدف بزرگی است که کاربردهای زیادی دارد؛ از کمک به نابینایان تا کاربردهای امنیتی.

«Show and Tell» سامانه‌ای مبتنی بر یادگیری ماشینی است که گوگل آن را توسعه داده است و می‌تواند به طور خودکار شرحی برای عکس‌ها ارائه کند و در حال حاضر به صورت منبع‌باز ارائه شده است. نسخه جدید این سامانه در مقایسه با نسخه‌های پیشین، دقیق‌تر و فرایند آموزش آن نیز سریع‌تر است. Show and Tell برای استفاده با فریم‌ورک یادگیری ماشینی گوگل (TensorFlow) در دسترس است.

مطلب پیشنهادی

صدای هوش گوگل به گوش می‌آید
گوگل در جست‌وجوی آینده

کد به‌کاررفته شامل مدلی بهبودیافته برای بینایی ماشینی است که به سامانه اجازه می‌دهد سوژه‌های مختلفی را در عکس‌ها تشخیص دهد و بر اساس آن بهترین توصیفات را ارائه کند و طوری طراحی شده است که علاوه بر توصیف سوژه‌ها، جزئیاتی نظیر رنگ آن‌ها را نیز توصیف می‌کند. یکی از کاربردهایی که محققان گوگل برای چنین سامانه‌ای در نظر گرفته‌اند، استفاده از آن برای کمک به افرادی است که مشکل بینایی دارند و می‌خواهند صفحات وب را ببینند. فیسبوک نیز روی استفاده از روش‌های بینایی کامپیوتری به‌منظور توصیف تصاویر برای افراد نابینا کار می‌کند.

شرح عکس : 
سمت چپ: توصیفاتی که برای هر عکس به طور دستی و به‌منظور آموزش سامانه وارد شده است.
سمت راست: شرحی که سامانه آموزش‌دیده، بدون دخالت انسان و به صورت خودکار پیشنهاد داده است.

برچسب: