دنیای دوربین شماره ۱۹۲
فریب ماشین‌های بینایی
گوگل ابزاری آنلاین تحت نام Cloud Video Intelligence برای تجزیه و تحلیل تصاویر ویدئویی ارائه کرده است که کاربر با مراجعه به این سایت می‌تواند ویدئویی را انتخاب کند و سامانه، اجزای موجود در ویدئو و نیز اتفاقاتی که در آن رخ می‌دهد را مشخص و به‌صورت متنی توصیف ‌نماید.

 گوگل این ابزار را مانند سایر ای‌پی‌آی‌های خود در اختیار توسعه‌دهندگان نرم‌افزار قرار داده است تا با کمک آن نرم‌افزارهایی برای جست‌وجوی خودکار ویدئوها تولید کنند. چیزی مشابه آنچه موتور جست‌وجوی گوگل برای متن انجام می‌دهد.

مطلب پیشنهادی

تماشا کنید: این پهباد بدون دخالت انسان حرفه‌ای‌ترین تصاویر را ثبت می‌کند

محققان دانشگاه واشینگتن سعی کرده‌اند قابلیت این سامانه را در شرایطی ویژه بررسی کنند. به طوری که آن را به اشتباه بیاندازند تا نتایجی که آن‌ها مایل هستند را به‌عنوان توصیف ویدئو نمایش دهد. آن‌ها به این منظور عکسی را که با محتوای ویدئو تفاوت داشت انتخاب کردند و در لابه‌لای فریم‌های ویدئو قرار دادند، به طوری که هر دو ثانیه یک بار نمایش داده می‌شد. آزمایش یک بار روی ویدئوی اصلی انجام شد (شکل ۱)

شکل 1- ب- توصیفات و برچسب‌هایی که سامانه بعد از وارد کردن عکس یک خودرو بین فریم‌های ویدئوی اصلی بازگردانده است. در واقع، این سامانه بیشتر از محتوای اصلی ویدئو، عکس وارد شده را دیده است.

یک بار هم بعد از جا زدن تصویر بین فریم‌ها. صرف‌ نظر از محتوای ویدئو، برچسب‌های پیشنهادی این سامانه، کاملاً مطابق با عکس‌های وارد شده بین فریم‌ها بود و نه محتوای ویدئو (شکل ۲)، آن هم با درصد اطمینان بسیار بالا. به این ترتیب مشخص شد می‌توان با اندک تغییر در ویدئو، سامانه را طوری فریب داد که برچسب‌های مورد نظر ما را بازگرداند.

شکل 1- الف- توصیفات سامانه براساس ویدئوی اصلی

بنابراین، مهاجم در عمل قادر خواهد بود ویدئو را به‌عنوان یک ویدئوی قانونی جا بزند یا حتی سامانه را فریب دهد تا ویدئوهای مورد نظر او را به‌عنوان نتایج جست‌وجو به کاربران نشان دهد.

 

برچسب: