سیری اقتباس این شرکت از نرمافزار مستقلی خریداری شده بود که گروه توسعه دهنده آن را در سال 2010 میلادی ساخت. بررسیهای اولیه جذاب بودند، اما بعد از گذشت مدتی، کاربران از کاستیهای آن دلزده شدند. اغلب، دستورات را به اشتباه تفسیر میکرد و حتی ترفندهای ارائهشده نیز بهدرستی کار نمیکردند. در نتیجه اپل فناوری تشخیص صدای سیری را برای کاربران ایالات متحده در اواخر جولای به یک سامانه عصبیمحور منتقل کرد و در تاریخ 15 آگوست 2014 این کار را برای تمامی کاربران سراسر جهان انجام داد. با وجود این، تعدادی از ترفندهای عملیاتی سابق همچنان حفظ شدند تا این فناوری بتواند در مقایسه با سایر رقبا جایگاه خود را حفظ کند. این سامانه از اهرمهای تکنیک یادگیری ماشینی، شبکههای عصبی عمیق (DNN)، شبکههای عصبی کانولوشن، واحد حافظه کوتاهمدت، شبکه عصبی راجعه (Recurrent Neural Network) و مدل n-grams استفاده میکند. زمانیکه کاربران به نسخههای جدید مهاجرت میکردند، در نگاه اول سیری را همانند گذشته میدیدند، در حالی که یادگیری عمیق آن کاملاً تغییر پیدا کرده بود. برای مثال، تکنیکهای ادراکی آن همانند رقبایش پیشرفت کرده بود، اما اپل تمایلی نداشت همانند رقبای خود درباره این ویژگیهای جدید اطلاعرسانی کند. کاربران تنها زمانی که خطاهای کمتری دریافت میکردند، متوجه این تغییرات میشدند. اپل در این باره گفته است: «نتایج بهبود پیدا کردهاند و با دقت و صحت خیرهکنندهای ارائه میشوند.» ادی کیو، معاون بخش نرمافزارها و سرویس اینترنتی اپل عنوان کرده است: «بهبود نتایج ارائهشده از جمله اهدافی بود که بهطرز قابل توجهی به سرانجام رسید. کافی است یکبار دیگر آن را آزمایش کنید تا شاهد درستی آن باشید.» این داستان تحول سیری است؛ داستانی که برای اولینبار آن را در این مقاله خواهید خواند و به شما نشان خواهد داد این نرمافزار در بسیاری از حوزههای هوش مصنوعی از رقبای خود بالاتر است؛ نه فقط به این دلیل که شبکههای عصبی این سامانه بهبود پیدا کردهاند، بلکه به این دلیل که اپل در سکوت و به شکل ماهرانهای این کار را انجام داد.
تا چندی پیش، هنگامیکه اپل افرادی را در حوزه هوش مصنوعی استخدام و زیرساختهایی را برای این منظور آماده میکرد، در تلاش بود نمایهای از متخصصان ردهبالا و ناظرانی که از اپل بازدید کردهاند، ایجاد کند تا رقابت داغی در این صنعت به وجود آورد؛ رقابتی که در آن از ابزارهای قدرتمند هوش مصنوعی به بهترین شکل استفاده میشود. با وجود این، اپل همواره کمتر درباره آنچه اتفاق میافتد، صحبت میکند. بیشتر کارهای این شرکت پشت درهای بسته انجام میشود و متخصصان خبره هوش مصنوعی دقیقاً نمیدانند اپل در حوزه یادگیری ماشینی چه چیزی ساخته است. جری کاپلان، مدرس تاریخچه هوش مصنوعی در استنفورد، گفته است: «اپل همانند NSA در دنیای هوش مصنوعی است و گویی بخشی از جامعه نیست. اما اطلاعات بهدستآمده نشان میدهد تلاشهای اپل به همان اندازهای که گوگل یا فیسبوک در این زمینه تلاش کردهاند، قابل توجه بوده است، با وجود این، مردم بیشتر درباره مایکروسافت، گوگل و فیسبوک میشنوند.» اورن اتزیونی از مؤسسه Allen که در زمینه هوش مصنوعی فعالیت میکند، در این باره گفته است: «گوگل، فیسبوک و مایکروسافت افراد برجستهای در زمینه یادگیری ماشین در اختیار دارند. اپل نیز تعدادی از این کارشناسان را استخدام کرده است. اما پنج انسان برتر متخصص در حوزه هوش مصنوعی که اپل آنها را استخدام کرده است، چه افرادی هستند؟ اپل فناوری تشخیص گفتار را در اختیار دارد، با این حال بهدرستی مشخص نیست قابلیت یادگیری ماشین در چه بخشهایی به آنها کمک میکند. محصولی را که از یادگیری ماشین استفاده میکند، به من نشان دهید.»
اوایل ماه جاری میلادی، اپل نشان داد که از یادگیری ماشین در اکثر محصولات این شرکت استفاده میکند. استیون لوی، نویسنده سایت backchannel موفق شد در اتاق هئیتمدیره این شرکت واقع در کوپرتینو با مدیران ارشد اپل یعنی ادی کیو، مدیر سرویسهای اینترنتی اپل، فیل شیلر، مسئول ارشد بازاریابی جهانی، کریک فدریگی، معاون ارشد بخش مهندسی نرمافزار و دو دانشمند کلیدی بخش مهندسی نرمافزار سیری درباره فعالیتهای اصلی و مرکزی این شرکت در حوزه هوش مصنوعی و یادگیری ماشینی مصاحبهای انجام دهد. او در این خصوص گفته است: «زمانیکه آنجا بودم، دو صفحه مملو از اطلاعات روز دنیای فناوری در خصوص یادگیری ماشینی و نحوه بهکارگیری آن در سرویسها و محصولات اپل را در اختیار من قرار دادند.»
در حالی که شرکتهای بزرگ فناوری دانشمندان برجسته و ستاره خود را تشویق میکنند تا بهطور گسترده تحقیقات خود را با جهان خارج به اشتراک بگذارند، دانشمندان اپل با محدودیتهای بسیاری در زمینه فاش کردن دستاوردهای خود روبهرو هستند
اگر از کاربران آیفون هستید، از مدتها قبل هوش مصنوعی را که اپل طراحی کرده است، استفاده و مشاهده کردهاید. سیری در زمینه درک مطلبی که به او میگویید، باهوشتر شده است و به احتمال زیاد با واکنشهای هوشمندانه آن نیز تعامل برقرار کردهاید. تیزهوشی سیری را در این مواقع بهتر درک میکنید: کسی با شما تماس میگیرد و در حالی که در فهرست مخاطبان شما قرار ندارد، هویتش برایتان آشکار میشود، چراکه بهتازگی ایمیلی از وی برایتان ارسال شده است، با دست صفحه را میکشید تا به فهرست کوتاهی از برنامهها دست پیدا کنید و به احتمال زیاد برنامهای به شما نشان داده خواهد شد که دوست دارید از آن استفاده کنید، یادآوری قرار ملاقاتها را که هیچگاه در تقویم خود ثبت نکردهاید، دریافت میکنید، پیغامی روی نقشه ظاهر میشود و پیش از آنکه به سراغ نقشه بروید، مکانی که هتل خود را رزرو کردهاید روی نقشه به نمایش درمیآید، گوشی شما در حالی که از آن سؤالی نکردهاید، اشاره میکند در چه مکانی باید ماشین خود را پارک کنید. تمامی این نشانهها اعلام میکنند که یادگیری ماشینی به بهترین شکل ممکن در حال خدمترسانی به کاربران است. قابلیتهایی که به آنها اشاره شد، تنها با استفاده از یادگیری عمیق یا شبکههای عصبی بهبود پیدا کرده یا ساخته شدهاند. بدون آنکه اطلاع داشته باشید، ابزار شما به یک مغز اپلی تجهیز شده است؛ مغزی که از مدتها پیش درون آیفون شما قرار گرفته است.
اگر به محصولات و سرویسهای اپل نگاه دقیق و زیربینانهای بیندازید، مشاهده میکنید یادگیری ماشینی در تمامی آنها قرار دارد. اپل از یادگیری عمیق برای شناسایی موارد مشکوک و تقلبی در فروشگاه خود استفاده میکند و برای افزایش طول عمر باطری در هر بار شارژ دستگاههای مختلف از آن بهره میبرد. یادگیری ماشینی به اپل کمک میکند مفیدترین بازخوردها را از میان هزاران گزارش که آزمایشکنندگان بتا برای این شرکت ارسال میکنند، استخراج کند. یادگیری ماشینی به اپل یاری میرساند داستانهای جدیدی را برای شما انتخاب کند. یادگیری ماشینی مشخص میکند آیا کاربران ساعت اپل در حال ورزش کردن هستند یا در حال گردش و پیادهروی. میتواند چهرهها و مکانهایی را که درون تصاویر قرار دارند، شناسایی کند. یادگیری ماشینی کشف میکند که بهتر است یک سیگنال وایفای ضعیف را کنار بگذارید و به شبکه سلولی روی آورید یا وضعیت فعلی خود را حفظ کنید. حتی اطلاع دارد کدامیک از فیلمسازان در کار خود قوی هستند و به اپل اجازه میدهد در سریعترین زمان ممکن خلاصه تصویر و ویدیویی را در قالب مینیفیلم و تنها با لمس یک دکمه، در اختیار شما قرار دهد. رقبای اپل نیز کارهایی مشابه با مواردی را که به آنها اشاره شد، انجام میدهند، اما به گفته مدیران اجرایی اپل هیچیک از آنها قدرت هوش مصنوعی را در حالی که از حریم خصوصی شما محافظت میکند، به شیوه اپل در اختیار کاربرانشان قرار نمیدهند.
"جدیدترین خرید اپل استارتآپ turi بود؛ شرکتی مستقر در سیاتل که اپل به ارزش 200 میلیون دلار آن را خریداری کرد. این شرکت یک بسته یادگیری ماشینی شبیه به تانسورفلو گوگل ساخته است"
هوش مصنوعی فناوری تازهواردی به دنیای اپل نیست. اوایل دهه 90 میلادی این شرکت از تکنیکهای یادگیری ماشینی برای تشخیص دستخط در محصولاتش استفاده کرد. نیوتن را به خاطر میآورید؟ باقیمانده آن تلاشها هنوز هم در محصولات امروزی این شرکت بهمنظور تبدیل دستخط ناخوانای متعلق به کاراکترهای چینی به متن یا تشخیص ورودی حروف که توسط یک کاربر ساعت اپلواچ وارد شده است، برای ساخت پیام پیشرفتهای که روی ساعت نمایش داده میشود، به کار میرود. هر دو این ویژگیها را گروهی از مهندسان یادگیری ماشینی طراحی کردهاند. البته در روزهای اولیه، یادگیری ماشینی بدویتر ویادگیری عمیق، واژه عجیبی بود. امروزه فناوریهای هوش مصنوعی همگی به شکل افراطی استفاده میشوند، اما اپل در خصوص مفهوم یادگیری کمی عقب است. در هفتههای اخیر، تیم کوک، مدیرعامل اپل، متذکر شد که این شرکت در حال کار روی این موضوع است و به دنبال آن مدیران ارشد اپل به دقت این موضوع را تشریح کردند. فیل شیلر گفته است: «ما از پنج سال گذشته شاهد رشد این مفهوم درون اپل بودهایم. دستگاههای ما به سرعت و با دقت زیادی در حال باهوشتر شدن هستند؛ بهویژه تراشههای سری A که اپل آنها را طراحی کرده است. بخشهایی که در پسزمینه قرار دارند، به شدت در حال سریعتر و دقیقتر شدن هستند. همین موضوع نیاز به تکنیکهای یادگیری ماشینی را بیشتر و بیشتر میکند، به همین دلیل نیاز داریم کارکنان خود را بیش از پیش آموزش دهیم.» روشنفکران کوپرتینو بر این باورند که یادگیری عمیق و ML تنها راهکارهایی هستند که همچنان آنها را در دنیای فناوری پیشگام نگه میدارند. این یک تحول است، اما به این معنا نیست که اپل از پیشرفتهای دیگری که در حوزههای مختلف همچون صفحه نمایشهای لمسی، پانلهای مسطح یا برنامهنویسی شیگرا به وجود آمده است، چشمپوشی کند. به اعتقاد اپل، یادگیری ماشینی پایانی ندارد، در حالیکه شرکتهای دیگر نظر متفاوتی دارند. ادی کیو در این خصوص گفته است: «در طول این سالها، فناوری قدرتمندی شبیه به یادگیری عمیق در اختیار نداشتیم که بتواند تغییری در روش تعامل ما با دستگاههای دیگر به وجود آورد. هیچ کارمندی در اپل دوست ندارد درباره این موضوع به گمانهزنی بپردازد که صحبت درباره هوش مصنوعی به معنای تغییرناپذیری است. اپل تأیید نمیکند که این فناوری در حوزه ماشینهای خودران بهخوبی جواب میدهد یا خیر. با وجود این، گروههای مستقر در اپل این موضوع را روشن کردهاند که اپل در حال کار روی یک شبکه آسمانی (skynet) نیست. ما از این فناوریها برای پیشبرد اهدافی استفاده میکنیم که همیشه در نظر داشتیم به آنها برسیم و دوست داریم این کار را بهتر از قبل انجام دهیم. اما در خصوص محصولات جدید به دلیل وجود چالشهای خاصی، نمیتوانیم این کار را انجام دهیم. این فناوری همانند پلی است که راه را برای انجام بسیاری از کارها برای اپل هموار خواهد ساخت و در نهایت باعث تکامل محصولات ما خواهد شد.»
اپل از مدتها قبل شبکههای عصبی را برای سرویسدهی به سیری به کار گرفته است. این شبکهها بر مبنای دادههایی که کاربران ارائه میکنند، میتوانند آموزشهای کلیدی را دریافت کنند
هوش مصنوعی به شکلی تجربی نشان داده که تا چه اندازه در شکلدهی اکوسیستم اپل نقش داشته است. اپل به دو دلیل استقرار هوش مصنوعی در این شرکت را انجام میدهد: اول آنکه این شرکت به دلیل نبود موتور جستوجوگری که بتواند بهطور بالقوه دادههای مورد نیاز برای آموزش شبکههای عصبی را در اختیار این شرکت قرار دهد، به استقرار هوش مصنوعی روی آورده است و دوم آنکه این شرکت بهشدت بر انعطافپذیری محافظت از اطلاعات کاربران خود تأکید دارد. شواهد نشان میدهند این شرکت بهخوبی توانسته است این دو چالش را مدیریت کند. اما سؤال این است که چطور حافظه نهان پویا میتواند یادگیری ماشینی را روی آیفون فعال کند؟ زمانیکه استیون لوی این سوال را از اپل کرد، اپل تا حدودی غافلگیر شد. این مغز در حدود 200 مگابایت اطلاعات را بسته به اینکه شما چه مقدار اطلاعات شخصی ذخیره کرده باشید، آماده میکند. (دادههای قدیمی همیشه پاک میشوند.) این اطلاعات شامل برنامههای مصرفی، تعامل با دیگران، پردازش شبکه عصبی، مدلسازی گفتار و مدلسازی رویدادهای زبان طبیعی است. همچنین دادههایی را که شبکه عصبی بهمنظور تشخیص چهره، طبقهبندی تصاویر و تشخیص قدرتمند اشیا استفاده میکند نیز در اختیار دارد. آنگونه که اپل ادعا کرده است، تمامی این اطلاعات و فرایندها بر مبنای تنظیمات کاربری و پیشبینیها به شکل کاملاً خصوصی پردازش میشوند. البته اپل به تمامی نکات و فعالیتهایی که توسط هوش مصنوعی این شرکت مدیریت میشوند، اشارهای نکرد، اما استیون لوی موفق شد درباره نحوه توزیع و استقرار یادگیری ماشینی در این شرکت اطلاعاتی به دست آورد. قابلیتهای یادگیری ماشینی اپل در کل این شرکت به اشتراک گذاشته شده است. این به اشتراکگذاری باعث دلگرمی گروههای تولیدکننده محصولات شده است. آنها با استفاده از یادگیری ماشینی میتوانند مشکلات را حل کرده و ویژگیهای منحصربهفردی را به محصولات خود اضافه کنند. کریگ فدریکی در این خصوص گفته است: «شیوه کار ما این است که به جای پیادهسازی یک سازماندهی متمرکز در خصوص ML، سعی میکنیم این فناوری را به طور خاص در اختیار گروههایی قرار دهیم که به آن نیاز دارند و در نظر دارند تجربه کاربری موفقی را بر مبنای آن در محصولات خود قرار دهند.»
چه تعداد از کارمندان اپل روی یادگیری ماشینی کار میکنند؟
فدریکی در پاسخ به این پرسش گفته است: «تعداد بسیار زیادی. نکته جالب توجهی درباره یادگیری ماشینی اپل که کارمندان این شرکت ساختهاند، وجود دارد. این افراد تا پیش از آنکه به اپل ملحق شوند، هیچگونه آموزش اختصاصی در این زمینه ندیده بودند. ما افرادی را استخدام کردیم که در حوزههای اساسی همچون ریاضیات، آمار، زبانهای برنامهنویسی و رمزنگاری بسیار خبره بودند. به نظر میرسد تعداد زیادی از این استعدادهای زیربنایی کلیدی اپل توانستهاند بهطرز بسیار زیبایی تواناییهای خود را در یادگیری ماشینی به نمایش بگذارند. امروزه تنها افرادی را استخدام میکنیم که در حوزه یادگیری ماشینی متبحر هستند، با وجود این به دنبال استعدادهایی که در این زمینه ظرفیت زیادی دارند نیز هستیم.»
میل شدید اپل به پنهانکاری باعث شده است این شرکت در مقابل رقبای خود ضعف داشته باشد. در حالی که شرکتهای بزرگ فناوری دانشمندان برجسته و ستاره خود را تشویق میکنند تا بهطور گسترده تحقیقات خود را با جهان خارج به اشتراک بگذارند، دانشمندان اپل با محدودیتهای بسیاری در زمینه فاش کردن دستاوردهای خود روبهرو هستند. فدریکی در این باره گفته است: «ما به دنبال افرادی هستیم که بهطور طبیعی در کار خود تعصب دارند و علاقهمند هستند در قالب گروه، بهمنظور ارائه یک محصول بزرگ کار کنند، نه افرادی که هدف اولیه آنها انتشار مقالات است.» اگر اتخاذ این سیاست باعث شود تا محصولاتی که دانشمندان شرکت اپل طراحی کردهاند، در این حوزه بهبود پیدا کند و پیشرفت داشته باشد، میتوان گفت اپل از یک الگوی مدیریتی بسیار عالی استفاده کرده است. کیو عنوان کرده است: «در یک سال گذشته بین 20 تا 30 شرکت نسبتاً کوچک را خریدیم. ما استعدادهای بزرگ را استخدام میکنیم.» زمانیکه اپل یک شرکت هوش مصنوعی را خریداری میکند، چیزی در این باره نمیگوید. فدریکی گفته است: «با هر خریدی که اپل انجام میدهد، گلچینی از بهترین و درخشانترین پژوهشگران هوش مصنوعی را جذب میکند. ما به دنبال افرادی هستیم که بااستعداد باشند، اما در عین حال تمرکز اصلیشان بر ارائه تجارب ارزشمندی که در اختیار دارند، استوار باشد.» جدیدترین خرید اپل استارتآپ turi بود؛ شرکتی مستقر در سیاتل که اپل به ارزش 200 میلیون دلار آن را خریداری کرد. این شرکت یک بسته یادگیری ماشینی شبیه به تانسورفلو گوگل ساخته است. گمانیزنیهای کارشناسان اعلام میکند که اپل در نظر دارد از این بسته برای اهداف مشابه داخلی و خارجی (توسعهدهندگان) استفاده کند. مدیران اجرایی اپل این دیدگاه را تأیید یا رد نکردهاند. کیو در این باره گفته است: «آنها در این حوزه دستاوردهای خوبی به دست آوردهاند که هم به لحاظ فنی و هم به لحاظ نظرات مردمی، همسو با اهداف اپل است.» مهم نیست یک استعداد از کجا میآید، زیرساخت هوش مصنوعی اپل به این استعدادها اجازه میدهد محصولات و ویژگیهایی را که تا پیش از این وجود نداشته است، طراحی کنند. شیلر گفته است: «در اپل هیچ پایانی بر فهرست ایدههای واقعاً ناب وجود ندارد. یادگیری ماشینی ما را توانا ساخته است تا به بعضی ایدهها جواب مثبت دهیم. در حالی که در سالهای قبل گفتن این حرف امکانپذیر نبود. این نگرش به صورت درونسازمانی بر روند تصمیمگیری درباره محصولاتی که در نظر داریم در آینده آنها را تولید کنیم، تأثیرگذار است.»
یک مثال در همین خصوص Apple Pencil است که با iPadPro کار میکند. Apple Pencil با هدف طراحی قلمی با فناوری سطح بالا ساخته شد. بررسیهایی که اپل در این راستا انجام داده بود، نشان داد زمانیکه مردم روی یک دستگاه مینویسند، انتهای دست آنها به شکل جداییناپذیری پایین صفحه نمایش را لمس میکند که همین موضوع در درازمدت باعث به وجود آمدن مشکلات دیجیتالی میشود. بهکارگیری یادگیری ماشینی برای ویژگی Palm rejection حسگر صفحه نمایش را قادر میسازد تا تفاوت میان یک لمس شدید و ورودی یک قلم را با درجه دقت بسیار زیاد تشخیص دهد. نوک این قلم ظریف و باریک است و میتواند صفحه نمایش را با دقت نسبتاً زیادی لمس کند. این قلم به فشار و زاویه قرارگیری روی صفحه نمایش حساس است و با افزایش فشار کاربر میتواند خطوطی ضخیمتر و برعکس رسم کند. فدریکی گفته است: «اگر عاشق این قلم هستید، باید از یادگیری ماشینی تشکر ویژهای کنید.»
بهترین راهکاری که برای اندازهگیری پیشرفت یادگیری ماشینی اپل در اختیار داریم، سیری است
ایده اصلی این طرح از یک برنامه نظامی موسوم به CALO که بهمنظور طراحی دستیاران هوشمند ارائه شده بود، نشأت میگیرد. بعدها تعدادی از دانشمندان تصمیم گرفتند شرکتی را پایهگذاری کرده و با استفاده از این فناوری برنامهای کاربردی ایجاد کنند. استیو جابز در سال 2010 بنیانگذاران اپل را متقاعد کرد تا سیری را خریداری کنند و خودش روند ورود دستیار شخصی دیجیتال به درون سیستمعامل این شرکت را کارگردانی کرد. بنیانگذار اپل با نام سیری در زمان خرید شرکت سازنده این فناوری، کاملاً مخالف بود؛ با وجود این، هیچگاه نتوانست نام بهتری برای آن پیدا کند. یونی هایسلر، خبرنگار نتورک ورلد، در مصاحبهای که با داگ کیتلاس، یکی از طراحان سیری انجام داد، اطلاع پیدا کرد که سیری معادل یک واژه نروژی برای زن زیبایی است که شما را به سمت پیروزی هدایت میکند. اپل، در آوریل سال 2010 سیری را به ارزش 200 میلیون دلار خریداری کرد. بر اساس شایعات مطرحشده اپل چنین رقمی را پرداخت کرده است. در اکتبر سال 2011، در جریان رویداد معرفی آیفون 4S این دستیار دیجیتالی همراه با این گوشی در معرض دید همگان قرار گرفت. اکنون این دستیار شخصی به اندازهای پیشرفت کرده است که کاربران با پایین نگهداشتن دکمه خانه یا با گفتن جمله «Hey,Siri» قادر به فراخوانی این دستیار دیجیتالی هستند. جالب آنکه تکنیک Hey,Siri با استفاده از یادگیری ماشینی ساخته شده است و به آیفون اجازه میدهد که آماده به گوش باشد؛ بدون اینکه باعث تخلیه زودهنگام باطری دستگاه شود. چهار مؤلفه اصلی، تشخیص گفتار (درک این موضوع که با دستگاه صحبت میکنید)، درک زبان طبیعی (درک آنچه شما میگوید)، اجرا (اجرای یک محاوره یا درخواست مطرحشده)، پاسخ (صحبت کردن با کاربر) از ارکان اصلی و زیربنایی سیری به شمار میروند. ادی کیو در این خصوص گفته است: «یادگیری ماشینی بهطرز کاملاً محسوسی بر تمامی این چهار مؤلفه تأثیرگذار بوده است.» تام گروبر، مدیر ارشد واحد توسعه پیشرفته سیری میگوید: «اپل از مدتها قبل شبکههای عصبی را برای سرویسدهی به سیری به کار گرفته است. این شبکهها بر مبنای دادههایی که کاربران ارائه میکنند، میتوانند آموزشهای کلیدی را دریافت کنند. استیو در همین راستا به من گفت که یک شبه ره صد ساله را خواهید رفت. در یک شب این برنامه بدون آنکه هیچگونه نسخه بتایی از آن عرضه شود، میلیونها کاربر به دست خواهد آورد. همه این اتفاقات ناگهان به واقعیت پیوست و با حجم بسیار گستردهای از کاربران روبهرو شدید؛ کاربرانی که به شما میگفتند مردم درباره چیزهایی که به آنها نیاز دارند، چگونه صحبت میکنند. این انقلاب اول بود. بعد از آن شبکههای عصبی وارد میدان شدند.»
"استیو جابز در سال 2010 بنیانگذاران اپل را متقاعد کرد تا سیری را خریداری کنند و خودش روند ورود دستیار شخصی دیجیتال به درون سیستمعامل این شرکت را کارگردانی کرد"
انتقال سیری به شبکههای عصبی بهمنظور تشخیص گفتار همراه با ورود چند متخصص طراز اول هوش مصنوعی آغاز شد. آلکس آکرو که سرپرستی گروه تشخیص گفتار را بر عهده دارد، یکی از این افراد بود. آکرو کار خود را در زمینه تشخیص گفتار در شرکت اپل از اوایل دهه 90 میلادی آغاز کرد. پس از آن سالهای بسیاری را در بخش تحقیقات شرکت مایکروسافت سپری کرد. او گفته است: «من عاشق انجام این کارها و نوشتن مقالات متعدد هستم، اما زمانی که سیری بیرون آمد، این ظرفیت حاصل شده بود تا شبکههای عصبی را به واقعیت ملموسی تبدیل کنیم. نه چیزی که صد نفر از مردم درباره آن میخوانند، بلکه دستاوردی که میلیونها نفر از آن استفاده کنند.» در حقیقت او از جمله دانشمندانی بود که اپل به دنبال آنها میگشت؛ فردی که طراحی یک محصول برای او در اولویت بالاتری نسبت به مقالهنویسی قرار داشت. زمانیکه که آکرو به اپل پیوست، این شرکت همچنان در حال دریافت مجوز برای فناوری تشخیص گفتار سیری از سوی یک شرکت ثالث بود. وضعیتی که به دلیل یک تغییر به وجود آمده بود. فدریکی در این خصوص گفته است: «این الگویی است که اپل مدام در حال تکرار آن است. ما در بیشتر موارد به یک بخش مهم از یک فناوری نیاز داریم تا بتوانیم محصول برتر و شاخصی را ارائه کنیم. ما قابلیتها را بهمنظور ارائه تجربیات بهتر به صورت درون شرکتی ایجاد میکنیم. این کار بهمنظور ارائه نوآوریهایی که درون خود مجموعه درست شدهاند، انجام میشود. تشخیص گفتار نمونه قابل توجهی در این زمینه به شمار میرود.»
اپل سرانجام بعد از گذشت سه سال موافقت کرد مبلغ 24.9 میلیون دلار غرامت به مخترعان اصلی سیری پرداخت کند. گروه فرایند آموزش یک شبکه عصبی را بهمنظور جایگزین کردن آن با سیری اصلی آغاز کرد. آکرو در این باره گفته است: «ما بزرگترین و عالیترین کشتزار پردازشگرهای گرافیکی کامپیوتر (GPU) را در اختیار داریم و حجم بسیار زیادی از دادهها را به درون این مجموعه تزریق میکنیم. جولای 2014 ثابت شد که این چرخه کاربردی، فرایند بیهوده و عبثی نبوده است. نرخ خطا از دو عامل به یک عامل در تمامی زبانها کاهش پیدا کرده بود. این پیشرفت عمدتاً به دلیل یادگیری عمیق و راهکاری بود که ما برای بهینهسازی این شبکه از آن استفاده کردیم. نه تنها در خود الگوریتم، بلکه در زمینه طراحی محصول نهایی نیز پیشرفتهای زیادی حاصل شد.»
اپل اولین شرکتی نیست که از شبکههای عمیق عصبی در زمینه تشخیص گفتار بهره میبرد. با این حال، از تراشههایی استفاده میکند که خودش آنها را ساخته است.
آکرو عنوان کرده است: «من این شانس را داشتم تا مستقیماً با گروه طراحی سیلیکون و مهندسانی کار کنم که بهمنظور رسیدن به حداکثر بهرهوری شبکه عصبی، وظیفه نوشتن میانافزار برای دستگاهها را بر عهده داشتند.»
نیازهای گروه سیری حتی بر جنبههای طراحی آیفون نیز تأثیرگذار بود. فدریکی میگوید: «این تنها مختص سیلیکون نیست، بلکه درباره این است که چه تعداد میکروفون را باید در دستگاه قرار دهیم، کجا این میکروفونها را جایگذاری کنیم و چگونه باید سختافزار، میکروفونها و پشته نرمافزاری را تنظیم کنیم که قادر به پردازش صوت باشند. این یک مزیت باورنکردنی در مقایسه با افرادی است که نرمافزاری را تولید میکنند و سپس به انتظار اتفاقاتی که رخ میدهد، میمانند.»
در نهایت
شواهد و اطلاعاتی که از اپل به دست میآید، نشان میدهد که اپل شرکتی پیشرو است و هیچگونه نشانهای از بازگشت به عقب در این شرکت مشاهده نمیشود. شیلر در این باره گفته است: «در حالی که این فناوریها کاملاً روی محصولی که در حال طراحی آن هستید، تأثیر میگذارند، اما در نهایت به این دلیل از این فناوریها استفاده میکنیم که ما را توانا میسازند محصولاتی با کیفیت بهتر تولید کنیم.» شاید اپل هیچگاه تمایلی نداشته باشد درباره آینده یادگیری ماشینی در این شرکت اظهارنظر کند، اما تا حد بسیار زیادی از این فناوری بهمنظور بهبود کیفیت محصولات خود استفاده خواهد کرد. مغزی که درون گوشی شما قرار دارد این موضوع را به اثبات رسانده است. شیلر در این باره گفته است: «مشتریان ما در نظر دارند یادگیری عمیق را به صورت روزانه تجربه کنند و همین موضوع عاملی است که شما را عاشق محصولات اپل میکند. هیجانبرانگیزترین بخش داستان این است که تا وقتی از این فناوری استفاده نکنید، از وجود آن اطلاع پیدا نخواهید کرد. بعد از اطلاع از این موضوع، ناگهان مکث میکنید و از خود میپرسید که این کار چگونه انجام شد و چه اتفاقی رخ داده است؟ در آن زمان شگفتزده خواهید شد که چه ابزاری در دستانتان قرار دارد.»
==============================
شاید به این مقالات هم علاقمند باشید:
ماهنامه شبکه را از کجا تهیه کنیم؟
ماهنامه شبکه را میتوانید از کتابخانههای عمومی سراسر کشور و نیز از دکههای روزنامهفروشی تهیه نمائید.
ثبت اشتراک نسخه کاغذی ماهنامه شبکه
ثبت اشتراک نسخه آنلاین
کتاب الکترونیک +Network راهنمای شبکهها
- برای دانلود تنها کتاب کامل ترجمه فارسی +Network اینجا کلیک کنید.
کتاب الکترونیک دوره مقدماتی آموزش پایتون
- اگر قصد یادگیری برنامهنویسی را دارید ولی هیچ پیشزمینهای ندارید اینجا کلیک کنید.
نظر شما چیست؟