تکاملی دیگر در سامانه‌‌های گفتاری

نرم‌افزار جدید گوگل همانند انسان‌ها صحبت کند!

زمانی که صدایی از درون یک نرم‌افزار یا یک سرویس تحت وب را می‌شنوید، به راحتی این توانایی را دارید تا تشخیص دهید یک انسان در حاصل صحبت کردن با شما است یا یک نرم‌افزار تبدیل متن به گفتار در حال خواندن متنی برای شما است. اما به نظر می‌رسد اکنون زمان آن رسیده است که روبات‌ها کمی شما را غافل‌گیر سازند. به گونه‌ای که تشخیص صدای یک روبات با یک صدای زنده برای شما مشکل باشد. این دستاوردی است که تیم DeepMind گوگل به آن دست پیدا کرده‌اند.

تیم DeepMind در زمینه طراحی شبکه‌های عصبی سابقه خوبی دارد. شاید از این موضوع اطلاع داشته باشید که DeepMind همان شرکتی است که موفق به ساخت آلفاگو شد. برنامه هوش مصنوعی قدرتمندی که برای اولین بار بهترین بازیکن بازی گو جهان را مغلوب خود ساخت. اکنون این تیم در حال کار روی پروژه‌ای است که WaveNet نام دارد.

مطلب پیشنهادی

تعامل یادگیری ماشینی و پردازنده‌ها

گوگل پردازنده‌ای ویژه هوش مصنوعی ساخت

در حال حاضر، توسعه‌دهندگان با استفاده از دو روش متداول برنامه‌های تبدیل متن به گفتار را ایجاد می‌کنند. در روش اول مجموعه بسیار بزرگی از کلمات و بخش‌های گفتاری از سوی یک فرد خوانده می‌شود(Concatenative TTS). در این شیوه تغییر صدا، دستکاری لهجه و لحن صدا به سختی امکان‌پذیر است.

اما در روش دوم کلمات بسته به این‌که آن‌ها چگونه باید صدا دهند به صورت الکترونیکی ساخته می‌شوند(Parametric). در روش دوم تغییر لهجه، آهنگ صدا و حتا لحن گفتار به سادگی امکان‌پذیر است. اما در مقابل صدای تولید شده کاملا مصنوعی و به اصطلاح رایج روباتی است. اما تیم DeepMind برای آن‌که موفق شود یک برنامه تبدیل متن به گفتار را ایجاد کند، به‌طوری که صدای نهایی همانند صدای یک انسان به نظر برسد، شکلی از امواج صوتی خام ضبط شده از گفتار انسانی را در قالب داده‌هایی به عنوان خوراک ورودی به شبکه عصبی خود وارد کرد.

مطلب پیشنهادی

فیس‌بوک، گوگل و مایکروسافت در برابر هم

رقابت هوش مصنوعی بزرگان در زمین بازی Go

شکل امواج (waveforms) بازنمایی بصری از اشکالی است که اصوات به خود می‌گیرند. درست به همان شکلی که این امواج در دستگاه‌های پخش‌کننده موسیقی بالا و پایین می‌روند. waveNet بر مبنای همین قاعده و بر اساس امواج صوتی منحصر به فرد کار می‌کند. اگر WaveNet در قالب یک برنامه تبدیل متن به گفتار مورد استفاده قرار گیرد، قادر است متنی که شما تایپ کرده‌اید را داخل مجموعه‌ای از واج‌ها و هجاها تبدیل کرده و در ادامه آن‌را برای شما بخواند. افرادی که در آزمایش WaveNet شرکت داشته‌اند، بر این باور هستند که سامانه جدید بهتر از نمونه‌های مشابه قادر است همانند انسان‌ها حرف بزند. DeepMind در خصوص این برنامه گفته است: «بر اساس آزمایش‌هایی که بر مبنای زبان ماندارین چینی و انگلیسی انجام شده، این برنامه به میزان 50 درصد موفق شده است، شکاف موجود میان عملکرد انسانی و هنر صحبت کردن به شکل انسانی را پر کند.»

لازم به توضیح است که در آینده نزدیک این برنامه هوش مصنوعی در دنیای موسیقی نیز وارد خواهد شد. این تیم یکسری قطعات موسیقی کلاسیک پیانو را در اختیار این شبکه عصبی عمیق قرار داده‌اند و برنامه موفق شده است، نمونه‌هایی را بر اساس الگوی کاری خودش بسازد.

با این حال هنوز راه درازی در پیش است تا بتوانید WaveNet را در قالب یک برنامه کاربردی مورد استفاده قرار دهید. اما می‌توانید به تعدادی از نمونه‌های ساخته شده از این برنامه در سایت DeepMind گوش دهید.

مطالب پربازدید

ماهنامه شبکه را از کجا تهیه کنیم؟
ماهنامه شبکه را می‌توانید از کتابخانه‌های عمومی سراسر کشور و نیز از دکه‌های روزنامه‌فروشی تهیه نمائید.

ثبت اشتراک نسخه کاغذی ماهنامه شبکه
ثبت اشتراک نسخه آنلاین

کتاب الکترونیک +Network راهنمای شبکه‌ها

برای دانلود تنها کتاب کامل ترجمه فارسی +Network اینجا کلیک کنید.

کتاب الکترونیک دوره مقدماتی آموزش پایتون

اگر قصد یادگیری برنامه‌نویسی را دارید ولی هیچ پیش‌زمینه‌ای ندارید اینجا کلیک کنید.

برچسب:

به اشتراک گذاری مطلب:

Telegram Twitter Print HTML

نرم‌افزار جدید گوگل همانند انسان‌ها صحبت کند!

مطلب پیشنهادی

گوگل پردازنده‌ای ویژه هوش مصنوعی ساخت

مطلب پیشنهادی

رقابت هوش مصنوعی بزرگان در زمین بازی Go

مطالب پربازدید

کتاب الکترونیک +Network راهنمای شبکه‌ها

کتاب الکترونیک دوره مقدماتی آموزش پایتون

تماشا کنید: مصاحبه اختصاصی با دکتر محمد جواد بابایی، فعال و متخصص در ساخت و توسعه مراکز داده کشور و پروژه ملی DCAS

تماشا کنید: مصاحبه اختصاصی با دکتر بهرام زاهدی، دبیر نظام ممیزی و رتبه‌بندی مراکز داده کشور و پروژه ملی DCAS

تماشا کنید: مصاحبه اختصاصی درباره پروژه شناسایی و پیش ارزیابی مراکز داده کشور (DCAS)

نظر شما چیست؟

متاورس

متاورس می‌تواند پایانی بر گوشی‌ها و تبلت‌های هوشمند باشد؟

10 روند برتر تجارت و فناوری در سال 2022

آیا طوفان متاورس زندگی همه ما را برای همیشه تغییر خواهد داد

آیا ورود ایرانیان به دنیای متاورس امکان‌پذیر است؟ چگونه؟

خرید زمین 4.3 میلیون دلاری در متاورس (چند متر زمین مجازی)

متاورس چیست و چگونه زندگی مردم در جهان دیجیتال را متحول خواهد کرد؟

آخرین مطالب

قیمت سرور گرافیکی | خرید GPU Server مخصوص هوش مصنوعی، رندرینگ

سایت شرکتی حرفه‌ای؛ ویترین دیجیتال شما در عصر جستجو و هوش مصنوعی

چالش‌های RAM در Workloadهای محاسباتی HPC

آموزش تعمیرات لپ‌تاپ و کامپیوتر؛ چگونه از گرانی تجهیزات دیجیتال، یک شغل پردرآمد بسازیم؟

دلیل رنگ بندی کابل شبکه

چطور تبلیغات آینده با ما حرف می‌زند، نه به ما؟

زیر پوست دنیای داده؛ نقش سرور HP در آینده زیرساخت دیجیتال

تبلیغات هوشمند؛ وقتی الگوریتم جای خلاقیت را می‌گیرد

کارشناس عملیات شبکه کیست و چه وظایفی دارد؟

شبکه دسترسی رادیویی باز چیست؟

تبلیغات لینکی

مطلب پیشنهادی

مطلب پیشنهادی

مطالب پربازدید

کتاب الکترونیک +Network راهنمای شبکه‌ها

کتاب الکترونیک دوره مقدماتی آموزش پایتون

مطالب مرتبط

نظر شما چیست؟

متاورس

آخرین مطالب

تبلیغات لینکی