گوگل توسط یادگیری ماشینی کیفیت صدا در اپلیکیشن Duo را بهبود می‌دهد

گوگل توسط یادگیری ماشینی کیفیت صدا در اپلیکیشن Duo را بهبود می‌دهد

احتمالا تا به امروز با مشکلات صدا در تماس‌های صوتی و ویدیویی از طریق اینترنت مواجه شده‌اید. حالا گوگل Duo به عنوان یکی از اپلیکیشن‌های تماس اینترنتی محبوب، قصد دارد با استفاده از یادگیری ماشینی این مشکل را برطرف کند.

تماس‌های آنلاین تبدیل به بخشی از زندگی میلیون‌ها نفر در سراسر جهان شده‌اند. در هنگام برقراری تماس اطلاعات به بخش‌های کوچکی، بسته‌ها تقسیم می‌شوند. این بسته‌ها معمولا با تاخیر یا اشتباه به طرف مقابل می‌رسند و حتی ممکن است یک بسته گم شود. این موارد کاهش کیفیت تماس را در پی دارد.

بر اساس اعلام گوگل، 99 درصد تماس‌های اپلیکیشن Duo به علت تاخیر در شبکه، با تلفات بسته مواجه می‌شوند. 20 درصد این تماس‌ها به علت مشکلات شبکه، 3 درصد کل مکالمه را از دست می‌دهند و برای 10 درصد کاربران، این میزان به 8 درصد می‌رسد.

برای ارتباط مطمئن میان کاربران، باید راه‌حلی برای رفع این مشکل پیدا کرد. این راه‌حل، پنهان کردن بسته‌های گم شده (PLC) نام دارد. ماژول PLC گیرنده وظیفه خلق صدا یا تصویر را برعهده دارد تا مشکل تلفات بسته برطرف شود. گوگل به تازگی از سیستم PLC جدیدی با نام WaveNetEQ در اپلیکیشن Duo استفاده کرده. این مدل با استفاده از فناوری WaveRNN دیپ مایند توسعه پیدا کرده که مشکلات بخش‌های کوتاه یک تماس را برطرف می‌کند.

اپلیکیشن گوگل Duo مانند سایر سیستم‌های ارتباطی مبتنی بر وب، بر اساس پروژه متن باز WebRTC توسعه پیدا کرده. در این برنامه برای مخفی کردن تلفات بسته‌ها، بخش WebRTC NetEQ از روش پردازش سیگنال استفاده می‌کند. این روش، برای تلفات بسیار کوتاه (20 میلی ثانیه یا کمتر) عملکرد مناسبی دارد. گوگل برای افزایش این زمان و همچنین بهبود کارایی آن، NetEQ را با WaveNetEQ جایگزین کرده. این مدل نسخه بهبود یافته WaveRNN، مدل شبکه عصبی برای اتصال دو بخش از گفتار محسوب می‌شود.

با وجود این پیشرفت‌ها، هنوز این سیستم عملکرد بی‌نقصی ندارد. این PLC می‌تواند مکالمات تا 120 میلی ثانیه را بهبود دهد. گوگل سعی کرده سیستم جدید خود را به گونه‌ای توسعه دهد که صدای جدیدی تولید نکند. از آنجایی که تماس‌های گوگل Duo رمزگذاری می‌شوند، فرایند جدید در گوشی انجام می‌شود.

در حال حاضر این فناوری در تماس‌های Duo در گوشی‌های سری پیکسل 4 قابل دسترس است. بنابراین اگر از این محصولات استفاده می‌کنید، با افزایش کیفیت صوتی تماس‌های خود مواجه خواهید شد و کمتر از گذشته در فهم مکالمات با مشکل مواجه می‌شوید. گوگل در آینده این ویژگی را برای محصولات دیگر عرضه خواهد کرد.

افزودن دیدگاه جدید

محتوای این فیلد خصوصی است و به صورت عمومی نشان داده نخواهد شد.

HTML محدود

  • You can align images (data-align="center"), but also videos, blockquotes, and so on.
  • You can caption images (data-caption="Text"), but also videos, blockquotes, and so on.
13 + 1 =
Solve this simple math problem and enter the result. E.g. for 1+3, enter 4.