تبدیل گفتار به نوشتار با چند نرم‌افزار و اپلیکیشن کاربردی

تبدیل گفتار به نوشتار با چند نرم‌افزار و اپلیکیشن کاربردی

چند سالی می‌شود که خاطره‌ی ناخوشایند اعتماد به برخی سایت‌ها برای خرید نرم‌افزار تبدیل گفتار به نوشتار، در ذهنم حک شده است. درست از همان موقع که هزینه‌ی زیادی صرف خرید نرم افزار تبدیل صدا به متن کردم، و به نتیجه نرسیدم، تصمیم گرفتم تمام برنامه‌های مدعی در این زمینه را چک کنم. در این زمینه فهرستی از روش‌ها و معرفی مختصری از این مدل برنامه‌ها را در اختیار شما نیز قرار می‌دهم و در آخر از شما می‌خواهم که تجربه‌ی کاربریِ هر کدام از این ابزارها را با ما در میان بگذارید.

تبدیل گفتار به نوشتار با وب سایت speechtexter.com

اولین باری که توانستم به‌خوبی به کمک یک ابزار آنلاین، صدا را به نوشتار تبدیل کنم، روزی بود که با وب سایت speechtexter آشنا شدم. تجربه‌ی واقعا هیجان انگیزی بود چرا که چند هفته پیش از آن، حدود ۳۰۰ هزار تومان هزینه کرده بودم و یک سی‌دی خریده بودم که طراح آن مدعی بود از طریق این نرم‌افزار می‌توانید به سرعت بالا، گفتار خود را به متن تبدیل کنید. اما این محصول، دردسر‌های زیادی داشت و از شما چه پنهان، سرعت تایپ دستی‌ام از سرعت نوشتار آن بیشتر بود. البته شمار خطاهای این محصول هم بسیار زیاد بود و من واقعا فرصت اصلاح اشتباهاتش را نداشتم.

speechtexter.com نرم افزاری تحت وب است که به شما اجازه می‌دهد به‌صورت آنلاین، سریع صحبت کنید و آن هم سریع گفته‌هایتان را تایپ کند. البته زبان این سرویس، قابل تغییر به چند ده زبان دنیاست که خوشبختانه فارسی هم در میان فهرست آن به چشم می‌خورد. بیایید کمی با این برنامه کار کنیم.

شروع کار

اگر به آدرس speechtexter.com بروید تصویر زیر را در صفحه‌ی اول وبسایت مشاهده می‌کنید:

همان‌طور که در تصویر مشاهده می‌کنید، شما می‌توانید در سمت راست، تعیین زبان صوتی و نوشتاری و در سمت چپ کلید‌های اولیه برای شروع نوشتن، و مدیریت نوشتار را تحت کنترل بگیرید.

اینجا یک دکمه به نام START وجود دارد که برای شروع صحبت می‌بایست آن را بزنید. دقت داشته باشید که، به محض شروع صحبت، یک اعلان برای‌تان ارسال می‌شود که میکروفون خود را به مرورگر بشناسانید و روی ALLOW کلیک کنید تا همگام سازی‌ها صورت گیرد.

تعیین زبان

بدین منظور روی آیکون سمت راست که UNITESD نوشته است، یک بار کلیک کنید تا فهرست زبان‌ها را مشاهده کنید. می‌توانید در میان فهرست به‌دنبال فارسی باشید یا اینکه در باکس جست‌وجو زبان فارسی را بیابید و خروجی را انتخاب کنید.

وقتی زبان به‌درستی مشخص شد می‌توانید روی START کلیک کنید تا ویرایشگر سفید آن نمایش داده شود. به‌عنوان یک نشان از آمادگی ابزار برای ضبط صدای شما، یک حلقه‌ی پردازشگر در بالا شروع به‌کار می‌کند. وقتی این حلقه فعال باشد بدین معنی است که شما می‌توانید به‌راحتی بگویید تا برنامه بنویسد.

ویرایشگر دارای ابزارهای قالب‌بندی متن است که ازجمله‌ی آنها می‌توان به فونت، اندازه، رنگ، راست‌چین یا چپ‌چین، بولد کردن، ایتالیک و زیرخط‌دار بودن و مواردی نظیر این اشاره کرد.

البته برخی دستورات صوتی نیز وجود دارد که در خلال گفتار خود می‌توانید به‌کار ببرید تا ویرایشگر کار جدیدی برای‌تان انجام دهد. مثلا اگر بخواهید به پاراگراف بعدی بروید، کافی است بگویید: «پاراگراف جدید»

با گفتن و ادای اصولی این عبارت، می‌توانید نشانگر را سر خط در پاراگراف جدید مشاهده کنید.

دقیقا مثل این دستور، دستورات دیگری نیز وجود دارند که با ادای آنها می‌توانید کار جدیدی در ویرایشگر انجام دهید. ازجمله‌ی این عبارت‌ها می‌توان به موارد زیر اشاره کرد:

  1. نقطه؛
  2. ویرگول؛
  3. دو نقطه؛
  4. نقطه ویرگول؛
  5. علامت سوال.

در نهایت وقتی متن خود را نوشتید می‌توانید در داخل همان ویرایشگر، شروع به ویراش کنید و برخی جملات را درست کنید یا به جملات چیزی اضافه کنید. در نهایت می‌توانید با انتخاب تمام جملات و کپی کردن آن، متن را به ویرایشگر‌هایی که می‌خواهید نظیر WORD، نوت‌پد یا حتی به وبسایت انتقال دهید.

اما بدانید که به کمک نوار ابزار بالای ویرایشگر همین نرم‌افزار نیز می‌توانید روی متن کارهایی انجام بدهید. برای نمونه، این ابزارها را در عکس زیر مشاهده می‌کنید:

به کمک این ابزارها می‌توانید متن را در یک فایل متنی ذخیره کنید یا اینکه متن را چاپ کنید. همچنین می‌توانید به کمک دستورات UNDO و REDO روی متن ویرایش‌هایی انجام دهید. به کمک همین نوار ابزار می‌توانید تمامی متن را در کلیپ‌برد ذخیره کنید یا اینکه همه‌ی متن را پاک کنید. برای این منظور از دکمه‌ی CLEAR استفاده کنید.

دو نکته در مورد این برنامه

۱. استفاده از این برنامه، کاملا رایگان و با اتصال به اینترنت امکان‌پذیر است. در حین استفاده از برنامه ممکن است با پیغامی مثل No speech was detected. Please try again روبه‌رو شوید.

در چنین شرایطی باید اتصال اینترنتی و حتی اتصال میکروفون خود را چک کنید. در این مواقع اگر یک بار روی دکمه‌ی STOP کلیک کنید و دوباره START را بزنید به‌راحتی می‌توانید مشکل را حل کنید.

۲. شما می‌توانید هرچندبار که لازم است، عملیات را قطع و وصل کنید و متن خود را در نهایت تکمیل کنید. اما در هنگام استفاده از این ابزارها مراقب باشید که به اشتباه روی CLEAR کلیک نکنید چرا که زحمات‌تان به باد می‌رود.

تنها در یک صورت بعد از پاک شدن توسط این دکمه می‌توانید متن را بازیابی کنید که عملیات ریستور قابل انجام باشد. در این حالت اولین آیکون قالب‌بندی از سمت راست، مشکی است و این بدین معنی است که متن به صورت DRAFT ذخیره شده است. روی این گزینه در چنین شرایطی یک بار کلیک کنید تا متن برگردد. اما برای بار دوم این دکمه عمل نخواهد کرد.

این ابزار سرعت بسیار خوبی دارد، و به شما اجازه‌ی ویرایش ضمن نوشتار نیز می‌دهد.

معرفی ابزار دوم: Dictate

Dictate داستان جالبی دارد. همه‌ی ما می‌دانیم که «بیل گیتس» درست از یک گاراژ که در آن کار می‌کرد، به این مقام دست پیدا کرده است. شاید برخی از افراد با تغییر جایگاه خود، فراموش کنند که از کجا به کجا رسیده‌اند اما بیل گیتس آن گاراژ را کماکان حفظ کرده و آن را به‌عنوان بخشی از شرکت خود برای توسعه‌ی ایده‌های کارمندانش به‌کار گرفته است.

در میان کارمندان بیل گیتس، هر فردی که ایده‌ای جدید داشته باشد در این گاراژ که البته این روزها بیشتر حالت اداری دارد به توسعه‌ی ایده خود می‌پردازد.

Dictate ابزاری است که توسط کارمندان این شرکت در همین مکان رشد پیدا کرده و البته روز به روز بر موفقیتش افزوده می‌شود.

Dictate برنامه‌ای است که می‌تواند در کنار برنامه‌های ویرایشگر نظیر WORD بنشیند و به کمک افرادی بیاید که می‌خواهند تایپ کنند. در حقیقت برنامه‌ی ویرایشگر تبدیل صدا به متن در مایکروسافت Dictate نام دارد.

بسیاری از افرادی که از سرویس ایمیلی Microsoft Outlook استفاده می‌کنند از این ابزار بهره می‌گیرند تا عملیات نوشتن متن‌های ایمیل را سریع‌تر انجام بدهند. برای این آموزش نیز من سعی دارم، این نرم افزار کمکی را با Microsoft Outlook ادغام و از آن استفاده کنم.

برای استفاده از Dictate لازم است که به وبسایت مربوطه‌اش مراجعه و نرم‌افزار لازم را دانلود کنید. دقت کنید که شما باید به تناسب نرم‌افزار Outlook خود، نسخه‌ی مناسب را انتخاب کنید.

Dictate دارای نسخه‌های ۳۲ بیتی و ۶۴ بیتی است. به همین دلیل لازم است که نسخه‌های Dictate و Outlook دقیقا از یک ساخت برخوردار باشند.

شناسایی نسخه‌ی نرم‌افزار

برای شناسایی نسخه‌ی نرم‌افزارتان، کافی است برنامه را باز کنید و به مسیر File> Account Office> About Outlook بروید. در این قسمت مانند تصویر زیر می‌توانید نسخه‌ی Outlook را مشخص کنید.

بعد از شناسایی، باید نسخه‌ی مناسب را دانلود و آن را نصب کنید. دقت کنید که هنگام نصب می‌بایست تمامی نرم افزارهای متعلق به مایکروسافت را ببندید.

نحوه‌ی استفاده از Dictate در Outlook

بعد از اینکه برنامه را نصب کردید، Outlook را باز کنید. در میان سر برگ‌های این برنامه، مطابق عکس زیر می‌توانید Dictate را مشاهده کنید.

در زبانه‌ای که باز می‌کنید، می‌توانید دو بخش جداگانه مشاهده کنید:

  • بخش سمت چپ که با RESPONSE مشخص شده است.
  • بخش سمت راست که با LANGUAGE OPTIONS مشخص شده است.

در بخش LANGUAGE OPTIONS می‌توانید مشخصات زبان را تعیین کنید و در بخش RESPONSE عملیات ضبط را انجام دهید.

برای ضبط کردن روی START و برای توقف روی STOP کلیک کنید.

دقت کنید که این برنامه ابتدا صدای شما را کامل می‌شنود و جمله‌ی کامل را می‌نویسد. این برخلاف ابزارهای دیگری است که شاید تاکنون تست کرده‌اید و البته ما در این مقاله آنها را به شما یاد آوری کرده‌ایم.

استفاده از فرمان‌های صوتی در این برنامه نیز رواج دارد. برای نمونه با گفتن DELETE آخرین جمله‌ی نوشته‌شده حذف می‌شود. با گفتن New line، وارد خط بعدی می‌شوید و در نهایت اگر بخواهید نوشتار را تمام کنید، می‌توانید روی STOP کلیک کنید یا راحت‌تر بگویید Stop dictation!

Manual Punctuation بخشی است که می‌توانید برخی دستورات صوتی را در آن مشاهده و تحت اختیار بگیرید. مثلا این برنامه به‌طور خودکار انتهای هر جمله را، نقطه‌گذاری می‌کند اما شما می‌توانید این کار را خودتان انجام بدهید. به کمک Manual Punctuation می‌توانید سایر دستورات را نیز تحت کنترل بگیرید. ازجمله‌ی این دستورات می‌توان به موارد زیر اشاره کرد:

دوره‌ی زمانی (Period)، کاما (Comma)، علامت سوال (Question mark)، نقل قول باز (Open quote)، بستن نقل قول (Close quote)، کولون (Colon)

عمر این برنامه طولانی نیست اما شما می‌توانید به عنوان یک ابزار کمکی آن را در کنار برنامه‌های ویرایشگر مایکروسافت استفاده کنید. این برنامه می‌تواند تا ۲۰ زبان را درک کند و تا ۶۰ زبان را به‌طور کامل بنویسد اما وجود اشکالات نگارشی در آن، دور از انتظار نیست.

روش سوم: استفاده از ربات voicybot

ربات voicybot یکی از ربات‌های معروفی است که برای کمک به کاربران تلگرام نوشته شده است. به کمک voicybot می‌توانید نوع زبان خود را تعیین کنید و شروع به گفتن کنید تا ربات تلگرامی برای‌تان صدا را به متن تبدیل کند. در ادامه روش کار کردن با این ربات را می‌آموزیم:

ابتدا لازم است که وارد تلگرام شوید و @voicybot را بنویسید و روی آن کلیک کنید تا وارد ربات شوید.

بر روی START که در انتهای صفحه کلیک کنید (لمس کنید) تا عملیات تبدیل گفتار به نوشتار توسط تلگرام، شروع شود:

ابتدا لازم است که زبان خود را مشخص کنید. فهرست مفصلی از زبان‌ها در ابتدا توسط این برنامه و ربات تلگرام در اختیار شما قرار می‌گیرد. بدین صورت می‌توانید با کمک دکمه‌های جهتی < و > بین زبان‌ها گردش کنید و Persian را پیدا کنید. روی این دکمه کلیک کنید تا زبان فارسی تنظیم شود:

روال کار با این ربات به صورت ضبط صداست. شما می‌بایست دکمه‌ی میکروفون در سمت راست در تلگرام را فشار دهید، و شروع به صحبت کنید. بعد از اتمام صحبت، میکروفون را رها کنید تا عملیات تشخیص گفتار آغاز شود. هنگامی که توسط ربات پردازش صورت می‌گیرد، این پروسه مطابق عکس بالا گزارش می‌شود. در نهایت آن چه که ربات به آن دست پیدا می‌کند و درک می‌کند در زیر صدای ضبط شده نوشته می‌شود:

بدین ترتیب می‌توانید صداهای خود را ضبط و به نرم‌افزار معرفی کنید.

یک ویژگی بسیار خوب این نرم افزار تلگرامی این است که می‌توانید صدای ضبط‌شده‌ی خود را در قالب فایل‌های صوتی مثل mp3 و غیره، به برنامه معرفی کنید. برای این منظور، می‌توانید با هر نرم‌افزار ضبط صدا، صدای خود یا هر فردی را ذخیره و ضبط کنید و بعد به کمک قابلیت ضمیمه‌کردن فایل، که آیکون آن به‌صورت گیره شکل است و در کنار آیکون میکروفون قرار دارد، فایل ضبط‌شده را آپلود کنید و بعد از اینکه فایل کاملا بارگزاری شد، عملیات تشخیص صدا صورت خواهد گرفت و متن برای شما ارسال خواهد شد.

دقت کنید که این ربات خطا هم دارد. بنابراین بعد از تبدیل گفتار به نوشتار، توجه کنید که با یک وارسی در متن، عبارتی اشتباه برگردان نشده باشد.

این ربات برای هر دو حالت تلگرام، یعنی تحت اندروید و دسکتاپ قابل استفاده است.

اپلیکیشن‌های اندرویدی تبدیل گفتار به نوشتار

اگر به کمک برخی مارکت‌های اپلیکیشن در ایران، بخواهید به‌دنبال چنین نرم افزارهایی باشید، باید عبارت، تبدیل گفتار به نوشتار را جست‌وجو کنید. در چنین حالتی شمار زیادی اپلیکیشن به شما پیشنهاد داده می‌شود.

اصول کار تمامی این نرم افزارها مشابه است. بعد از اینکه نرم افزار را نصب کردید، از شما در مورد تعیین زبان سؤال می‌شود. معمولا این اپلیکیشن‌ها، زبان را بر روی فارسی تنظیم کرده‌اند.

بعد از آن با زدن یک دکمه‌ی شروع، از شما خواسته می‌شود که صحبت کنید. از زمانی که دکمه‌ی شروع را می‌زنید، سرویس‌های یاد شده به‌کمک سرویس گوگل، صدای شما را شناسایی می‌کنند و عملیات ضبط و تبدیل را انجام می‌دهند.

بعد از اینکه دکمه‌ی شروع را زدید با یک دیالوگ باکس به صورت زیر مواجه می‌شوید:

این صفحه نشان می‌دهد که اپلیکیشن مورد نظر از گوگل قوت گرفته است. شما می‌بایست حرف زدن خود را آغاز کنید تا برنامه آن را متوجه شود. معمولا باید چند بار صحبت کنید تا نرم‌افزار صدای شما را دریافت و آن را درک کند و بعد آن را بنویسد:

در تجربه‌ای که با چند برنامه‌ی اندرویدی داشته‌ام، متوجه شده‌ام که، سرعت عکس‌العمل اپلیکیشن‌ها بسیار پایین است و گاهی خطاهایی دارد که واقعا آزار دهنده‌اند. من تاکنون اپلیکیشن قوی در این باره ندیده‌ام اما نسخه‌های تحت وب می‌توانند بسیار بهتر پاسخ گویی داشته باشند. تجربه‌ی شخصی شما در این باره چیست؟

برنامه‌های بومی ایرانی

با توجه به اینکه تعداد کاربرانی که می‌خواهند با تبدیل گفتار به نوشتار، به امور تایپی خود سرعت ببخشند هر روز بیشتر می‌شود، سایت‌های ایجاد شده‌اند که به کاربران کمک می‌کنند تا با رابط کاربری ایرانی بتوانند صدای خود را به متن تبدیل کنند. اما نکته‌ی مهمی در این باره وجود دارد که هنوز برخی از این سرویس‌ها دارای کمبود‌ها و نواقصی هستند. مثلا برخی با سرعت خوبی که در نوشتار دارند، امکان ویرایش در لحظه را برای شما فراهم نمی‌کند. یا اینکه برخی علاوه بر ارائه‌ی سرویس محدود رایگان، سرویس تبدیل گفتار به نوشتار خود را با هزینه‌ی ماهانه ارائه می‌دهد.

به‌نظر می‌رسد که اگر بخواهید از ابزارهای یاد شده استفاده کنید، می‌توانید به‌سادگی به کمک ابزارهای تحت وب و ابزارهای اندرویدی و حتی ربات تلگرامی به‌خوبی کار خود را پیش ببرید و نیازی به وقت‌گذرانی با سایر ابزارهای محدود نیست.

در این باره دیدگاه‌ها و تجربیات ارزنده‌ی خود را با ما در میان بگذارید و به ما بگویید که تاکنون از چه ابزاری برای این هدف استفاده کرده‌اید.

افزودن دیدگاه جدید

محتوای این فیلد خصوصی است و به صورت عمومی نشان داده نخواهد شد.

HTML محدود

  • You can align images (data-align="center"), but also videos, blockquotes, and so on.
  • You can caption images (data-caption="Text"), but also videos, blockquotes, and so on.
1 + 3 =
Solve this simple math problem and enter the result. E.g. for 1+3, enter 4.