تشخیص گفتار به رسمیت شناختن گفتار، توانایی یک ماشین یا برنامه برای شناسایی کلمات و عبارات در زبان گفتاری و تبدیل آنها به
فرمت قابل خواندن ماشین است. نرم افزار شناسایی گفتار ابتدایی دارای واژگان محدودی از کلمات و عبارات است.
و ممکن است این تنها در صورتی شناسایی شود که آنها به وضوح صحبت کنند.
نرم افزار پیچیده تر توانایی پذیرش گفتار طبیعی است.
به رسمیت شناختن گفتار با استفاده از الگوریتم ها از طریق مدل سازی آکوستیک و زبان عمل می کند.
مدل سازی آکوستیک نشان دهنده ارتباط بین واژگان زبان گفتاری و سیگنال های صوتی است.
مدل سازی زبان برای تلفن های
موبایل با توالی های کلمه برای کمک به تشخیص بین کلمات که صدا مشابه دارند است.
اغلب مدل های پنهان مارکوف نیز برای تشخیص الگوهای زمانی در سخنرانی برای بهبود دقت در داخل سیستم استفاده می شود.
رایج ترین برنامه های تشخیص گفتار در داخل شرکت عبارتند از مسیریابی تماس، پردازش گفتار به متن، شماره گیری صوتی و جستوجو صوتی.
تکنولوژی تشخیص گفتار هنوز به چندین مسئله برای کار کردن کمک می کند، زیرا به طور مداوم توسعه یافته است.
از مزایای استفاده از نرم افزار تشخیص گفتار آسان بودن برای استفاده و به دسترسی راحت به آن است.
نرم افزار تشخیص گفتار در حال حاضر اغلب در رایانه ها و دستگاه های تلفن همراه نصب شده است، که اجازه دسترسی آسان را می دهد.
به رسمیت شناختن گفتار به شما امکان می دهد
با تکنولوژی اطراف ارتباط برقرار کنید
معایب آن در تشخیص گفتار شامل ناتوانی در گرفتن کلمات با توجه به تغییرات تلفظ، عدم پشتیبانی از اکثر زبان های خارج
از انگلیسی و عدم توانایی آن ها در مرتب سازی بر روی سر و صدا است.این عوامل می تواند به اشتباهات منجر شود.
عملکرد تشخیص گفتار با دقت و سرعت اندازه گیری می شود.
نرخ خطای کلمه با دقت اندازه گیری می شود. WER در سطح کلمه کار می کند و اشتباهات در رونویسی را مشخص می کند،
هرچند که نمی تواند این خطا را شناسایی
کند. سرعت با فاکتور زمان حال اندازه گیری می شود. عوامل مختلفی می توانند عملکرد تشخیص گفتار کامپیوتر، از
جمله تلفظ، لهجه، زمین، حجم و سرو صدای پس زمینه را تحت تاثیر قرار دهد.