پردازش صوت

کدینگ و فشرده سازی گفتار

کدینگ گفتار فرایندی است که در آن سیگنال گفتار تبدیل به کد می شود.  سپس اطلاعات بدست آمده فشرده شده و ارسال می گردند. کدگذاری منبع روش‌های فشرده‌سازی یک منبع اطلاعات را مطالعه می‌کند. منابع اطلاعاتی طبیعی، مانند گفتار یا نوشتار انسان‌ها، دارای افزونگی است؛ برای مثال در جمله «من به خانه‌مان برگشتم» ضمایر «مان»… مشاهده ادامه مطلب

فریم بندی سیگنال صوت

میدانیم که سیگنال گفتار یک سیگنال ایستا نیست و مشخصات فرکانسی آن با زمان تغییر میکند. اما خیلی از ابزارهای در دسترس ما مانند تبدیل فوریه مناسب سیگنالهای ایستا میباشد. زمانی که سیگنال گفتار را مورد بررسی قرار میدهیم آن را به قسمتهای کوتاه زمانی تقسیم میکنیم و هر قسمت را جداگانه آنالیز میکنیم, بدلیل… مشاهده ادامه مطلب

مقدمه ای بر پردازش گفتار

سیگنال صوتی و شنیداری یا Audio احساس ارتعاشات و نوسانات هوا توسط گوش انسان است. اگر این صوت در محدوده فرکانسی 20Hz – 20KHz  باشد با رسیدن به گوش و سپس انتقال به مغز و پردازش روی آن باعث درک مفهوم در ذهن انسان می گردد. سیگنال گفتار Speech زیر مجموعه ای از سیگنال Audio می باشد… مشاهده ادامه مطلب