speech

ضرایب پیشگوئی خطی (LPC)

ضرایب پیشگوئی خطی (Linear predictive coding -LPC) روشی است متداول در حوزه پردازش سیگنال و پردازش گفتار صوتی به منظور فشرده سازی یا کد کردن گفتار با کیفیت بالا در نرخ بیت (bit rate) پایین.(برای مطالعه مبحث مربوط به کدینگ و فشرده سازی گفتار کلیک کنید.) روش LPC به طورگسترده ای برای کد نمودن گفتار… مشاهده ادامه مطلب

کدینگ و فشرده سازی گفتار

کدینگ گفتار فرایندی است که در آن سیگنال گفتار تبدیل به کد می شود.  سپس اطلاعات بدست آمده فشرده شده و ارسال می گردند. کدگذاری منبع روش‌های فشرده‌سازی یک منبع اطلاعات را مطالعه می‌کند. منابع اطلاعاتی طبیعی، مانند گفتار یا نوشتار انسان‌ها، دارای افزونگی است؛ برای مثال در جمله «من به خانه‌مان برگشتم» ضمایر «مان»… مشاهده ادامه مطلب

برنامه رسم نمودار فرکانس گام صوت

در این برنامه با استفاده از نرم افزار متلب یک فایل گفتار را میخوانیم و پس از فریم بندی آن برای تمام فریم ها اتوکورلیشن را بدست آورده و رسم میکنیم. نهایتا با استفاده از سنتر کلیپینگ فرکانس گام را برای تمام فریم ها محاسبه میکنیم و نمودار آن را براساس هر فریم رسم میکنیم. این… مشاهده ادامه مطلب

فریم بندی سیگنال صوت

میدانیم که سیگنال گفتار یک سیگنال ایستا نیست و مشخصات فرکانسی آن با زمان تغییر میکند. اما خیلی از ابزارهای در دسترس ما مانند تبدیل فوریه مناسب سیگنالهای ایستا میباشد. زمانی که سیگنال گفتار را مورد بررسی قرار میدهیم آن را به قسمتهای کوتاه زمانی تقسیم میکنیم و هر قسمت را جداگانه آنالیز میکنیم, بدلیل… مشاهده ادامه مطلب

مقدمه ای بر پردازش گفتار

سیگنال صوتی و شنیداری یا Audio احساس ارتعاشات و نوسانات هوا توسط گوش انسان است. اگر این صوت در محدوده فرکانسی 20Hz – 20KHz  باشد با رسیدن به گوش و سپس انتقال به مغز و پردازش روی آن باعث درک مفهوم در ذهن انسان می گردد. سیگنال گفتار Speech زیر مجموعه ای از سیگنال Audio می باشد… مشاهده ادامه مطلب

برنامه بدست آوردن مشخصات زمانی سیگنال صوت

با استفاده از نرم افزار متلب قصد داریم مشخصات زمانی سیگنال صوتی را بررسی کنیم. انرژی کوتاه مدت(Short Time Energy) و اندازه کوتاه مدت(Short Time Magnitude) را برای یک سیگنال صوتی مشخص میکینیم و برای یک فریم واک و یک فریم بی واک از این صوت نیز اتوکورلیشن(Autocorrelation) را رسم میکنیم و مقایسه ای انجام میدهیم. در… مشاهده ادامه مطلب

برنامه افزودن نویز به سیگنال, با سیگنال به نویز دلخواه (SNR)

در این برنامه هدف اضافه کردن مقدار مناسبی نویز به سیگنال صوتی بدون نویز است با این هدف که سیگنال به نویز مطلوب کاربر فراهم گردد. در ابتدا یک فایل صوتی را با نرم افزار متلب لود میکنیم و پس از آن برنامه از کاربر میخواهد مقدار سیگنال به نویز مطلوب خود را برحسب دسیبل… مشاهده ادامه مطلب

برنامه محاسبه و رسم مشخصه زمانی عبور از صفر یک صوت (Zero Crossing)

در این برنامه با استفاده از نرم افزار متلب یک فایل صوتی را میخوانیم و پس از فریم بندی آن یکی از مشخصه های زمانی صوت, تعداد عبور از صفر را بدست میاوریم و رسم میکنیم. قابل انتظار است که نرخ عبور از صفر (zero-crossing) در فریم های unvoice بیشتر و در فریم های unvoice… مشاهده ادامه مطلب