پردازش صوت

انواع نویز صوتی در پردازش گفتار

برقراري ارتباط گفتاري در محيط‌هاي آرام و فواصل نزديک معمولا به درستي و بدون دخالت نويز انجام مي‌گيرد، ولي زماني که بحث برقراري ارتباط در فواصل دور مطرح باشد، نويز زمينه در آن فضا وجود دارد و کيفيت سيگنال گفتار تا حد زيادي کاهش مي‌يابد؛ در نتيجه توانايي شنونده تضعيف مي‌گردد. نکته حائز اهميت در… مشاهده ادامه مطلب

آنالیز کپسترال (Cepstral analysis)

یکی از مشخصه‌هایی که از سیگنال گفتار استخراج میشود و در بسیاری از کاربردها مورد استفاده قرار میگیرد ضرایب کپسترال میباشد. آنالیز کپسترال (Cepstral analysis) روشی است متداول در حوزه پردازش سیگنال و پردازش گفتار صوتی به منظور فشرده سازی یا کد کردن گفتار با کیفیت بالا در نرخ بیت (bit rate) پایین.(برای مطالعه مبحث… مشاهده ادامه مطلب

مقدمات کار با صوت در متلب

در متلب توابعی وجود دارند که به منظور کار با صوت طراحی شده اند.در این نوشته مقدماتی‌ترین این توابع و طرز کار این توابع را با هم مرور می کنیم. بصورت پیشفرض میدانیم که هنگام بروز خطا و اخطار در متلب این نرم افزار خطای اتفاق افتاده را با رنگ قرمز و ایجاد صدا به اطلاع کاربر… مشاهده ادامه مطلب

ضرایب پیشگوئی خطی (LPC)

ضرایب پیشگوئی خطی (Linear predictive coding -LPC) روشی است متداول در حوزه پردازش سیگنال و پردازش گفتار صوتی به منظور فشرده سازی یا کد کردن گفتار با کیفیت بالا در نرخ بیت (bit rate) پایین.(برای مطالعه مبحث مربوط به کدینگ و فشرده سازی گفتار کلیک کنید.) روش LPC به طورگسترده ای برای کد نمودن گفتار… مشاهده ادامه مطلب

تحلیل مولفه اساسی (PCA)

تحلیل مولفه اساسی یا (Principal Component Analysis – PCA) یک روش آماری معروف است که کاربردهای فرواوانی دارد از جمله کاهش ابعاد. این الگوریتم در پیش پردازش داده های مربوط به پردازش سیگنال, شبکه های عصبی و پردازش صوت بسیار پر کاربرد است. این الگوریتم ارتباط نزدیکی با eigenvalue decomposition و single value decomposition  دارد که مربوط… مشاهده ادامه مطلب

کدینگ و فشرده سازی گفتار

کدینگ گفتار فرایندی است که در آن سیگنال گفتار تبدیل به کد می شود.  سپس اطلاعات بدست آمده فشرده شده و ارسال می گردند. کدگذاری منبع روش‌های فشرده‌سازی یک منبع اطلاعات را مطالعه می‌کند. منابع اطلاعاتی طبیعی، مانند گفتار یا نوشتار انسان‌ها، دارای افزونگی است؛ برای مثال در جمله «من به خانه‌مان برگشتم» ضمایر «مان»… مشاهده ادامه مطلب

فریم بندی سیگنال صوت

میدانیم که سیگنال گفتار یک سیگنال ایستا نیست و مشخصات فرکانسی آن با زمان تغییر میکند. اما خیلی از ابزارهای در دسترس ما مانند تبدیل فوریه مناسب سیگنالهای ایستا میباشد. زمانی که سیگنال گفتار را مورد بررسی قرار میدهیم آن را به قسمتهای کوتاه زمانی تقسیم میکنیم و هر قسمت را جداگانه آنالیز میکنیم, بدلیل… مشاهده ادامه مطلب

مقدمه ای بر پردازش گفتار

سیگنال صوتی و شنیداری یا Audio احساس ارتعاشات و نوسانات هوا توسط گوش انسان است. اگر این صوت در محدوده فرکانسی 20Hz – 20KHz  باشد با رسیدن به گوش و سپس انتقال به مغز و پردازش روی آن باعث درک مفهوم در ذهن انسان می گردد. سیگنال گفتار Speech زیر مجموعه ای از سیگنال Audio می باشد… مشاهده ادامه مطلب