ضرایب پیشگوئی خطی (LPC)

ضرایب پیشگوئی خطی (Linear predictive coding -LPC) روشی است متداول در حوزه پردازش سیگنال و پردازش گفتار صوتی به منظور فشرده سازی یا کد کردن گفتار با کیفیت بالا در نرخ بیت (bit rate) پایین.(برای مطالعه مبحث مربوط به کدینگ و فشرده سازی گفتار کلیک کنید.)

روش LPC به طورگسترده ای برای کد نمودن گفتار ، سنتز گفتار ، شناخت گفتار، شناخت گوينده ، احراز هويت گوينده و ذخیره سازی گفتار استفاده میشود. برای درک بهتر این روش لازم است بدانیم که اساس این ایده بر اساس مدل تولید گفتاری است که به صورت یک تیوب با یک نوسان ساز در انتهای آن فرض میشود پیش میرود. LPC روشي کارآمد بوده که تخمینهای بسیاردقیقي از پارامترهای گفتار را فراهم مي کند.

مي دانیم که به طور کلي در يك سیستم گسسته LTI رابطه ورودی و خروجي به صورت معادله ديفرنس زير استLPC1-yarcode.ir

در حلت کلي LP تخمین مقدار خروجي دريك لحظه خاص از روی مقاديرمختلف ورودی به اضافه نمونه های قبلي خروجي مي باشد يعني:LPC2-yarcode.ir

که در روابط فوق a و b ضرایب پیشگویی خطی هستند .

ايده اولیه پیش بیني خطي بر اين اساس است که نمونه گفتار فعلي را مي توان تقريبا به عنوان ترکیب خطي از نمونه های گذشته فرض نمود. به عنوان نمونه اگر بخواهیم نمونه گفتار فعلی را با تعداد P نمونه ماقبلش بسازیم داریم:

LPC3-yarcode.ir

متداولترین مقدار برای P عموما 14 در نظر گرفته میشود. بدلیل اینکه تئوری این روش براساس مدل تیوبی تولید گفتار بنا شده لذا در نهایت یک مدل تمام قطب از سیستم گفتار خواهیم داشت. بنابراین روش LP یک روش قوی جهت تخمین پارامترهای سیستم خطی تولید گفتار Voice Speech (واک) میباشد ولی برای فریم های Unvoice گفتار نیز قابل استفاده است.

حال تمام مسئله مدل سازی و یا کدینگ و سنتز گفتار ما تبدیل میشود به بدست آوردن ضرایب پیشبینی (α ها) . بنابراین اگر هر فریم صوت ما بعد از پنجره گذاری شامل 256 نمونه باشد کافیست این 256 نمونه را با تعداد  P ضریب (معمولا 14 ضریب) مدل کنیم. حال بجای ارسال 256 نمونه برای هر فریم کافیست P عدد˓ ضریب را ارسال کنیم که موجب فشرده سازی شده و به پهنای باند کمتری نیاز داریم.

 ها  از طریق به حداقل رساندن مجموع مربعات خطا بدست می‌آید. یعنی سیگنال واقعی را از سیگنال پیشبینی شده کم میکنیم این خطا باید نسبت به تمام ضرایب مینیمم شود که برای اینکار کافیست از معادلات حاصل شده نسبت به ضرایب پیشبینی (α ها)  مشتق بگیریم و برابر صفر قرار دهیم. در نتیجه برای هر فریم P معادله  و P مجهول خواهیم داشت که پس از حل آنها ضرایب پیشبینی مشخص میگردد.

روشهای LPدرکنترل و تئوری اطلاعات استفاده شده و تحت عنوان روشهای برآورد سیستمي و شناسايي سیستم (estimation and system identification) نامگذاری شده است و به طور گسترده ای تحت نامهای زير در گفتار استفاده مي شود:

Covariance method (1
Autocorrelation method (2
Lattice method (3
Inverse filter formulation (4
Spectral estimation formulation (5
Maximum likelihood method (6
Inner product method (7

در ادامه بازسازی یک فریم واک و یک فریم بی واک را مشاهده میکنیم که با 10 , 20, 50 ضریب LP بازسازی شده و کاملا واضح است که هرچه تعداد ضرایب را بیشتر کنیم تخمین دقیقتری خواهیم داشت. البته واضح است که بدلیل مدل سازی تمام قطب این روش, مینیمم ها به خوبی تخمین زده نمیشوند. همچنین تخمین بهتری از فریم های واک نسبت به یک فریم بی واک به ما میدهد. که البته میدانیم در بازسازی سیگنال گفتار فریم های واک اهمیت بیشتری دارند و لذا افت کیفیت چندانی را شاهد نخواهیم بود.

LPC4-yarcode.ir

LPC5-yarcode.ir

برای مطالعه بیشتر میتوانید به سایت ویکیپدیا و یا سایت یارکد مراجعه نمایید.

یکی فکر در “ضرایب پیشگوئی خطی (LPC)

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *