پردازش صوت

نحوه تولید گفتار

نوشته شده توسط مهدی مقیمی

به منظور طراحی و پیاده سازی سیستمهای پردازش گفتاری نیاز است درباره اندامها و نحوه تولید گفتار در انسان مطلع بود. گفتار در حنجره و دهان بوجود می آید. تارهای صوتی که با فرکانس پایه خاصی ارتعاش دارند، مقدار متغیر با زمانی را ایجاد میکنند که اصطلاحا pitch نام دارد و مجموعه ای از اندامها… مشاهده ادامه مطلب

اثر دوپلر در سیگنالهای صوتی

نوشته شده توسط مهدی مقیمی

شاید شما هم زمانی که در کنار جاده قرار گرفته اید، متوجه زیاد و کم شدن صدای اتومبیلی ، به ترتیب با نزدیک و دور شدن آن به خود ، شده‌اید.حتما تا به حال توجه کرده‌اید که وقتی یک ماشین آتش‌نشانی یا آمبولانس با آژیر روشن از کنار شما عبور می‌کند، صدای آژیر این وسیله قبل… مشاهده ادامه مطلب

پیش تاکید کردن صوت

نوشته شده توسط مهدی مقیمی

در پردازش سیگنال عموما بسته به کاربر و یا نحوه تهیه سیگنال قبل از تحلیل و پردازش سیگنال، نیاز به مجموعه ای از فرآیندها تحت عنوان پیش پردازش است. در سیگنالهای مرتبط با صوت و به ویژه سیگنال های گفتار، برای از بین بردن اثرات تغییر ناگهانی سیگنال زمان پیوسته، سیگنال را از یک فیلتر… مشاهده ادامه مطلب

انواع نویز صوتی در پردازش گفتار

نوشته شده توسط مهدی مقیمی

برقراري ارتباط گفتاري در محيط‌هاي آرام و فواصل نزديک معمولا به درستي و بدون دخالت نويز انجام مي‌گيرد، ولي زماني که بحث برقراري ارتباط در فواصل دور مطرح باشد، نويز زمينه در آن فضا وجود دارد و کيفيت سيگنال گفتار تا حد زيادي کاهش مي‌يابد؛ در نتيجه توانايي شنونده تضعيف مي‌گردد. نکته حائز اهميت در… مشاهده ادامه مطلب

آنالیز کپسترال (Cepstral analysis)

نوشته شده توسط مهدی مقیمی

یکی از مشخصه‌هایی که از سیگنال گفتار استخراج میشود و در بسیاری از کاربردها مورد استفاده قرار میگیرد ضرایب کپسترال میباشد. آنالیز کپسترال (Cepstral analysis) روشی است متداول در حوزه پردازش سیگنال و پردازش گفتار صوتی به منظور فشرده سازی یا کد کردن گفتار با کیفیت بالا در نرخ بیت (bit rate) پایین.(برای مطالعه مبحث… مشاهده ادامه مطلب

مقدمات کار با صوت در متلب

نوشته شده توسط مهدی مقیمی

در متلب توابعی وجود دارند که به منظور کار با صوت طراحی شده اند.در این نوشته مقدماتی‌ترین این توابع و طرز کار این توابع را با هم مرور می کنیم. بصورت پیشفرض میدانیم که هنگام بروز خطا و اخطار در متلب این نرم افزار خطای اتفاق افتاده را با رنگ قرمز و ایجاد صدا به اطلاع کاربر… مشاهده ادامه مطلب

ضرایب پیشگوئی خطی (LPC)

نوشته شده توسط مهدی مقیمی

ضرایب پیشگوئی خطی (Linear predictive coding -LPC) روشی است متداول در حوزه پردازش سیگنال و پردازش گفتار صوتی به منظور فشرده سازی یا کد کردن گفتار با کیفیت بالا در نرخ بیت (bit rate) پایین.(برای مطالعه مبحث مربوط به کدینگ و فشرده سازی گفتار کلیک کنید.) روش LPC به طورگسترده ای برای کد نمودن گفتار… مشاهده ادامه مطلب

تحلیل مولفه اساسی (PCA)

نوشته شده توسط مهدی مقیمی

تحلیل مولفه اساسی یا (Principal Component Analysis – PCA) یک روش آماری معروف است که کاربردهای فرواوانی دارد از جمله کاهش ابعاد. این الگوریتم در پیش پردازش داده های مربوط به پردازش سیگنال, شبکه های عصبی و پردازش صوت بسیار پر کاربرد است. این الگوریتم ارتباط نزدیکی با eigenvalue decomposition و single value decomposition دارد که مربوط… مشاهده ادامه مطلب

پردازش صوت

نحوه تولید گفتار

اثر دوپلر در سیگنالهای صوتی

پیش تاکید کردن صوت

انواع نویز صوتی در پردازش گفتار

آنالیز کپسترال (Cepstral analysis)

مقدمات کار با صوت در متلب

ضرایب پیشگوئی خطی (LPC)

تحلیل مولفه اساسی (PCA)

متعادل سازی هیستوگرام

سیگنال های ایستا و غیر ایستا(Stationary and Non-Stationary Signals)

ضرایب پیشگوئی خطی (LPC)

فریم بندی سیگنال صوت

برنامه شناسایی ارقام دستنویس فارسی با شبکه عصبی پرسپترون

تغییر فونت و اندازه آن در متلب

برنامه متلب ضبط صدا از میکروفون و ذخیره آن

نمایش چند شکل در یک شکل

برنامه خوشه‌بندی با k-میانگین

ریخت شناسی و عملیات فرسایش (Erosion)

نامگذاری شکلها و نمودارها در متلب (دستورات title، legend)

برنامه تخمین تابع با شبکه عصبی پرسپترون چند لایه

بازی تیراندازی با متلب

سیگنال های ایستا و غیر ایستا(Stationary and Non-Stationary Signals)

عملگرهای ریاضی و دسترسی به عناصر یک بردار در متلب