شکل ۱-۱۰- دیاگرام کلی سیستم حذف کننده وفقی نویز
عامل اصلی که برای سازگار کردن این ضرایب به کار می رود، مینیمم کردن مربع متوسط انرژی[۴۰] خروجی کلی است. محدوده تحقیقات در حوزه فیلترهای وفقی بسیار گسترده است و در این زمینه چندین کتاب ]۱۰[ و مقالات بسیاری ]۱۱[ ]۴۰[ منتشر شده است.
فصل دوم
مروری بر روش های تفریق طیفی
در این فصل به مروری بر روش های بهسازی گفتار می پردازیم که پردازش را در دامنه طیفی زمان کوتاه[۴۱] انجام می دهند. این تکنیک ها سعی می کنند تا سیگنال آغشته به نویز را با تفریق تخمینی از نویز، بهبود دهند. دامنه خاصی که عملیات تفریق نویز تخمینی از سیگنال آغشته به نویز انجام می شود، به روش های مختلفی منجر می شود. مشهورترین آنها تفریق طیفی[۴۲] است که آسان ترین و قدیمی ترین روش می باشد.
روش های دامنه طیفی زمان کوتاه، پردازش هایش را روی اندازه طیف انجام می دهد. فرایند بهسازی روی فریم ها با گرفتن اندازه و فاز طیف گفتار نویزی انجام می شود. این عمل با تفریق اندازه طیف نویز تخمین زده شده از اندازه طیف گفتار انجام می شود و سپس تبدیل عکس، روی اندازه طیفی حاصل همراه با فاز گفتار اولیه آغشته به نویز، گرفته می شود.
۲-۱- تفریق طیفی
تفریق طیفی یک تکنیک بر مبنای تخمین مستقیم اندازه طیفی زمان کوتاه[۴۳] می باشد. در این روش، گفتار به صورت یک فرایند اتفاقی مدل می شود که به آن نویز تصادفی ناهمبسته[۴۴] اضافه می شود. فرض بر این است که نویز در بازه زمان کوتاه ایستا[۴۵] می باشد. اطلاعات نویز از فریم سکوت (در تک کاناله[۴۶]) یا از یک کانال مرجع (در دوکاناله[۴۷]) تخمین زده می شود. طیف قدرت نویز تخمین زده شده از سیگنال نویز ورودی کم می شود.
فرض کنیم y , d , s به ترتیب بیانگر گفتار، نویز و گفتار نویزی باشند. فرض می شود که فرایند d ناهمبسته است (نویز سفید) و تابع خود همبستگی[۴۸] آن به صورت زیر است:
(۲-۱) |
که در آن m شماره پنجره و ثابت است. دقت کنید که از سه فرایند تصادفی، فقط d را می توان ایستا[۴۹] فرض کرد. s(n) و d(n) و y(n) مطابق رابطه زیر به هم مربوطند:
(۲-۲) |
در ابتدا با این فرض که s و بنابراین y فرآیندهای ایستا هستند، شروع می کنیم. چون d یک فرایند ناهمبسته است و s و d نسبت به هم نا همبستهاند، خواهیم داشت:
(۲-۳) |
که چگالی طیف قدرت[۵۰] (PDS) فرایند تصادفی y است. واضح است که با داشتن و تخمین از (که آنرا می نامیم) به راحتی می توان PDS گفتار تمیز را محاسبه کرد:
(۲-۴) |
اگر چه از نظر تئوری این بحث جالب است، اما اهمیت کاربردی این آنالیز قابل ملاحظه نیست، چرا که در عمل با سیگنال های واقعی روی فریمهای زمانی کوتاه سر و کار داریم. با این وجود، این روش چگونگی به کارگیری تفریق طیفی[۵۱] را جهت حذف نویز عنوان می کند. آسانی روش نیز مشهود است.
اکنون می خواهیم کمی واقع گرا باشیم و فرض ایستایی روی y , s را حذف کنیم. با توجه به آنکه در بهترین شکل s(n) در گستره های زمانی کوتاه ایستایی محلی[۵۲] دارد یک فریم از y(n) به نام Fy(n;m) که در زمان m خاتمه می یابد، انتخاب می کنیمFy(n;m)=y(n)w(n-m) به این ترتیب فریم انتخاب شده را می توان بر حسب فریم های نویز و سیگنال گفتار تمیز نوشت: