دسته بندی | برق |
فرمت فایل | docx |
حجم فایل | 4536 کیلو بایت |
تعداد صفحات فایل | 104 |
یکی از موضوعات مهم پردازش سیگنال) به عنوان مثال در سیستمهای ارتباطی، کدینگ سیگنالهای صوتی، تشخیص صوت (…، کاهش و حذف نویز ناخواسته از سیگنال اصلی و بهبود آن است. به همین منظور در دهه های گذشته تحقیقات گسترده ای برای بهسازی گفتار انجام شده است. بهسازی گفتار بسته به مساله، هدف آن، ویژگی های نویز و امکانات موجود، قابل بررسی است. از این رو، روش های متفاوتی برای طبقهبندی سیستمهای بهسازی گفتار وجود دارد، یکی از طرق تفکیک روشها بر اساس تککاناله و چندکاناله بودن می باشد. روش های یک کاناله که تنها یک میکروفون ورودی در دسترس دارند، متداولترین نوع الگوریتمهای بلادرنگ میباشند چرا که به سادگی قابل پیادهسازی هستند و به طور نسبی هزینه آنها کمتر از سیستمهایی با چند کانال ورودی میباشد. از خانواده ی روش های تک کاناله، میتوان به روش های تفریق طیفی ، فیلتر وینر، بهسازی گفتار با استفاده از مدل های آماری، تبدیل موجک و ... اشاره کرد که هر کدام از این روش ها دارای معایب نظیر نویز موزیکال و اعوجاج و پیچیدگی ... می باشند یکی از روش هایی که میتوان عیب این روش ها را بهبود بخشید، استفاده از سیستم های ترکیبی است که از ترکیب روش ها حاصل می شود.
در این پایاننامه دو روش ترکیبی جدید بر مبنای روش تک کاناله برای بهسازی گفتار پیشنهاد شده است. در ضمن عموما برای اندازهگیری مشخصات نویز از بخشهای غیر گفتار (سکوت) که معمولا از پنجره اول سیگنال است، استفاده می شود. ضعف شدید این روش هنگامی آشکار میشود که فریم اول، یک فریم سکوت نباشد. در این پایان نامه روش جدیدی نیز برای بر طرف کردن این عیب پیشنهاد شده است که این روش ها به شرح زیر می باشند:
الف)روش پیشنهادی تخمین نویز: تخمین نویز با استفاده از آنالیز LPC صورت گرفته است و در هر دو روش پیشنهادی زیر از این روش برای تخمین نویز استفاده شده است.
ب) روش پیشنهادی اول: بهسازی سیگنال های صوتی با استفاده از الگوریتم ژنتیک و آنالیز LPC در روش تفریق موجک، از ترکیب روش های تفریق طیفی و تبدیل موجک حاصل شده و تخمین نویز آن هم که توسط آنالیز LPC صورت گرفته است با الگوریتم ژنتیک بهبود یافته است.
پ) روش پیشنهادی دوم: بهسازی سیگنال های صوتی با استفاده از روش میانگین خطای مربعات در فضای موجک، از ترکیب دو روش تبدیل موجک و کمینه کردن لگاریتم خطای میانگین مربعات(LOG-MMSE) حاصل شده است. در این روش با استفاده از تبدیل فوریه ضرایب موجک سیگنال گفتار آغشته به نویز و سیگنال نویز، تخمین زننده ی لگاریتمی بر مبنای کمترین خطای میانگین مربعات پیشنهاد شده است.
در این رساله معیار ارزیابی ، معیارهای مهم نسبت سیگنال به نویز(SNR) و تست شنوایی(MOS) بوده است. با توجه به نتایج، این روش ها هم از لحاظ کیفی و هم از لحاظ کمی عملکرد بهتری داشته اند و توانسته اند SNR و MOS و اعوجاج و نویز موزیکال را بهبود ببخشند.