هدف اصلی این ارائه آشنایی دانشجویانی که به این بحث علاقه بسیاری دارند ولی دانش پایه ندارند و یا نمی دانند از کجا شروع کنند می باشد. گرچه در این ارائه هیچ نو آوری دیده نمیشود ولی فکر میکنم برای باز شدن ذهن دانشجویان در زمینه پردازش زبان طبیعی انشالله موثر خواهد بود. این ارائه شامل مطالبی جهت شناخت اصطلاحات و اطلاعات پیش نیاز اصوات و روش های دریافت صوت و همچنین پردازش و تشخیص آن می باشد. همچنین پیاده سازی پروژه نیز در بستر دات نت بدون استفاده از هیچ گونه ابزار جانبی انجام شده است. تا جای ممکن سعی شده تا مطالب با بیانی ساده آماده شوند و از همه مهمتر از عنوان مطالب ریاضی و آمار اجتناب شده است. به احتمال زیاد دوستان و اساتید اشکالات و کاستی های بسیار زیادی در این پایان نامه خواهند یافت که پیشاپیش از این بابت عذر خواهی نموده و از آنان درخواست یاری دارم. لطفا قبل به اجرا در آوردن فایلهای اجرایی نگاهی به مستندات بیندازید. از انجایی که دریافت نمونه های صوتی از طریق Direct Sound صورت گرفته، ممکن است که نگارش آن با نگارش موجود در رایانه شما مقایرت داشته باشد و در اجرا به مشکل مواجه شوید.
بخش آموزش شامل مباحث :
- انواع نمودار های ترسیم صدا (دامنه زمان، دامنه فرکانس یا اسپکتروم و اسپکتروگرام)
- صداهای هنچار و ناهنجار
- انواع موج ها
- دستگاه شنواییی و تکلم انسان
- نمونه گیری صوتی
- تبدیل سریع فوریه (FFT)
- طول پنجره در تبدیل فوریه
- توابع پنجره (Window Function)
- باند پهن و باند باریک (Wide Band و Narrow Band)
- فرکانس پایه و سازنده (Fundamental Frequency و Formants)
- fft bin
- تشخیص صدا، تشخیص حروف، حروف صدا دار و بی صدا
- تشخیص زیری و بمی صدا
- جداسازی (Segmentation)
- تشخیص صحبت و سکوت
- نرخ عبور از صفر (ZCR)