تحلیل مولفه اساسی یا (PCA (Principle Component Analysis یک روش برای کاهش ابعاد ویژگی است که در این روش سعی میکنیم با قرار دادن محور مختصات در جهتی که بیشترین واریانس داده را داریم ویژگی ها را کاهش دهیم.
دلایل زیادی برای کاهش بعد داده ها وجود دارد اما به هر دلیلی که بخواهید کاهش بعد را انجام دهید یکی از مرسوم ترین روش های انجام این کار روش PCA است. در این نوشتار سعی شده تا حد ممکن روش PCA بصورت کامل معرفی و نحوه ی استفاده از آن در تئوری و عمل بیان شود.
دلایل زیر را مینوان برای کاهش ویژگی برشمرد:
- سرعت الگوریتم ها با داده های با بعد کمتر بیشتر می شود
- فضای ذخیره سازی کمتری نیاز است
- احتمال overfitting کاهش می یابد و بنابراین قدرت تعمیم الگوریتم های یادگیر بیشتر می شود
- برای ترسیم و بدست آوردن درکی از مجموعه داده ها گاهی بعد داده ها را به دو یا سه بعد تقلیل می دهند تا بتوانند نموداری از داده های با ابعاد زیاد ترسیم کنند.