Оглавление:
- Определение - Что означает анализ основных компонентов (PCA)?
- Techopedia объясняет анализ основных компонентов (PCA)
Определение - Что означает анализ основных компонентов (PCA)?
Анализ основных компонентов (PCA) - это метод, используемый для идентификации меньшего числа некоррелированных переменных, известных как основные компоненты из большого набора данных. Техника широко используется для выделения вариаций и захвата сильных паттернов в наборе данных. Изобретенный Карлом Пирсоном в 1901 году, анализ основных компонентов является инструментом, используемым в прогнозных моделях и разведочном анализе данных. Анализ основных компонентов считается полезным статистическим методом и используется в таких областях, как сжатие изображений, распознавание лиц, нейробиология и компьютерная графика.
Techopedia объясняет анализ основных компонентов (PCA)
Анализ основных компонентов помогает упростить изучение и визуализацию данных. Это простой непараметрический метод извлечения информации из сложных и запутанных наборов данных. Анализ основных компонентов сфокусирован на максимальной величине отклонения с наименьшим количеством основных компонентов. Одно из явных преимуществ, связанных с анализом главных компонентов, заключается в том, что как только в соответствующих данных обнаруживаются шаблоны, также поддерживается сжатие данных. Один из них использует анализ главных компонентов, чтобы исключить количество переменных или когда существует слишком много предикторов по сравнению с количеством наблюдений или чтобы избежать мультиколлинеарности. Он тесно связан с каноническим корреляционным анализом и использует ортогональное преобразование для преобразования набора наблюдений, содержащих коррелированные переменные, в набор значений, известных как главные компоненты. Количество главных компонентов, используемых в анализе главных компонентов, меньше или равно меньшему количеству наблюдений. Анализ основных компонентов чувствителен к относительному масштабированию первоначально используемых переменных.
Анализ основных компонентов широко используется во многих областях, таких как исследования рынка, социальные науки и в отраслях, где используются большие наборы данных. Техника также может помочь в предоставлении более мелкой картины исходных данных. Только минимальные усилия требуются в случае анализа основных компонентов для сокращения сложного и запутанного набора данных в упрощенный набор полезной информации.