Principal Component Analysis (PCA)

Forfatter: Roger Morrison
Oprettelsesdato: 22 September 2021
Opdateringsdato: 19 Juni 2024
Anonim
StatQuest: Principal Component Analysis (PCA), Step-by-Step
Video.: StatQuest: Principal Component Analysis (PCA), Step-by-Step

Indhold

Definition - Hvad betyder Principal Component Analysis (PCA)?

Principal component analysis (PCA) er en teknik, der anvendes til identifikation af et mindre antal ukorrelerede variabler kendt som hovedkomponenter fra et større datasæt. Teknikken er vidt brugt til at understrege variation og fange stærke mønstre i et datasæt. Opfundet af Karl Pearson i 1901 er analyse af hovedkomponenter et værktøj, der bruges i forudsigelige modeller og efterforskende dataanalyse. Hovedkomponentanalyse betragtes som en nyttig statistisk metode og bruges inden for områder som billedkomprimering, ansigtsgenkendelse, neurovidenskab og computergrafik.


En introduktion til Microsoft Azure og Microsoft Cloud | Gennem denne vejledning lærer du, hvad cloud computing handler om, og hvordan Microsoft Azure kan hjælpe dig med at migrere og drive din virksomhed fra skyen.

Techopedia forklarer Principal Component Analysis (PCA)

Hovedkomponentanalyse hjælper med at gøre data lettere at udforske og visualisere. Det er en simpel ikke-parametrisk teknik til at udtrække oplysninger fra komplekse og forvirrende datasæt. Hovedkomponentanalyse er fokuseret på den maksimale variansmængde med færrest antal hovedkomponenter. En af de adskilte fordele forbundet med den vigtigste komponentanalyse er, at når først mønstre findes i de pågældende data, understøttes også komprimering af data. Man bruger den vigtigste komponentanalyse til at eliminere antallet af variabler, eller når der er for mange prediktorer sammenlignet med antallet af observationer eller for at undgå multicollinearity. Det er tæt forbundet med kanonisk korrelationsanalyse og gør brug af ortogonal transformation for at konvertere det sæt observationer, der indeholder korrelerede variabler, til et sæt værdier kendt som hovedkomponenter. Antallet af hovedkomponenter, der bruges i analyse af hovedkomponenter, er mindre end eller lig med det færre antal observationer. Hovedkomponentanalyse er følsom over for den relative skalering af de oprindeligt anvendte variabler.


Hovedkomponentanalyse er vidt brugt på mange områder, såsom markedsundersøgelser, samfundsvidenskab og i brancher, hvor der bruges store datasæt. Teknikken kan også hjælpe med at give et lavere-dimensionelt billede af de originale data. Kun minimal indsats er nødvendig i tilfælde af hovedkomponentanalyse for at reducere et komplekst og forvirrende datasæt til et forenklet nyttigt informationssæt.