Principal komponent analyse reducerer et sæt korrelerede variable til et mindre sæt ukorrelerede variable , forenkle en kompleks datasæt til yderligere undersøgelse . Denne komplekse statistiske procedure kan udføres af mange data analyse software -programmer eller ved add-on programmer, der udvider de evner af nogle af de eksisterende softwarepakker. Forenkling af datasæt
Principal komponent analyse er en data udforskning og reduktion teknik, analytikere bruger til at udtrække de vigtigste oplysninger fra store, forvirrende datasæt. Analytikere bruger principal komponent analyse, når de har et stort antal af observerede variable , der gør et datasæt synes uhåndterlig . Ofte er mange af de variabler korreleret , hvilket gør dataene synes overflødig. Principal komponent analyse forenkler data ved at udtrykke disse variabler i form af et mindre antal underliggende strukturer (kendt som hovedkomponenter ), der tegner sig for størstedelen af variansen i foranstaltningerne.
Software Brugt stabler
kompleksitet principal komponent analyse kræver brug af et program. En række statistiske programmer eksisterer, og de fleste af dem er i stand til at lede principal komponent analyse . Den mest udbredte softwarepakker til statistisk analyse omfatter SAS, Stata og SPSS . Universiteter , forskningscentre, konsulentfirmaer organisationer og andre forskningsinstitutioner fagfolk bruger disse specialiserede softwareprogrammer. Alle tre programmer kan foretage principal komponent analyse på et sæt af data indtastet i et regneark , hvor rækkerne repræsenterer enkelte observationer og søjlerne repræsenterer separate variabler.
Funktioner
fleste softwareprogrammer til principal komponent analyse , herunder SAS, Stata og SPSS , vil vise resultaterne af principal komponent analyse i tabelform , der omfatter egenværdier , eller foranstaltninger med forklaret variation. Mange programmer vil også give visuel visning af resultaterne i form af en urer plot.
Overvejelser
Principal komponent analyse er undertiden forveksles med faktoranalyse , en anden datareduktion teknik, der forklarer korreleret observationer i form af underliggende faktorer . De to er faktisk forskellige procedurer , selv om principal komponent analyse er et skridt i faktoranalyse . Men mange softwarepakker kombinere de to procedurer .
Anden vigtig overvejelse er , at specialiserede softwarepakker såsom SAS, SPSS og Stata er dyre at købe. Derfor kan disse programmer ikke være nyttigt for folk , der ikke planlægger at foretage hyppige statistiske analyser .
Excel
Folk, der har brug for at foretage nogle statistiske analyser , men ville foretrække ikke at købe et specialiseret program , kan spørge, om almindeligt tilgængelige regnearksprogrammer såsom Excel , er i stand til at gennemføre principal komponent analyse . Svaret er ja og nej. Selvom Excel har nogle dataanalyse kapaciteter , som en bruger kan få adgang ved at installere analyseværktøjet add -in, blev programmet ikke primært er tænkt som en statistisk analyse program. Principal komponent analyse og faktoranalyse ikke er blandt de funktioner i dataanalyse værktøj.
Forebyggelse /Solution
p Der er et program , som brugerne kan downloade og installere for at forbedre Excels funktioner som et redskab for dataanalyse . Addinsoft , et software firma, der specialiserer sig i analytiske programmer. XLStat giver Excel til at foretage principal komponent analyse og andre procedurer. Programmet har de samme brugervenlige procedurer, som giver brugerne mulighed for at vælge de data til at analysere ved blot at klikke på en celle og trække på tværs af felter . Brugere kan købe og downloade XLStat fra Addinsoft hjemmeside. Der er også en gratis prøveversion , som brugerne kan afprøve før de beslutter at købe det.