Sisu
Põhikomponentide analüüs vähendab muutujate kogumit, mis on korrelatsioonis väiksema hulga korrelatsioonita muutujatega, lihtsustades hilisema analüüsi jaoks keerulist andmekogumit. Seda keerulist statistilist protseduuri saab teostada paljude andmeanalüüsi programmide või lisaprogrammide abil, mis laiendavad sama võimet, lisades uusi funktsioone.
Arvutustabeli programmid, nagu näiteks Excel, võivad laienduse abil teostada põhikomponentide analüüsi (Pilt Flickr.comilt, Casey Serini poolt)
Andmebaasi lihtsustamine
Põhikomponentide analüüs on andmete uurimise ja vähendamise tehnika. Analüütik võib seda tehnikat kasutada asjakohase teabe kogumiseks suurest ja segadust andmestikust. Seda meetodit kasutatakse tavaliselt, kui täheldatud muutujate arv on väga suur ja nende vahelised korrelatsioonid muudavad andmed otse analüüsitavaks. Näiteks võib mõnel juhul muutujate vaheline korrelatsioon tekitada vale mulje andmete koondamisest, tehes tehnilise analüüsi keeruliseks või kahjustades andmete hindamist. Põhikomponentide analüüs lihtsustab neid väljendavaid muutujaid väiksema arvu elementide, põhikomponentide funktsioonina, mis moodustavad suurema osa andmete mõõtmiste erinevustest.
Kasutage programmis
Põhikomponentide analüüsimise keerukus nõuab konkreetse programmi kasutamist. Statistikaprogramme on väga erinevaid ja enamik neist on võimelised seda tehnikat täitma. Kõige populaarsemad programmid on SAS, Stata ja SPSS. Neid eriprogramme kasutavad ülikoolid, uurimiskeskused, konsultatsiooniorganisatsioonid ja teised teadustöötajad. Kõik kolm saavad teostada töölehele sisestatud andmestiku põhikomponentide analüüsi, kus read esindavad individuaalseid vaatlusi ja veerud esindavad eraldi muutujaid.
Omadused
Enamik peamisi komponentide analüüsi tarkvara, sealhulgas SAS, Stata ja SPSS, esitavad tulemused tabelite kujul, mis sisaldavad omaväärtusi või variatsioonimeetmeid. Paljud programmid annavad ka tulemuste visuaalse kuvamise kiigelaua kujul.
Kaalutlused
Põhikomponentide analüüs on sageli segi aetud faktori analüüsiga, teine andmete vähendamise tehnikaga, mis selgitab seostatud tähelepanekuid aluseks olevate tegurite osas. Need kaks on tegelikult erinevad protseduurid, kuigi põhikomponentide analüüs on faktoranalüüsi samm. Paljud paketid ühendavad siiski kaks menetlust.
Teine oluline kaalutlus on, et sellised eriprogrammid nagu SAS, SPSS ja Stata on kallid. Seetõttu ei pruugi need programmid olla kasulikud inimestele, kes ei kavatse statistilisi analüüse sageli läbi viia.
Excel
Inimesed, kes vajavad statistilist analüüsi, kuid ei soovi osta spetsiaalset programmi, võivad küsida, kas laialdaselt kasutatavad arvutustabeli programmid, näiteks Excel, on võimelised tegema põhikomponendi analüüsi. Vastus on jah ja ei. Kuigi Excelis on mõned analüüsiandmed, mis võivad olla kättesaadavad statistilise analüüsi paketi installimisest, ei ole programm mõeldud statistilise analüüsi programmiks. Põhikomponentide analüüs ja faktoranalüüs ei kuulu andmete analüüsivahendi funktsioonide hulka.
Ennetamine / lahendus
On olemas programm, mida kasutajad saavad alla laadida ja installida, et parandada Exceli funktsioone andmeanalüüsi vahendina. Analüüsiprogrammidele spetsialiseerunud tarkvarafirma Addinsoft on loonud XLSTATi. See programm võimaldab Excelil teostada põhikomponentide analüüsi ja muid statistilisi protseduure. Sellel on ka kasutajasõbralikud protseduurid, mis võimaldavad kasutajal analüüsimiseks andmeid valida lihtsalt klõpsates ja lohistades vajalikke väljad. Kasutajad saavad XLSTATi osta ja alla laadida Addinsofti veebisaidilt. Samuti on tasuta versioon, mida kasutajad saavad proovida enne, kui nad otsustavad selle osta.