Hauptkomponentenanalyse-Software

Autor: Lewis Jackson
Erstelldatum: 7 Kann 2021
Aktualisierungsdatum: 12 Kann 2024
Anonim
StatQuest: PCA main ideas in only 5 minutes!!!
Video: StatQuest: PCA main ideas in only 5 minutes!!!

Inhalt

Die Analyse der Hauptkomponenten reduziert einen Satz von Variablen, der mit einem kleineren Satz von nicht korrelierten Variablen korreliert ist, wodurch ein komplexer Datensatz für die spätere Analyse vereinfacht wird. Dieses komplexe statistische Verfahren kann von vielen Programmen zur Datenanalyse oder von Zusatzprogrammen durchgeführt werden, die die Fähigkeiten derselben erweitern und neue Funktionen hinzufügen.


Tabellenkalkulationsprogramme wie Excel können mithilfe einer Erweiterung wichtige Komponentenanalysen durchführen (Bild von Flickr.com, mit freundlicher Genehmigung von Casey Serin)

Vereinfachung eines Datensatzes

Die Analyse der Hauptkomponenten ist eine Technik zur Untersuchung und Reduktion von Daten. Ein Analytiker kann die Technik verwenden, um relevante Informationen aus einer großen und verwirrenden Datenmenge zu extrahieren. Die Technik wird häufig verwendet, wenn die Anzahl der beobachteten Variablen sehr groß ist und die Korrelationen zwischen ihnen die direkte Analyse der Daten erschweren. In einigen Fällen kann beispielsweise die Korrelation zwischen den Variablen einen falschen Eindruck von Datenredundanz erzeugen, was die technische Analyse erschwert oder die Auswertung der Daten beeinträchtigt. Die Analyse der Hauptkomponenten vereinfacht die Variablen, die sie als Funktion einer kleineren Anzahl von Elementen ausdrücken, der Hauptkomponenten, die den Großteil der Schwankungen bei den Messungen der Daten ausmachen.


Im Programm verwenden

Die Komplexität der Analyse der Hauptkomponenten erfordert die Verwendung eines spezifischen Programms. Es gibt eine Vielzahl von statistischen Programmen, von denen die meisten diese Technik ausführen können. Die beliebtesten Programme sind SAS, Stata und SPSS. Universitäten, Forschungszentren, Beratungsorganisationen und andere Forschungsexperten nutzen diese spezifischen Programme. Alle drei können eine Hauptkomponentenanalyse eines in ein Arbeitsblatt eingefügten Datasets durchführen, bei dem die Zeilen die einzelnen Beobachtungen und die Spalten die einzelnen Variablen darstellen.

Eigenschaften

Die meisten gängigen Softwareprogramme für die Komponentenanalyse, einschließlich SAS, Stata und SPSS, präsentieren die Ergebnisse in Form von Tabellen, die die Eigenwerte oder die erläuterten Varianzmaße enthalten. Viele Programme bieten auch die visuelle Darstellung der Ergebnisse in Form eines Scree-Plots.


Überlegungen

Die Hauptkomponentenanalyse wird oft mit der Faktoranalyse verwechselt, einer anderen Methode der Datenreduktion, die korrelierte Beobachtungen in Bezug auf zugrunde liegende Faktoren erklärt. Beide sind eigentlich getrennte Verfahren, obwohl die Analyse der Hauptkomponenten ein Schritt der Faktorenanalyse ist. Viele Pakete kombinieren jedoch beide Verfahren.

Ein weiterer wichtiger Gesichtspunkt ist, dass spezialisierte Programme wie SAS, SPSS und Stata teuer sind. Daher sind diese Programme möglicherweise nicht für Personen geeignet, die nicht häufig statistische Analysen durchführen möchten.

Excel

Personen, die statistische Analysen durchführen müssen, aber kein spezielles Programm erwerben möchten, fragen sich möglicherweise, ob weit verbreitete Tabellenkalkulationsprogramme wie Excel eine Analyse der Hauptkomponenten durchführen können. Die Antwort lautet ja und nein. Excel verfügt zwar über einige Datenanalysetools, auf die möglicherweise durch die Installation eines Pakets für statistische Analysen zugegriffen werden kann, das Programm ist jedoch nicht als statistisches Analyseprogramm gedacht. Hauptkomponentenanalyse und Faktoranalyse gehören nicht zu den Funktionen des Datenanalyse-Tools.

Prävention / Lösung

Es gibt ein Programm, das Benutzer herunterladen und installieren können, um die Funktionen von Excel als Datenanalysetool zu verbessern. Addinsoft, ein auf Analyseprogramme spezialisiertes Softwareunternehmen, hat XLSTAT entwickelt. Dieses Programm ermöglicht es Excel, Hauptkomponentenanalysen und andere statistische Verfahren durchzuführen. Es verfügt auch über benutzerfreundliche Verfahren, mit denen der Benutzer die zu analysierenden Daten auswählen kann, indem er einfach eine Zelle anklickt und durch die erforderlichen Felder zieht. Benutzer können XLSTAT von der Addinsoft-Website kaufen und herunterladen. Es gibt auch eine kostenlose Version, die Benutzer ausprobieren können, bevor sie sich zum Kauf entscheiden.