Almo Data Mining |
Handbuch
Das Handbuch zum Almo-Data-Mining umfasst 444 Seiten. Sie besitzen es
nachdem Sie Almo herunter geladen haben
Eine etwas gekürzte aber
überarbeitete Version ist unter dem Titel
"Statistische Datenanalyse I"
und II vorhanden. Die beiden Dokumente
sind unter Handbücher
herunterladbar.
Sie können sich so über die Möglichkeiten, die das
Almo-Data-Mining
bietet, informieren.
"Data Mining" heißt in Almo,
Zusammenhänge zwischen Variablen
und
Zusammengehörigkeiten zwischen Untersuchungseinheiten
entdecken.
Wir versprechen Ihnen also nicht, dass Sie Ihre Daten oben in Almo reinwerfen
und unten kommen die Ergebnisse heraus !!!
Das Almo-Data-Mining-System hat sich inzwischen zu einem
Standard-Auswertungs-System
für Daten jeglichen Umfangs entwickelt.
Zusammenhänge zwischen Variablen entdecken wir im Almo-Data-Mining-System
im wesentlichen durch das "Allgemeine Lineare Modell" (ALM) und die
"Logitanalyse".
Zusammengehörigkeiten zwischen Untersuchungseinheiten (z.B.
befragten Personen) entdecken
wir durch die Clusteranalyse.
Der Data-Mining-Prozess verläuft in Almo in folgenden Schritten:
Kapitel 1: Eine Almo-Arbeitsdatei erstellen
Schritt 1a: Daten aus anderen Systemen (z.B. aus Excel) nach Almo
übertragen
und daraus eine Almo-Arbeitsdatei erstellen
Schritt 1b: Oder: Daten, die im Format FREI ( bzw. ASCII) oder FIX vorliegen
in eine Almo-Arbeitsdatei schreiben
Kapitel 2: Daten kennenlernen
Schritt 2: Daten anschauen und in einer "schönen" Form ausgeben
Schritt 3: Kennwerte der Variablen anschauen (Mittelwerte, Mediane, Streuungen,
Zahl der fehlenden Werte etc.)
Schritt 4: Variable auszählen
Kapitel 3: Daten bereinigen (Daten-Imputation)
Schritt 5a: Mittelwerte oder Mediane oder Erwartungswerte für fehlende Werte einsetzen.
Schritt 5b: Oder: Prognosewerte für fehlende Werte mit Hilfe des Allgemeinen
Linearen Modells einsetzen
Schritt 5c: Prognosewerte für fehlende Werte bei nominalen Variablen mit Hilfe
der Logitanalyse einsetzen
Schritt 5d: "Multiple Imputation"
Bei diesen vier Verfahren kann der jeweils gefundene Ersatzwertwert für
den fehlenden Wert
zufallsüberlagert werden.
Kapitel 4: Dateien vereinen (Daten-Fusion)
Schritt 6a: Dateien mit Hilfe des Allgemeinen Linearen
Modells fusionieren
Schritt 6b: Dateien (bei nominalen Variablen) mit Hilfe der
Logitanalyse fusionieren
Kapitel 5: Mehrere Variable zu einer Messung kombinieren
Schritt 7a: Aus mehreren Variablenwerten einen Gesamtpunktwert bilden
Schritt 7b: Mit Faktorenanalyse die Faktorenstruktur einer Variablenmenge
entdecken und Faktorwerte bilden
Schritt 7c: Mit Rasch-Skalierungsverfahren aus mehreren Variablen einen Messwert bilden
Kapitel 6: Zusammenhänge zwischen Variablen "blind" suchen
Schritt 8: Variable miteinander korrelieren: Jede Variable mit jeder anderen
oder nur ausgewählte Variable. Die Korrelationskoeffizienten werden abhängig
von ihrem Messniveau (nominal, ordinal, quantitativ) berechnet.
Kapitel 7: Einzelne Zusammenhänge "gezielt" suchen
Schritt 9: Variable zwei- und beliebieg-dimensional tabellieren (OLAP)
Schritt 10: Streudiagramm für zwei oder drei Variable (mit Regressionsgerade
bzw. -ebene)
Kapitel 8: Mehrfach-Zusammenhänge "gezielt" untersuchen
Schritt 11a: Ursachen für die Zielvariable mit dem Allgemeinen Linearen Modell
(ALM) finden
Schritt 11b: Alternative wenn Zielvariable nominal: Gewichtetes ALM
Schritt 11c: Alternative wenn Zielvariable nominal: Logitanalyse
Kapitel 9: Prognose leisten
Schritt 12a: Werte für Zielvariable mit ALM prognostizieren
Schritt 12b: Werte für nominale Zielvariable mit Logitanalyse prognostizieren
Kapitel 10: Zusammengehörigkeiten zwischen Objekten suchen
Schritt 13: Typen von Objekten (z.B. Befragten) mit Clusteranalyse bilden
Kapitel 11: Ursachen für die Clusterzugehörigkeit
Schritt 14a: Ursachen für die Clusterzugehörigkeit mit ALM entdecken
Schritt 14b: Ursachen für die Clusterzugehörigkeit mit Logit-Analyse
entdecken
Bedienung
Das Almo-Data-Mining-System ist über Dialogboxen einfach zu bedienen. Viele
Programmparameter
sind voreingestellt, so daß dem Benutzer schwierige Entscheidung abgenommen
werden.
Der Spezialist kann aber auch sehr komplexe Analysen rechnen.
Ausgabe der Ergebnisse
Der Benutzer kann bei vielen der oben in Schritt 1 bis 14 angebenen
Programme die Ausgabe
der Ergebnisse steuern. Er kann über mehrere Stufen die Komplexität und
Vollständigkeit der
Ausgabe festlegen.
Grafik
Viele der Ergebnisse werden zusätzlich grafisch dargestellt. Der Benutzer
kann die Grafiken
vielfältig editieren. Alle Grafiken können gestochen scharf ausgedruckt werden
und auch
in Textdokumente (Forschungsberichte) eingefügt werden.
Handbuch
Im Handbuch werden, die oben vorgestellten 14 Schritte des Data-Mining-Prozesses ausführlich
(auf 444 Seiten) erläutert. Es ist so geschrieben, daß es auch vom
"Nicht-Hauptfach-Statistiker"
begriffen wird. Für alle 14 Schritte werden typische Beispiele gerechnet. Die
Eingaben, die der
Benutzer dabei vornehmen muß, werden erklärt und die Ergebnisse herunter bis
zu den kleinsten
Details ausführlich kommentiert.