Almo Data Mining

Handbuch
Das Handbuch zum Almo-Data-Mining umfasst 444 Seiten. Sie besitzen es
nachdem Sie Almo herunter geladen haben

Eine etwas gekürzte aber überarbeitete Version ist unter dem Titel
 "Statistische Datenanalyse I" und II vorhanden. Die beiden Dokumente
sind unter Handbücher herunterladbar.
 
Sie können sich so über die Möglichkeiten, die das Almo-Data-Mining
bietet, informieren.

"Data Mining" heißt in Almo,
                Zusammenhänge zwischen Variablen
                und
                Zusammengehörigkeiten zwischen Untersuchungseinheiten
entdecken.
Wir versprechen Ihnen also nicht, dass Sie Ihre Daten oben in Almo reinwerfen
und unten kommen die Ergebnisse heraus !!!

Das Almo-Data-Mining-System hat sich inzwischen zu einem 
                Standard-Auswertungs-System
für Daten jeglichen Umfangs entwickelt.

Zusammenhänge zwischen Variablen entdecken wir im Almo-Data-Mining-System
im wesentlichen durch das "Allgemeine Lineare Modell" (ALM) und die "Logitanalyse".

Zusammengehörigkeiten zwischen Untersuchungseinheiten (z.B. befragten Personen) entdecken
wir durch die Clusteranalyse.

Der Data-Mining-Prozess verläuft in Almo in folgenden Schritten:

Kapitel 1: Eine Almo-Arbeitsdatei erstellen
Schritt 1a: Daten aus anderen Systemen (z.B. aus Excel) nach Almo übertragen
                und daraus eine Almo-Arbeitsdatei erstellen
Schritt 1b: Oder: Daten, die im Format FREI ( bzw. ASCII) oder FIX vorliegen
                in eine Almo-Arbeitsdatei schreiben

Kapitel 2: Daten kennenlernen
Schritt 2: Daten anschauen und in einer "schönen" Form ausgeben
Schritt 3: Kennwerte der Variablen anschauen (Mittelwerte, Mediane, Streuungen, Zahl der fehlenden Werte etc.)
Schritt 4: Variable auszählen

Kapitel 3: Daten bereinigen (Daten-Imputation)
Schritt 5a: Mittelwerte oder Mediane oder Erwartungswerte für fehlende Werte einsetzen.
Schritt 5b: Oder: Prognosewerte für fehlende Werte mit Hilfe des Allgemeinen Linearen Modells einsetzen
Schritt 5c: Prognosewerte für fehlende Werte bei nominalen Variablen mit Hilfe der Logitanalyse einsetzen
Schritt 5d: "Multiple Imputation"
Bei diesen vier Verfahren kann der jeweils gefundene Ersatzwertwert für den fehlenden Wert
zufallsüberlagert werden.

Kapitel 4: Dateien vereinen (Daten-Fusion)
Schritt 6a: Dateien mit Hilfe des Allgemeinen Linearen Modells fusionieren
Schritt 6b: Dateien (bei nominalen Variablen) mit Hilfe der Logitanalyse fusionieren

Kapitel 5: Mehrere Variable zu einer Messung kombinieren
Schritt 7a: Aus mehreren Variablenwerten einen Gesamtpunktwert bilden
Schritt 7b: Mit Faktorenanalyse die Faktorenstruktur einer Variablenmenge entdecken und Faktorwerte bilden
Schritt 7c: Mit Rasch-Skalierungsverfahren aus mehreren Variablen einen Messwert bilden

Kapitel 6: Zusammenhänge zwischen Variablen "blind" suchen
Schritt 8: Variable miteinander korrelieren: Jede Variable mit jeder anderen
oder nur ausgewählte Variable. Die Korrelationskoeffizienten werden abhängig
von ihrem Messniveau (nominal, ordinal, quantitativ) berechnet.

Kapitel 7: Einzelne Zusammenhänge "gezielt" suchen
Schritt 9: Variable zwei- und beliebieg-dimensional tabellieren (OLAP)
Schritt 10: Streudiagramm für zwei oder drei Variable (mit Regressionsgerade bzw. -ebene)

Kapitel 8: Mehrfach-Zusammenhänge "gezielt" untersuchen
Schritt 11a: Ursachen für die Zielvariable mit dem Allgemeinen Linearen Modell (ALM) finden
Schritt 11b: Alternative wenn Zielvariable nominal: Gewichtetes ALM
Schritt 11c: Alternative wenn Zielvariable nominal: Logitanalyse

Kapitel 9: Prognose leisten
Schritt 12a: Werte für Zielvariable mit ALM prognostizieren
Schritt 12b: Werte für nominale Zielvariable mit Logitanalyse prognostizieren

Kapitel 10: Zusammengehörigkeiten zwischen Objekten suchen
Schritt 13: Typen von Objekten (z.B. Befragten) mit Clusteranalyse bilden

Kapitel 11: Ursachen für die Clusterzugehörigkeit
Schritt 14a: Ursachen für die Clusterzugehörigkeit mit ALM entdecken
Schritt 14b: Ursachen für die Clusterzugehörigkeit mit Logit-Analyse entdecken

Bedienung
Das Almo-Data-Mining-System ist über Dialogboxen einfach zu bedienen. Viele Programmparameter
sind voreingestellt, so daß dem Benutzer schwierige Entscheidung abgenommen werden.
Der Spezialist kann aber auch sehr komplexe Analysen rechnen.

Ausgabe der Ergebnisse
Der Benutzer kann bei vielen der oben in Schritt 1 bis 14 angebenen Programme die Ausgabe
der Ergebnisse steuern. Er kann über mehrere Stufen die Komplexität und Vollständigkeit der
 Ausgabe festlegen.

Grafik
Viele der Ergebnisse werden zusätzlich grafisch dargestellt. Der Benutzer kann die Grafiken
vielfältig editieren. Alle Grafiken können gestochen scharf ausgedruckt werden und auch
in Textdokumente (Forschungsberichte) eingefügt werden.

Handbuch
Im Handbuch werden, die oben vorgestellten 14 Schritte des Data-Mining-Prozesses ausführlich
(auf 444 Seiten) erläutert. Es ist so geschrieben, daß es auch vom "Nicht-Hauptfach-Statistiker"
begriffen wird. Für alle 14 Schritte werden typische Beispiele gerechnet. Die Eingaben, die der
Benutzer dabei vornehmen muß, werden erklärt und die Ergebnisse herunter bis zu den kleinsten
Details ausführlich kommentiert.