next up previous contents index
Nächste Seite: 7 Datenanreicherung Aufwärts: 3 Erhebung und Vorbereitung Vorherige Seite: 5 Normierung der Daten   Inhalt   Index

Unterabschnitte


6 Skalentransformationen

Wie in Abschnitt 2.3.1 dargestellt, können Zufallsvariable metrische, ordinale und nominale Größen sein. Bei den bisherigen Normierungen wurden zwar der Wertebereich der Zufallsvariablen in einen anderen abgebildet, jedoch blieb stets das Skalenniveau erhalten. Hier sollen Abbildungen des Wertebereiches einer Zufallsvariablen vorgestellt werden, die das Skalenniveau verändern.

In Abschnitt 2.3.1 wurde auch dargestellt, dass die Skalenniveaus eine natürliche Reihenfolge besitzen und man deswegen von höheren und niedrigeren Niveaus sprechen kann.


1 Absenken des Skalenniveaus

Von Absenken des Skalenniveaus spricht man meistens, wenn metrisch skalierte in kategorial skalierte Zufallsvariable umgewandelt werden sollen. Diesen Verlust von Informationen geht man im allgemeinen nur ein, weil die Daten aus anderen Gründen mit einem Verfahren untersucht werden sollen, das metrische Größen nicht verarbeiten kann.

Zum Beispiel wurden in dieser Arbeit metrische Merkmale wie der Kaufpreis kategorial umskaliert, um diese Merkmale in Kreuztabellen darstellen oder mit Hilfe der Assoziationsanalyse untersuchen zu können.

Das eigentliche Umskalieren läuft dabei als Einteilung der metrischen Größen in unterschiedlich benannte Intervalle ab. Als günstig erweist es sich, die Intervallgrenzen so zu wählen, dass die Besetzungszahlen der einzelnen Intervalle nicht zu unterschiedlich sind. Die Bezeichnung des Intervalls kann man so wählen, dass die Grenzen daraus hervorgehen.


2 Anheben des Skalenniveaus

Das Anheben des Skalenniveaus gestaltet sich sehr viel schwieriger, da hierbei nicht Informationen der beteiligten Zufallsvariablen verworfen werden können sondern neu aus anderen Quellen hinzugewonnen werden müssen. Eine solche Quelle ist häufig die Forderung, dass die umzuskalierenden Zufallsvariablen nach einer bestimmten Funktion verteilt sind.

Zum Beispiel werden im Rahmen der in dieser Arbeit erprobten Lancaster-Skalierung gleichzeitig zwei kategorial skalierte Merkmale auf metrisches Skalenniveau angehoben. Die dazu zusätzlich nötigen Informationen ergeben sich aus der willkürlichen Forderung, dass die kategorialen Daten - die in Form einer Kontingenztabelle vorliegen - möglichst gut an eine Binormalverteilung angepasst werden (siehe [4] ab Seite 282).

Zwar stehen durch die Skalentransformation der Daten nun eine Vielzahl von neuen Analysen zur Verfügung, jedoch zeigte sich im Verlauf dieser Arbeit, dass nicht das Fehlen geeigneter Analysen sondern die Qualität der Daten mit sehr wahrscheinlich systematischen Fehlern das Hauptproblem ausmachen. Hinzu kommt noch, dass die gewonnen Ergebnisse durch die aufwendige Berechnung nicht mehr ohne Weiteres nachvollziehbar und plausibel sind. Da den genannten Nachteilen kaum Vorteile gegenüberstehen, wurde im Rahmen dieser Arbeit ein Anheben des Skalenniveaus der zu untersuchenden Zufallsvariablen nicht weiter verfolgt.


next up previous contents index
Nächste Seite: 7 Datenanreicherung Aufwärts: 3 Erhebung und Vorbereitung Vorherige Seite: 5 Normierung der Daten   Inhalt   Index
Thorsten Foerstemann (thorsten@foerstemann.name)