Was ist eine univariate Häufigkeitsverteilung bei unklassierten Merkmalen?

Univariate Häufigkeitsverteilung bei unklassierten Merkmalen

Ein diskretes Merkmal mit der Bezeichnung X werden bei nj statistischen Einheiten erhoben. Die Merkmalswerte, welche untersucht werden, werden mit xj erfasst und durch die vorkommenden Merkmalsausprägungen erfasst. Es können somit mehr Merkmalswerte als Merkmalsausprägungen vorliegen.

Beispiel

Fünf Haushalte werden nach ihrer Autoanzahl gefragt: Aus der Befragung ergaben sich folgende Beobachtungswerte: x1 = 0, x2 = 1, x3 = 1, x4 = 2, x5 = 0 Es liege also zwei Haushalte vor, die keine Autos besitzen und zwei Haushalte mit je einem Auto und ein Haushalt, welcher zwei Autos besitzt. Nun wollen wir uns mit der absoluten Häufigkeit befassen.

Die absolute Häufigkeit

Die Anzahl der statistischen Einheiten mit einer bestimmten Merkmalsausprägung werden als absolute Häufigkeit bezeichnet. Diese wird mit nj benannt. Aus dem obrigen Beispiel ergibt sich also: j       xj        nj       hj 1      0        2          0,4 2      1        2          0,4 3      2        1          0,2 Σ                5 Σ steht für die Summe der absoluten Häufigkeit. Wofür steht aber nun hj?

Die relative Häufigkeit

Teilt man die absolute Häufigkeit nj durch die Summe der absoluten Häufigkeit (hier: 5), erhält man die relative Häufigkeit. Beispiel: n1 / 5 = 2 / 5 = 0,4