Formeln Statistik

Aus Mhfe-wiki
Wechseln zu: Navigation, Suche

Artikel ist noch in Arbeit



Mittelwert

Um die Zuverlässigkeit von Messungen zu erhöhen, werden Messungen in Form einer Messreihe wiederholt.

Eine Reihe von N Messungen bezeichnet man als Stichprobe.

Als beste Schätzung des - unbekannten "wahren" - Wertes betrachtet man den arithmetischen Mittelwert der N Messungen.

Arithmetischer Mittelwert

\[\bar x = {x_1 + x_2 + x_3 +...+ X_n \over N }\]


Varianz

Die Varianz ist ein Streuungsmaß, d.h. ein Maß für die Abweichung einer Zufallsvariablen \( x_i \) von ihrem Erwartungswert \( E_{(x)} \) . Sie berechnet sich aus der Summe der quadrierten Abweichungen vom Mittelwert einer Beobachtungsreihe.

\[ S = { (x_1 - \bar x)^2 + (x_2 - \bar x)^2 +...+(x_n - \bar x)^2 \over {N-1} } \]


In der Praxis ist es vielfach nachteilig, dass die Varianz eine andere Einheit als die Daten besitzt. Zieht man die Quadratwurzel der Varianz erhält man die einheitenkonforme Standardabweichung.

Standardabweichung

Die Varianz hat die Dimension des Quadrats der gemessenen physikalischen Größe. Ein Abweichungsmaß von der Dimension der Messgröße erhält man, indem man aus der Varianz die Wurzel zieht. Dieses Maß heißt Standardabweichung.


\[ \sigma = \sqrt{ (x_1 - \bar x)^2 + (x_2 - \bar x)^2 +...+(x_n - \bar x)^2 \over {N-1} } \]

Mechanische Deutung von Mittelwert und Standardabweichung

Denkt man sich die x-Achse als dünnen Stab, dessen Massenbelegungsdichte entlang der Stabachse unregelmäßig ist, dann ist \(\bar x \) der Schwerpunkt des Stabes und \( \sigma \) der Trägheitsradius bezüglich einer zur x-Achse senkrechten und durch \(\bar x \) gehenden Drehachse.

Quelle: Vorlesungsskript FH-Hannover; Statistik, Ausgleichs & Fehlerrechnung, 1976

Normalverteilung

Verteilung von Zufallswerten

Zufallswerte sind beispielsweise in einer Kugellagerproduktion die Durchmesserabweichungen einzelner Kugeln vom Nenndurchmesser, das Über- oder Untergewicht einzelner Menschen einer Gruppe oder die Energieabweichung einzelner Teilchen eines Bunches von der Sollenergie. Zufallswerte können durch eine Normalverteilung beschrieben werden. Gauß ging von der Hypothese einer großen Zahl unkontrollierbarer statistischer Störeinflüsse aus und zeigte, daß dann die Wahrscheinlichkeitsdichte für die Verteilung von Meßwerten durch die Normalverteilungskurve beschrieben werden kann. Die Brauchbarkeit dieses Modells hat sich empirisch erwiesen. Die Annäherung an die Gaußsche Normalverteilungskurve wird um so besser, je größer die Zahl der Messungen ist. Die Messungen streuen um den Mittelwert µ. Die Standardabweichung ist sigma. Mit Hilfe der Standardabweichung läßt sich angeben, welcher Anteil aller Messwerte in einer bestimmten Umgebung des Mittelwertes erwartet werden kann


Im gekennzeichneten Intervall liegen 68% aller Messwerte.
Im gekennzeichneten Intervall liegen 95% aller Messwerte.


Klassen

Großer Stichproben teilt man zur Auswertung in Klassen ein. Zur sinnvollen Klasseneinteilung kann man die Faustformel

k ≈ √N

benutzen

N: Stichprobengröße

k: Anzahl Klassen

Die Stichprobengröße sollte dabei im Bereich 50 < N < 500 liegen.

  • Für N < 50 ist das Feststellen von Häufigkeiten wenig sinnvoll.
  • Für N > 500 wächst die Anzahl der Klassen langsamer.
  • Man wählt selten mehr als 30 Klassen.


Klassenbreite

Δx = (xmax-xmin)/k

mit Δx < 0,6 s

s: Standardabweichung

DIN 55303 Faustformel Klassenbreite