Wie viel Spread ist im Data There?

Wenn Sie mit großen Datenstatistiken arbeiten, können Sie die Ausbreitung eines Datensatzes vom Zentrum mit verschiedenen Auswertungsmaße identifizieren: Varianz, Standardabweichung, Quartile, Interquartilbereich (IQB).

Varianz ist die durchschnittliche quadratische Abweichung zwischen den Elementen des Datensatzes und dem Mittelwert. Für eine Probe von Daten wird die Varianz wie folgt berechnet:

bild0.jpg

woher

  • xich ist der Wert eines einzelnen Elements in der Probe.

    image1.jpg

  • Mittelwert ist die Probe.

  • n ist die Stichprobengröße.

Die Standardabweichung ist die Quadratwurzel der Varianz. Für die meisten Anwendungen ist die Standardabweichung bequemer die Varianz als Maß für die Ausbreitung zu verwenden als. Das ist, weil die Varianz gemessen in kariert Einheiten, wohingegen die Standardabweichung ist in den gleichen Einheiten wie die Daten gemessen. Zum Beispiel würde die Varianz eines Datensatzes von Preisen aus in US-Dollar gemessen werden kariert, und die Standardabweichung würde in Dollar gemessen werden. Die Standardabweichung ist die am weitesten verbreitete Maß für die Ausbreitung in einem Datensatz.

Quartile teilen einen Datensatz in vier gleiche Teile. Die erste Quartil (Q1) Teilt die Daten in den untersten 25 Prozent der Beobachtungen und der höchsten 75 Prozent (25 Prozent der Beobachtungen weniger als Q1, und 75 Prozent größer als Q1). Die zweite Quartil (Q2) Teilt die Daten in den untersten 50 Prozent der Beobachtungen und der höchsten 50 Prozent. Das dritte Quartil (Q3) Teilt die Daten in den untersten 75 Prozent der Beobachtungen und der höchsten 25 Prozent. Der Quartilsabstand (IQB) entspricht der Differenz zwischen dem dritten und dem ersten Quartil:

image2.jpg

Die IQR stellt den mittleren 50 Prozent der Daten.

Die Quartile eines Datensatzes werden am besten mit einem illustriert Box-Plot. Die folgende Abbildung zeigt eine Box-Plot der täglichen Renditen zu ExxonMobil im Jahr 2013.

Box-Plot der täglichen Renditen zu ExxonMobil Lager im Jahr 2013.
Box-Plot der täglichen Renditen zu ExxonMobil Lager im Jahr 2013.

Der Box-Plot zeigt mehrere wichtige Statistiken für die ExxonMobil Renditen:

image4.jpg

Die Mindestrendite ist am unteren Rand des Grundstücks in einem Diagramm als ein einzelner Punkt gezeigt (eine Box-Plot zeigt Ausreißer als einzelne Punkte). Q1 wird als der Boden der Box, Q gezeigt2 ist der Feststoff in der Mitte der Box schwarze Linie, und Q3 ist die Spitze des Feldes. Die maximale Rendite ist als ein einzelner Punkt an der Spitze des Diagramms dargestellt.

» » » » Wie viel Spread ist im Data There?