Skip To Content

Boxplot

Boxplots ermöglichen Ihnen die Visualisierung und den Vergleich der Verteilung und zentralen Tendenz numerischer Werte über deren Quantile. Quartile ermöglichen die Unterteilung numerischer Werte in gleiche Gruppen basierend auf fünf Hauptwerten: Minimum, erstes Quartil, Median, drittes Quartil, und Maximum.

Der Rechteckbereich des Diagramms veranschaulicht die mittleren 50 Prozent der Datenwerte, die auch als Interquartil-Bereich bzw. IQR bezeichnet werden. Der Median der Werte wird als Linienunterteilung des Rechtecks in zwei Hälften dargestellt. Der IQR veranschaulicht die Variabilität in einer Reihe von Werten. Ein großer IQR gibt weit verstreute Werte an, während ein kleinerer IQR angibt, dass sich die meisten Werte in der Mitte befinden. Boxplots stellen zudem die Minimum- und Maximumwerte durch vom Rechteck ausgehende Whiskers und optional Ausreißer als Punkte dar, die sich über die Whiskers hinaus erstrecken.

Boxplot-Diagramm

Variablen

Boxplots bestehen aus einer X- und einer Y-Achse. Die X-Achse weist ein Rechteck für jede Kategorie oder jedes Zahlenfeld zu. Die Y-Achse dient zum Messen der Werte Minimum, erstes Quartil, Median, drittes Quartil, und Maximum in einer Reihe von Zahlen.

Reihen

Es gibt zwei Möglichkeiten, Boxplot-Reihen zu erstellen:

  • Mehrere Reihen aus einem Unterteilungsfeld erstellen
  • Mehrere Reihen aus mehreren Feldern erstellen

Mehrere Reihen aus einem Unterteilungsfeld erstellen

Mit der Option Mehrere Reihen aus einem Unterteilungsfeld erstellen können Sie mehrere Zahlenfelder oder ein einzelnes Zahlenfeld mit einer Kategorievariablen zum Erstellen einer Reihe verwenden. Um eine Reihe in mehrere Reihen zu unterteilen, kann eine Variable Unterteilen nach festgelegt werden.

Boxplots können zum Visualisieren einer oder mehrerer Verteilungen dienen. Um eine einzelne Verteilung zu visualisieren, geben Sie ein numerisches Attribut für die Zahlenfelder an. Dies führt zu einem Diagramm mit einem Boxplot, der zum Visualisieren des ausgewählten numerischen Attributs verwendet wird.

Zusätzliche numerische Attribute können den Zahlenfeldern zum Vergleichen mehrerer Verteilungen aus verschiedenen Attributfeldern in einer Tabelle hinzugefügt werden. In einem Landkreis-Dataset sind beispielsweise Population2010und Population2015 als Zahlenfelder festgelegt. Das resultierende Diagramm zeigt zwei Boxplots an, einen zum Visualisieren der Verteilung von Population2010 und einen zum Visualisieren der Verteilung von Population2015.

Wenn ein einzelnes numerisches Attribut als Zahlenfeld ausgewählt wird, ist die Option zum Hinzufügen einer Kategorievariablen verfügbar, um Verteilungen über verschiedene Kategorien zu vergleichen. Population2010 ist beispielsweise als Zahlenfeld und StateName ist als Kategorie für ein Landkreis-Dataset festgelegt. Das resultierende Diagramm zeigt ein Boxplot für jeden Bundesstaat an, der die Verteilung von Population2010 für alle Landkreise visualisiert, die zu den einzelnen Bundesstaaten gehören.

Außerdem kann die Variable Unterteilen nach hinzugefügt werden, um die Daten weiter zu unterteilen und mehrere Reihen zu erstellen. Population2010 ist beispielsweise als Zahlenfeld, StateName als Kategorie- und ElectionWinner als Unterteilen nach-Feld für ein Landkreis-Dataset festgelegt. Die Tabelle Reihe wird mit dem jeweiligen eindeutigen ElectionWinner-Wert (Democrat, Republican) gefüllt. Das resultierende Diagramm zeigt Boxplots für jeden Staat nebeneinander (100 Boxplots insgesamt) an, wobei einer die Verteilung von Population2010 aller Landkreise mit dem ElectionWinner-Wert Democrat und der andere die Verteilung für alle Landkreise mit dem ElectionWinner-Wert Republican visualisiert.

Unterteilen nach-Felder können auch verwendet werden, wenn mehrere Zahlenfelder anstelle einer Kategorievariablen verwendet werden. Beispielsweise werden Population2010, Population2015 und Population2020 als Zahlenfelder und ElectionWinner als Unterteilen nach-Feld für ein Landkreis-Dataset festgelegt. Das resultierende Diagramm zeigt die drei Zahlenfelder entlang der X-Achse (Population2010, Population2015,, Population2020) mit jeweils zwei Boxplots nebeneinander an, von denen einer die Verteilung für alle Landkreise mit dem ElectionWinner-Wert Democrat und der andere die Verteilung für alle Landkreise mit dem ElectionWinner-Wert Republican anzeigt.

Wird ein Unterteilen nach-Feld zum Erstellen mehrerer Reihen verwendet, sind zwei Optionen zum Visualisieren der Ergebnisse verfügbar. Als mehrere Boxplots anzeigen resultiert in einem Diagramm mit nebeneinander dargestellten Boxplots, eines für jede Reihe. Alternativ wird mit Als Mittellinien anzeigen ein Boxplot für jeden Kategorie-Wert bzw. für jedes Zahlenfeld erstellt und mithilfe von Linien der Mittelwert für jeden Einzelwert im FeldUnterteilen nach angezeigt. Population2010 ist beispielsweise als Zahlenfeld, StateName als Kategorie- und ElectionWinner als Unterteilen nach-Feld für ein Landkreis-Dataset festgelegt. Die Tabelle Reihe wird mit jedem eindeutigen ElectionWinner-Wert (Democrat, Republican) gefüllt. Statt jeden Bundesstaat in ein Boxplot für jeden ElectionWinner-Wert zu teilen, zeigt das resultierende Diagramm jedoch ein Boxplot pro Bundesstaat an, in dem die Verteilung von Population2010 für Landkreise in diesem Bundesstaat und der Mittelwert jeder Unterteilen nach- Reihe (Democrat, Republican) die Boxplots überlagert und anzeigt, wo der Mittelwert der jeweiligen Reihe in Bezug auf die Gesamtverteilung liegt.

Erstellen mehrerer Reihen aus mehreren Feldern

Erstellen Sie mehrere Reihen aus mehreren Feldern erfordert eine Kategorievariable und ein oder mehrere numerische Felder. Jedes numerische Feld, das der Reihentabelle hinzugefügt wird, erstellt eine neue Reihe. StateName ist beispielsweise als Kategorie und Population2010, Population2015 und Population2020 sind als die numerischen Felder in der Tabelle Reihe für ein Landkreis-Dataset festgelegt. Das resultierende Diagramm verfügt über Bundesstaaten als Kategorien entlang der X-Achse mit jeweils drei Reihen (Population2010, Population2015 und Population2020).

Standardisierung

Wenn ein Boxplot aus mehreren Zahlenfeldern erstellt wird, wird standardmäßig eine Z-Score-Standardisierung angewendet. Die Standardisierung ermöglicht das Vergleichen von numerischen Variablen in unterschiedlichen Einheiten.

Zum Beispiel wäre ein Boxplot zum Vergleichen der Verteilungen von Einkommen (bei dem die Werte im Bereich von Zehntausendern liegen) und Arbeitslosenquote (bei der die Werte von 0 bis 1 reichen) ohne Standardisierung nur schwer zu lesen, da die Werte für die Arbeitslosenquote sehr viel kleiner als die für das Einkommen sind.

Die Standardisierung der Attributwerte umfasst eine Z-Transformation, wobei der Mittelwert aller Werte von jedem Wert subtrahiert und durch die Standardabweichung für alle Werte dividiert wird. Die Z-Score-Standardisierung bringt alle Attribute auf derselben Skala unter, sodass mehrere Verteilungen in einem Diagramm visualisiert werden können. Wenn Sie stattdessen die nicht standardisierten (Roh-)Werte visualisieren möchten, müssen Sie lediglich das Kontrollkästchen Werte standardisieren (Z-Wert) im Bereich Diagrammeigenschaften deaktivieren.

Achsen

Grenzen der Y-Achse

Die Standardgrenzen der Y-Achse werden entsprechend dem Bereich der Datenwerte auf der Achse festgelegt. Diese Werte können durch Eingabe eines neuen gewünschten Wertes für die Achsengrenze angepasst werden. Durch das Festlegen von Achsengrenzen bleibt der Maßstab Ihres Diagramms für Vergleiche konsistent. Durch Klicken auf das Symbol "Zurücksetzen" wird die Achsengrenze wieder auf den Standardwert zurückgesetzt.

Zahlenformat

Sie können formatieren, wie auf einer Achse numerische Werte dargestellt werden, indem Sie eine Zahlenformatkategorie angeben oder eine benutzerdefinierte Formatzeichenfolge definieren. Beispiel: $#,### kann als benutzerdefinierte Formatzeichenfolge für die Darstellung von Werten in einer Währung verwendet werden.

Darstellung

Titel und Beschreibung

Diagramme und Achsen erhalten Standardtitel basierend auf den Variablennamen und dem Diagrammtyp. Diese können auf der Registerkarte Allgemein im Bereich Diagrammeigenschaften bearbeitet werden. Sie können auch eine Beschreibung für das Diagramm eingeben, wobei es sich um einen Textblock handelt, der am unteren Rand des Diagrammfensters angezeigt wird.

Visuelle Formatierung

Sie können das Aussehen Ihres Diagramms konfigurieren, indem Sie Text- und Symbolelemente formatieren oder ein Diagrammdesign anwenden. Formateigenschaften können auf der Registerkarte Format im Bereich Diagrammeigenschaften oder über das kontextbezogene Menüband Diagrammformat konfiguriert werden. Die Optionen für Diagrammformatierung lauten wie folgt:

  • Größe, Farbe und Schriftschnitt der Schriftart für Achsentitel, Achsenbeschriftungen, Beschreibungstexte, Legendentitel, Legendentexte und Führungslinienbeschriftungen
  • Farbe, Breite und Linientyp für Raster- und Achsenlinien
  • Hintergrundfarbe des Diagramms

Weitere Informationen zum Ändern des Aussehens eines Diagramms

Farbe

Boxplots entsprechen nach Möglichkeit der Umrisslinie und den Füllfarben, die in der Layer-Symbolisierung definiert sind. Wenn Reihen auf eine Weise geteilt werden, die nicht mit der Layer-Symbolisierung übereinstimmt, wird eine Standardfarbpalette angewendet. Reihenfarben lassen sich durch Klicken auf die Farbpalette Symbol in der Tabelle Reihe und durch Auswahl einer neuen Farbe ändern.

Ausrichtung

Boxen können horizontal durch Klicken auf die Schaltfläche Diagramm drehen im Diagrammfenster dargestellt werden.

Führungslinien

Führungslinien oder Bereiche können als Referenz oder zum Hervorheben signifikanter Werte zu Diagrammen hinzugefügt werden. Um eine neue Führungslinie hinzuzufügen, navigieren Sie im Bereich Diagrammeigenschaften zur Registerkarte Führungslinien, und klicken Sie auf Führungslinie hinzufügen. Um eine Linie zu zeichnen, geben Sie einen Wert ein, wo die Linie gezeichnet werden soll. Um einen Bereich zu erstellen, geben Sie einen Wert bis ein. Sie können optional Text zur Führungslinie hinzufügen, indem Sie Beschriftung angeben.

Beispiel

Erstellen Sie ein Boxplot, um die Verteilungen und die Variabilität verschiedener chronischer Erkrankungen nach Bundesstaat zu vergleichen.

  • Mehrere Reihen aus mehreren Feldern erstellen
  • Kategorie: Bundesstaat
  • Felder: % Diabetes, % Asthma, % Herzversagen

Boxplots zum Vergleichen der Verteilungen und Variabilität verschiedener chronischer Erkrankungen nach Bundesstaat