Skip To Content

Boxplot

Boxplots ermöglichen Ihnen die Visualisierung und den Vergleich der Verteilung und zentralen Tendenz numerischer Werte über deren Quantile. Quartile ermöglichen die Unterteilung numerischer Werte in gleiche Gruppen basierend auf fünf Hauptwerten: Minimum, erstes Quartil, Median, drittes Quartil, und Maximum.

Der Rechteckbereich des Diagramms veranschaulicht die mittleren 50 Prozent der Datenwerte, die auch als Interquartil-Bereich bzw. IQR bezeichnet werden. Der Median der Werte wird als Linienunterteilung des Rechtecks in zwei Hälften dargestellt. Der IQR veranschaulicht die Variabilität in einer Reihe von Werten. Ein großer IQR gibt weit verstreute Werte an, während ein kleinerer IQR angibt, dass sich die meisten Werte in der Mitte befinden. Boxplots stellen zudem die Minimum- und Maximumwerte durch vom Rechteck ausgehende Whiskers und optional Ausreißer als Punkte dar, die sich über die Whiskers hinaus erstrecken.

Boxplot-Diagramm

Variablen

Boxplots bestehen aus einer X- und einer Y-Achse. Die X-Achse weist ein Rechteck für jede Kategorie oder jedes Numerische Feld zu. Die Y-Achse dient zum Messen der Werte Minimum, erstes Quartil, Median, drittes Quartil, und Maximum in einer Reihe von Zahlen.

Boxplots können zum Visualisieren einer oder mehrerer Verteilungen dienen. Um eine einzelne Verteilung zu visualisieren, fügen Sie ein numerisches Feld hinzu. Dies ergibt ein Diagramm mit einem Boxplot, mit dem das ausgewählte numerische Attribut visualisiert wird.

Es können zusätzliche numerische Felder hinzugefügt werden, um mehrere Verteilungen aus verschiedenen Attributfeldern in einer Tabelle zu vergleichen. In einem Landkreis-Dataset werden beispielsweise Population2010 und Population2015 als Numerische Felder hinzugefügt. Das resultierende Diagramm zeigt zwei Boxplots an, eines zum Visualisieren der Verteilung von Population2010 und eines zum Visualisieren der Verteilung von Population2015 für alle Landkreise im Dataset.

Wenn ein einzelnes numerisches Feld ausgewählt wird, ist die Option zum Hinzufügen einer Kategorievariablen verfügbar, um Verteilungen über verschiedene Kategorien zu vergleichen. Population2010 ist beispielsweise als das Numerische Feld und StateName ist als Kategorie für ein Landkreis-Dataset festgelegt. Das resultierende Diagramm zeigt ein Boxplot für jeden Bundesstaat an, der die Verteilung von Population2010 für alle Landkreise visualisiert, die zu den einzelnen Bundesstaaten gehören.

Mehrere Reihen

Mithilfe von Boxplots mit mehreren Reihen können Verteilungen unterschiedlicher Typen verglichen oder Vergleiche nach unterschiedlichen Kategorien durchgeführt werden.

Boxplots mit mehreren Reihen können erstellt werden, indem Sie ein Kategoriefeld und mehrere numerische Felder angeben oder ein Unterteilen nach-Kategoriefeld angeben.

Bei Verwendung einer Kategorievariablen mit mehreren numerischen Feldern wird durch jedes numerische Feld, das der Tabelle "Reihe" hinzugefügt wird, eine neue Reihe erstellt. Beispiel: In einem Landkreis-Dataset sind StateName als Kategoriefeld und Population2010, Population2015 und Population2020 als numerische Felder festgelegt. Das resultierende Diagramm verfügt über Bundesstaaten als Kategorien entlang der X-Achse mit jeweils drei Reihen (Population2010, Population2015 und Population2020).

Alternativ kann die Variable Unterteilen nach hinzugefügt werden, um die Daten weiter zu unterteilen und mehrere Reihen zu erstellen. Population2010 ist beispielsweise als das Numerische Feld, StateName als Kategorie und ElectionWinner als Unterteilen nach-Feld für ein Landkreis-Dataset festgelegt. Die Tabelle Reihe wird mit den jeweiligen Einzelwerten für ElectionWinner (Democrat oder Republican) gefüllt. Das resultierende Diagramm zeigt für jeden Staat zwei Boxplots nebeneinander an (100 Boxplots insgesamt), wobei einer die Verteilung von Population2010 für alle Landkreise der einzelnen Bundesstaaten mit dem ElectionWinner-Wert Democrat visualisiert und der andere die Verteilung für alle Landkreise der einzelnen Bundesstaaten mit dem ElectionWinner-Wert Republican.

Unterteilen nach-Felder können auch verwendet werden, wenn mehrere Numerische Felder anstelle einer Kategorievariablen verwendet werden. Beispielsweise werden Population2010, Population2015 und Population2020 als Numerische Felder und ElectionWinner als Unterteilen nach-Feld für ein Landkreis-Dataset festgelegt. Das resultierende Diagramm zeigt die drei Numerischen Felder entlang der X-Achse (Population2010, Population2015 und Population2020) mit jeweils zwei Boxplots nebeneinander an: einer zeigt die Verteilung für alle Landkreise mit dem ElectionWinner-Wert Democrat an und der andere die Verteilung für alle Landkreise mit dem ElectionWinner-Wert Republican.

Anzeigen mehrerer Reihen

Wird ein Unterteilen nach-Feld zum Erstellen mehrerer Reihen verwendet, sind zwei Optionen zum Visualisieren der Ergebnisse verfügbar.

  • Als mehrere Boxplots anzeigen: Erstellt nebeneinander dargestellte Boxplots, eines für jede Reihe.
  • Als Mittellinien anzeigen: Erstellen Sie einen Boxplot für jeden Kategorie-Wert bzw. für jedes Numerische Feld, und zeigen Sie mithilfe von Linien den Mittelwert für jeden Einzelwert im Unterteilen nach-Feld an.

Population2010 ist beispielsweise als das Numerische Feld, StateName als Kategorie und ElectionWinner als Unterteilen nach-Feld für ein Landkreis-Dataset festgelegt. Die Tabelle Reihe wird mit mit den jeweiligen Einzelwerten für ElectionWinner (Democrat und Republican) gefüllt. Statt jeden Bundesstaat in einen Boxplot für jeden ElectionWinner-Wert zu teilen, wird im resultierenden Diagramm ein Boxplot pro Bundesstaat dargestellt. Darin wird die Verteilung von Population2010 für die Landkreise in diesem Bundesstaat anzeigt. Die Boxplots werden mit dem Mittelwert jeder Unterteilen nach-Reihe (Democrat und Republican) überlagert, um anzuzeigen, wo der Mittelwert der jeweiligen Reihe in Bezug auf die Gesamtverteilung liegt.

Standardisierung

Wird ein Boxplot aus mehreren Numerischen Feldern erstellt, wird standardmäßig eine Z-Score-Standardisierung angewendet. Die Standardisierung ermöglicht das Vergleichen von numerischen Variablen in unterschiedlichen Einheiten.

Zum Beispiel wäre ein Boxplot zum Vergleichen der Verteilungen von Einkommen (bei dem die Werte im Bereich von Zehntausendern liegen) und Arbeitslosenquote (bei der die Werte von 0 bis 1 reichen) ohne Standardisierung nur schwer zu lesen, da die Werte für die Arbeitslosenquote sehr viel kleiner als die für das Einkommen sind.

Die Standardisierung der Attributwerte umfasst eine Z-Transformation, wobei der Mittelwert aller Werte von jedem Wert subtrahiert und durch die Standardabweichung für alle Werte dividiert wird. Die Z-Score-Standardisierung bringt alle Attribute auf derselben Skala unter, sodass mehrere Verteilungen in einem Diagramm visualisiert werden können. Wenn Sie stattdessen die Rohwerte visualisieren möchten, deaktivieren Sie das Kontrollkästchen Werte standardisieren (Z-Wert) im Bereich Diagrammeigenschaften.

Achsen

Grenzen der Y-Achse

Die Standardgrenzen der Y-Achse werden entsprechend dem Bereich der Datenwerte auf der Achse festgelegt. Diese Werte können durch Eingabe eines neuen Wertes für die Achsengrenze angepasst werden. Durch das Festlegen von Achsengrenzen bleibt der Maßstab Ihres Diagramms einheitlich und somit vergleichbar.Durch Klicken auf das Symbol "Zurücksetzen" wird die Achsengrenze wieder auf den Standardwert zurückgesetzt.

Zahlenformat

Sie können formatieren, wie numerische Werte auf einer Achse dargestellt werden, indem Sie eine Zahlenformatkategorie angeben oder eine benutzerdefinierte Formatzeichenfolge definieren. Beispiel: $#,### kann als benutzerdefinierte Formatzeichenfolge für die Darstellung von Werten in einer Währung verwendet werden.

Darstellung

Titel und Beschreibung

Diagramme und Achsen erhalten Standardtitel basierend auf den Variablennamen und dem Diagrammtyp. Diese können auf der Registerkarte Allgemein im Bereich Diagrammeigenschaften bearbeitet werden. Sie können auch eine Beschreibung für das Diagramm eingeben, wobei es sich um einen Textblock handelt, der am unteren Rand des Diagrammfensters angezeigt wird.

Visuelle Formatierung

Sie können das Aussehen Ihres Diagramms konfigurieren, indem Sie Text- und Symbolelemente formatieren oder ein Diagrammdesign anwenden. Formateigenschaften können auf der Registerkarte Format im Bereich Diagrammeigenschaften oder über das kontextbezogene Menüband Diagrammformat konfiguriert werden. Die Optionen für Diagrammformatierung lauten wie folgt:

  • Größe, Farbe und Schriftschnitt der Schriftart für Achsentitel, Achsenbeschriftungen, Beschreibungstexte, Legendentitel, Legendentexte und Führungslinienbeschriftungen
  • Farbe, Breite und Linientyp für Raster- und Achsenlinien
  • Hintergrundfarbe des Diagramms

Weitere Informationen zum Ändern des Aussehens eines Diagramms

Farbe

Boxplots entsprechen nach Möglichkeit der Umrisslinie und den Füllfarben, die in der Layer-Symbolisierung definiert sind. Wenn Reihen auf eine Weise geteilt werden, die nicht mit der Layer-Symbolisierung übereinstimmt, wird eine Standardfarbpalette angewendet. Reihenfarben können auf der Registerkarte Reihe im Bereich Diagrammeigenschaften geändert werden, indem in der Tabelle Reihe auf das Farbfeld Symbol geklickt und eine neue Farbe ausgewählt wird.

Ausrichtung

Boxen können horizontal im Diagrammfenster dargestellt werden, indem Sie auf die Schaltfläche Diagramm drehen Diagramm drehen klicken.

Führungslinien

Führungslinien oder Bereiche können als Referenz oder zum Hervorheben signifikanter Werte zu Diagrammen hinzugefügt werden. Um eine neue Führungslinie hinzuzufügen, navigieren Sie im Bereich Diagrammeigenschaften zur Registerkarte Führungslinien, und klicken Sie auf Führungslinie hinzufügen. Um eine Linie zu zeichnen, geben Sie einen Wert ein, wo die Linie gezeichnet werden soll. Um einen Bereich zu erstellen, geben Sie einen Wert bis ein. Sie können optional Text zur Führungslinie hinzufügen, indem Sie Beschriftung angeben.

Beispiel

Erstellen Sie ein Boxplot, um die Verteilungen und die Variabilität verschiedener chronischer Erkrankungen nach Bundesstaat zu vergleichen.

  • Numerische Felder: % Diabetes, % Asthma, % Heart Failure
  • Kategorie: Bundesstaat

Boxplots zum Vergleichen der Verteilungen und Variabilität verschiedener chronischer Erkrankungen nach Bundesstaat