Q-Q-Plot

Quantil-Quantil-Plots (Q-Q-Plots) sind ein exploratives Werkzeug zum Untersuchen der Ähnlichkeit zwischen der Verteilung einer numerischen Variable und einer Normalverteilung oder zwischen den Verteilungen von zwei numerischen Variablen.

Es gibt zwei Typen von Q-Q-Plots: Q-Q-Plots für normalverteilte Daten und allgemeine Q-Q-Plots.

  • In Q-Q-Plots für normalverteilte Daten werden die Quantile einer numerischen Variable den Quantilen einer Normalverteilung gegenübergestellt.
  • In allgemeinen Q-Q-Plots werden die Quantile der einen numerischen Variable den Quantilen einer zweiten numerischen Variable gegenübergestellt.

Wenn die Verteilungen der verglichenen Quantile identisch sind, bilden die dargestellten Punkte eine 45-Grad-Gerade. Je weiter die dargestellten Punkte von einer Geraden abweichen, desto weniger ähnlich sind die verglichenen Verteilungen.

Variablen

Für Q-Q-Plots für normalverteilte Daten ist eine numerische Variable erforderlich, die einer Normalverteilung gegenübergestellt wird. Für allgemeine Q-Q-Plots sind zwei numerische Variablen erforderlich, die einander gegenübergestellt werden.

Transformation

Einige analytische Methoden erfordern, dass die Daten normal verteilt sind. Wenn die Daten verzerrt sind (die Verteilung ist einseitig schief), sollten Sie die Daten transformieren, um eine Normalverteilung herzustellen. Mit Q-Q-Plots für normalverteilte Daten können Sie die Effekte von Datentransformationen auf die Verteilung Ihrer Daten beim Vergleich mit einer Normalverteilung erkunden.

Logarithmische Transformation

Die logarithmische Transformation wird häufig dann verwendet, wenn die Daten eine positiv verzerrte Verteilung haben und nur wenige große Werte vorhanden sind. Wenn diese großen Werte in Ihrem Dataset vorhanden sind, hilft die logarithmische Transformation, konstantere Varianzen zu erreichen und Ihre Daten zu normalisieren.

Hinweis:

Logarithmische Transformationen können nur dann angewendet werden, wenn alle Werte der Variablen größer als Null sind. Null-Werte führen zu einem Fehler.

Quadratwurzel-Transformation

Eine Quadratwurzel-Transformation ähnelt einer logarithmischen Transformation dadurch, dass sie die rechtsseitige Schiefe eines Datasets verringert. Im Gegensatz zur logarithmischen Transformation kann die Quadratwurzel-Transformation auch auf die Null angewendet werden.

Hinweis:

Quadratwurzel-Transformationen können nur dann angewendet werden, wenn alle Werte der Variablen größer als oder gleich Null sind. Negative Werte führen zu einem Fehler.

Invers

Bei einer Kehrwerttransformation wird der reziproke Wert (1/x) der einzelnen Werte (x) in dem Feld verwendet.

Hinweis:

Kehrwerttransformationen können nicht auf Null-Werte angewendet werden. Null-Werte in dem Feld werden als NULL-Werte behandelt.

Box-Cox

Bei einer Box-Cox-Transformation wird die folgende Potenzfunktion auf normal verteilte Werte angewendet:

Box-Cox-Transformation
Dabei gilt: x' ist der transformierte Wert, x ist der ursprüngliche Wert, λ1 ist der Potenzparameter und λ2 ist der Versatzparameter.

Hinweis:

Box-Cox-Transformationen können nur auf positive Werte angewendet werden. In Fällen, in denen negative oder Null-Werte vorhanden sind, verwenden Sie den Versatzparameter, um sicherzustellen, dass alle Werte positiv sind.

Achsen

Mehrere Optionen steuern die Achsen und die zugehörigen Einstellungen.

Achsengrenzen

Die Standardgrenzen für das Minimum und das Maximum der Achsen werden entsprechend dem Bereich der Datenwerte auf der Achse festgelegt. Diese Werte können durch Eingabe eines neuen gewünschten Wertes für die Achsengrenze angepasst werden. Durch Klicken auf das Symbol "Zurücksetzen" wird die Achsengrenze wieder auf den Standardwert zurückgesetzt.

Gitternetzintervalle

Gitternetzintervalle für die X-Achse und die Y-Achse werden mit den Steuerelementen unter Intervall konfiguriert. Die Standardgitternetzintervalle werden automatisch berechnet.

Zahlenformat

Sie können formatieren, wie auf einer Achse numerische Werte dargestellt werden, indem Sie eine Zahlenformatkategorie angeben oder eine benutzerdefinierte Formatzeichenfolge definieren.

Aussehen

Titel und Beschreibung

Die Standardtitel der Diagramme und Achsen basieren auf den Variablennamen und dem Diagrammtyp. Diese können auf der Registerkarte Allgemein im Bereich Diagrammeigenschaften bearbeitet werden. Sie können auch einen Wert für die Option Beschreibung angeben, wobei es sich um einen Textblock handelt, der am unteren Rand des Diagrammfensters angezeigt wird.

Farbe

Q-Q-Plots übernehmen ihre Umrisslinie und Füllfarben aus der Symbolisierung des Quell-Layers. Wenn ein Layer mit einem anderen Attribut als einer der Q-Q-Plot-Variablen symbolisiert wird, kann eine dritte Variable in der Visualisierung des Q-Q-Plots angezeigt werden.

Führungslinien

Führungslinien oder Bereiche können als Referenz oder zum Hervorheben signifikanter Werte zu Diagrammen hinzugefügt werden. Wechseln Sie zum Hinzufügen einer neuen Führungslinie zur Registerkarte Führungslinien im Bereich Diagrammeigenschaften, und wählen Sie aus, ob Sie eine vertikale oder eine horizontale Führungslinie zeichnen möchten. Klicken Sie auf den Pfeil auf der Schaltfläche Führungslinie hinzufügen, und wählen Sie eine der folgenden Optionen aus:

  • Führungslinie oder -bereich mit festen Werten erstellen: Zeichnet an einer festen Position eine Führungslinie oder einen Führungslinienbereich. Wenn diese Option ausgewählt ist, geben Sie unter Wert einen Wert an, wo die Linie gezeichnet werden soll. Um einen Bereich zu erstellen, geben Sie einen bis-Wert an.
  • Datengesteuerte Führung erstellen: Zeichnet eine datengesteuerte Führungslinie. Wenn diese Option ausgewählt ist, wählen Sie in der Dropdown-Liste Wert ein Feld aus, dessen Werte zur Berechnung der Position der Führungslinie verwendet werden sollen. Wählen Sie für die Aggregation eine Option aus, um anzugeben, wie diese Werte zusammengefasst werden.
  • Polylinien-Führungslinie erstellen: Zeichnet eine Polylinien-Führungslinie. Wenn diese Option ausgewählt ist, bearbeiten Sie die Datentabelle, um X- und Y-Werte einzugeben, mit denen die Stützpunkte erstellt werden sollen, um zu bestimmen, wie die Führungslinie gezeichnet wird. Diese Option ist nur verfügbar, wenn beide Achsen kontinuierlich sind.
Abhängig vom Typ der Führungslinie kann der Style der Führungslinie mit der Farbauswahl Linienfarbe oder Füllfarbe geändert werden. Fügen Sie optional Text zur Führungslinie hinzu, indem Sie einen Wert für Beschriftung angeben. Datengesteuerte Führungslinien zeigen immer den Wert der Führungslinie an (basierend auf den Feldwerten und der Aggregation). Dieser Wert wird an das Ende des für den Wert Beschriftung angegebenen Textes angehängt.

Beispiel

Erstellen eines Q-Q-Plots zum Untersuchen, ob bestimmte Materialproben in Kalifornien normal verteilt sind.

  • Die Verteilung vergleichen von:Particulate Matter
  • Mit Transformation: Keine
  • Mit: <Normalverteilung>
Q-Q-Plot

Verwandte Themen