Feldstatistik in Tabelle (Data Management)

Zusammenfassung

Erstellt eine Tabelle beschreibender Statistiken für Eingabefelder in einer Tabelle oder Feature-Class.

Abbildung

Abbildung "Feldstatistik in Tabelle"

Verwendung

  • Dieses Werkzeug akzeptiert eine Feature-Class oder eine Standalone-Tabelle als Eingabe.

  • Im Parameter Eingabefelder können mehrere Felder, für die Statistiken berechnet werden können, angegeben werden. Dieser Parameter akzeptiert numerische Felder (Datentypen "Short", "Long", "Float" und "Double"), Textfelder und Datumsfelder.

  • Die Reihenfolge der Zeilen in der Ausgabetabelle entspricht der Reihenfolge der angegebenen Felder im Parameter Eingabefelder.

  • Der Parameter Nach Feld gruppieren wird verwendet, um die Eingabefeldstatistiken für jeden Einzelwert im angegebenen Feld separat zu berechnen. Die Statistiken für jedes der Eingabefelder werden für jeden Einzelwert im Parameter "Nach Feld gruppieren" einmal berechnet und ausgegeben.

  • Der Parameter Ausgabetabellen stellt vier Optionen für die Spalte Feldtypen bereit:

    • Alle: Unabhängig vom Feldtyp werden alle Eingabefelder und Ausgabestatistiken in eine Ausgabetabelle exportiert.
    • Numerisch: In die Ausgabetabelle werden nur die numerischen Felder (Datentypen "Short", "Long", "Float" und "Double") unter den Eingabefeldern und nur die Statistiken, die für numerische Felder berechnet werden können, exportiert.
    • Text: In die Ausgabetabelle werden nur die Textfelder unter den Eingabefeldern und nur die Statistiken, die für Textfelder berechnet werden können, exportiert.
    • Datum: In die Ausgabetabelle werden nur die Datumsfelder unter den Eingabefeldern und nur die Statistiken, die für Datumsfelder berechnet werden können, exportiert.

    Für jede Ausgabetabelle wird der Name der Tabelle in der Spalte Ausgabename des Parameters Ausgabetabellen angegeben. Die Tabelle wird dann in dem Workspace gespeichert, der im Parameter Ausgabeverzeichnis angegeben ist.

  • Die Ausgabestatistiken und ihre Feldnamen können mit dem Parameter Ausgabestatistiken konfiguriert werden. Wenn für diesen Parameter kein Wert angegeben wurde, werden alle möglichen Ausgabestatistiken in die Ausgabetabellen exportiert. Die folgende Tabelle enthält für jede Option der Spalte Feldtypen des Parameters Ausgabetabellen die verfügbaren Statistiken mit dem entsprechenden Ausgabefeldtyp:

    AusgabestatistikenAlleNumerischTextDatum

    Feldname

    Text

    Text

    Text

    Text

    Alias

    Text

    Text

    Text

    Text

    Feldtyp

    Text

    Text

    Text

    Text

    NULL-Werte

    Long

    Long

    Long

    Long

    Minimum

    Text

    Double

    -

    Datum

    Maximum

    Text

    Double

    -

    Datum

    Mittelwert

    Text

    Double

    -

    Datum

    Standardabweichung

    Double

    Double

    -

    -

    Medianwert

    Text

    Double

    -

    Datum

    Anzahl

    Long

    Long

    Long

    Long

    Anzahl Einzelwerte

    Long

    Long

    Long

    Long

    Modalwert

    Text

    Double

    Text

    Datum

    Am seltensten

    Text

    Double

    Text

    Datum

    Ausreißer

    Long

    Long

    -

    -

    Summe

    Double

    Double

    -

    -

    Bereich

    Text

    Double

    -

    -

    Interquartil-Bereich

    Double

    Double

    -

    -

    Erstes Quartil

    Text

    Double

    -

    Datum

    Drittes Quartil

    Text

    Double

    -

    Datum

    Variationskoeffizient

    Double

    Double

    -

    -

    Schiefe

    Double

    Double

    -

    -

    Kurtosis

    Double

    Double

    -

    -

    Diese Liste enthält für jeden Ausgabetabellentyp die verfügbaren Statistiken mit den entsprechenden Ausgabefeldtypen.
  • Hier sind dieselben Statistiken verfügbar wie in der Ansicht "Data Engineering". Weitere Informationen zur Berechnung der einzelnen Statistiken finden Sie unter Interagieren mit Statistik.

  • Wenn Sie die Option Alle für die Spalte Feldtypen des Parameters Ausgabetabellen auswählen, werden Felder aller Typen in eine einzelne Tabelle exportiert. Damit können Sie alle Eingabefelder mit ihren Statistiken auf einmal visualisieren. Bei bestimmten Anwendungen hat dies Vorteile. Zum Beispiel könnte dies die bevorzugte Methode beim Verwenden der Statistiken in einem Layout oder einem Bericht sein. Allerdings sind beim Exportieren von Feldern unterschiedlicher Typen in eine einzelne Tabelle einige Einschränkungen zu beachten. Bestimmte Statistikoptionen, die mehreren Feldtypen gemeinsam sind, wie zum Beispiel Modalwert, Am seltensten, Minimum und Maximum, werden als Textfelder in der Ausgabetabelle gespeichert. Dies kann Probleme verursachen, zum Beispiel beim Sortieren dieser Werte in den Statistikspalten oder beim Verketten der Ausgabestatistiken in einem Modell. Da bestimmte Statistiken für Text- oder Datumsfelder nicht berechnet werden können, können in der Tabelle auch leere Zellen vorhanden sein.

  • Wenn Sie Numerisch, Text oder Datum für die Spalte Feldtypen des Parameters Ausgabetabellen auswählen, werden die Felder jedes Typs in eine separate Tabelle exportiert. In diesem Fall enthalten die Ausgabetabellen nur die Statistiken, die für diesen Feldtyp berechnet werden können. Bestimmte Statistiken, die für mehrere Feldtypen berechnet werden können, werden in dem Format gespeichert, das dem Eingabefeldtyp entspricht. Zum Beispiel hat das Feld Minimum in der Tabelle "Numerisch" den Typ "Double" und in der Tabelle "Datum" den Typ "Date". Es wird empfohlen, verschiedene Ausgabetabellen zu verwenden. Wenn zum Beispiel die Statistiken mit dem Typ der Eingabefelder gespeichert werden sollen, dann müssen Sie die Statistiken in der Ausgabetabelle sortieren oder weiterhin deren Werte in einem Modell verwenden.

  • Bei gleichwertigen Übereinstimmungen können die Statistikoptionen Modalwert und Am seltensten mehreren Werten in einem Eingabefeld entsprechen. In solchen Fällen werden mehrere Werte in den Ausgabetabellen "Numerisch", "Text" und "Datum" als <Null> ausgegeben. Bei der Option Alle enthält die Ausgabezelle den Text "Mehrere Werte".

Parameter

BeschriftungErläuterungDatentyp
Eingabetabelle

Die Eingabetabelle mit den Feldern, die zur Berechnung der Tabelle der Statistiken verwendet werden sollen.

Table View
Eingabefelder

Das Feld, das die Werte enthält, die zur Berechnung der Statistiken verwendet werden.

Field
Ausgabeverzeichnis

Der Speicherort, an dem die Ausgabetabellen erstellt werden. Der Speicherort kann eine Geodatabase, ein Ordner oder ein Feature-Dataset sein.

Workspace; Feature Dataset
Ausgabetabellen

Die Ausgabetabellen mit den Statistiken. Die Spalte Feldtypen gibt die Typen der Felder an, die in eine Ausgabetabelle exportiert werden sollen. Der Name der jeweiligen Ausgabetabelle wird in der Spalte Ausgabename angegeben. Sie können zum Beispiel eine einzelne Tabelle mit Zusammenfassungen aller Feldtypen erstellen oder separate Tabellen für Zusammenfassungen der Feldtypen "Numerisch", "Text" und "Datum" erstellen.

Für die Spalte Feldtypen sind die folgenden Optionen verfügbar:

  • Numerisch: Bei dieser Option wird eine Tabelle mit der Zusammenfassung der numerischen Felder der Eingabe (Datentypen "Short", "Long", "Float" und "Double") erstellt.
  • Text: Bei dieser Option wird eine Tabelle mit der Zusammenfassung der Textfelder der Eingabe (Datentyp "Text") erstellt.
  • Datum: Bei dieser Option wird eine Tabelle mit der Zusammenfassung der Datumsfelder der Eingabe (Datentyp "Date") erstellt.
  • Alle: Bei dieser Option wird eine Tabelle mit der Zusammenfassung aller numerischen, Text- und Datumsfelder der Eingabe erstellt. Ausgabefelder mit Statistiken, die für mehrere Feldtypen berechnet werden können, werden mit dem Datentyp "Text" gespeichert. Ausgabestatistiken, die für Text- und Datumsfelder nicht berechnet werden können, bleiben leer.

Value Table
Nach Feld gruppieren
(optional)

Das Feld, das zum Gruppieren der Zeilen in Kategorien verwendet werden soll. Wenn eine Gruppierung nach Feld angegeben wurde, wird für jeden Einzelwert in der Gruppierung nach Feld jedes Feld der Eingabe einmal als Zeile in der Ausgabetabelle ausgegeben.

Field
Ausgabestatistiken
(optional)

Gibt die Statistiken an, die zusammengefasst werden sollen, sowie die Namen der Ausgabefelder, die diese Statistiken enthalten. Die Statistik wird in der Spalte Statistik angegeben. Der Name des Ausgabefeldes wird in der Spalte Ausgabefeldname angegeben. Wenn keine Werte angegeben wurden, werden alle möglichen Statistiken für alle Eingabefelder berechnet.

Für die Spalte Statistik sind die folgenden Optionen verfügbar (wobei nur die Statistiken verfügbar sind, die für die Eingabefelder berechnet werden können):

  • Feldname: Der Name des Feldes.
  • Alias: Der Aliasname des Feldes.
  • Feldtyp: Der Feldtyp des Feldes ("Short", "Long", "Double", "Float", "Text" oder "Date").
  • NULL-Werte: Die Anzahl der Datensätze mit NULL-Werten im Feld.
  • Minimum: Der kleinste Wert im angegebenen Feld.
  • Maximum: Der größte Wert im angegebenen Feld.
  • Mittelwert: Der Mittelwert (Summe geteilt durch Gesamtzahl) aller Werte im Feld. Bei der Berechnung des mittleren Datums für Datumsfelder wird jedes Datum in eine Zahl umgewandelt, indem die Differenz zwischen dem Datum und einem Referenzdatum (z. B. 1900-01-01) in Millisekunden berechnet wird.
  • Standardabweichung: Die Standardabweichung der Werte im Feld. Sie wird als Quadratwurzel der Varianz berechnet, wobei die Varianz der durchschnittlichen quadrierten Differenz aller Werte vom Durchschnitt des Feldes entspricht.
  • Median: Der Durchschnitt aller Werte im Feld. Der Medianwert ist der mittlere Wert in der sortierten Werteliste. Bei einer geraden Werteanzahl ist der Medianwert der Mittelwert der beiden mittleren Werten in der Verteilung.
  • Anzahl: Die Anzahl der Werte im Feld, die keine NULL-Werte sind.
  • Anzahl Einzelwerte: Die Anzahl der Einzelwerte im Feld.
  • Modalwert: Der am häufigsten auftretende Wert im Feld.
  • Am seltensten: Der seltenste Wert im Feld.
  • Ausreißer: Die Anzahl der Datensätze mit Ausreißerwerten im Feld. Ausreißer sind Werte, die um mehr als das 1,5-fache des Interquartil-Bereichs oberhalb des dritten Quartils oder unterhalb des ersten Quartils der Werte des Feldes liegen.
  • Summe: Die Summe aller Werte im Feld,
  • Bereich: Die Differenz zwischen dem größten und dem kleinsten Wert im Feld.
  • Interquartil-Bereich: Der Bereich zwischen den Werten des ersten Quartils und den Werten des dritten Quartils im Feld. Dies ist der Bereich der mittleren Hälfte der Daten.
  • Erstes Quartil: Der Wert des ersten Quartils im Feld. Quartile unterteilen die sortierte Werteliste in vier Gruppen mit der jeweils gleichen Anzahl an Werten. Das erste Quartil entspricht dem oberen Grenzwert der ersten Gruppe in aufsteigender Reihenfolge.
  • Drittes Quartil: Der Wert des dritten Quartils im Feld. Quartile unterteilen die sortierte Werteliste in vier Gruppen mit der jeweils gleichen Anzahl an Werten. Das dritte Quartil entspricht dem oberen Grenzwert der dritten Gruppe in aufsteigender Reihenfolge.
  • Variationskoeffizient: Der Variationskoeffizient für die Werte im Feld. Der Variationskoeffizient gibt die relative Verbreitung der Werte an. Er berechnet sich als die durch den Mittelwert des Feldes geteilte Standardabweichung.
  • Schiefe: Die Schiefe aller Werte im Feld. Die Schiefe misst die Symmetrie der Verteilung. Die Schiefe wird berechnet, indem das dritte Moment (Durchschnitt der kubierten Datenwerte) durch die kubierte Standardabweichung geteilt wird.
  • Kurtosis: Die Kurtosis aller Werte im Feld. Die Kurtosis beschreibt das Gewicht der Flanken einer Verteilung im Vergleich zur Normalverteilung. Mit ihrer Hilfe lässt sich feststellen, wie häufig Extremwerte auftreten. Die Kurtosis wird berechnet als das vierte Moment (der Durchschnitt der vierten Potenz der Datenwerte) geteilt durch die vierte Potenz der Standardabweichung.

Value Table

Abgeleitete Ausgabe

BeschriftungErläuterungDatentyp
Ausgabetabelle für numerische Felder

Die Ausgabetabellen für Daten des Typs "Numerisch". Die Tabelle wird in dem Workspace gespeichert, der im Parameter Ausgabeverzeichnis angegeben ist.

Table
Ausgabetabelle für Textfelder

Die Ausgabetabellen für Daten des Typs "Text". Die Tabelle wird in dem Workspace gespeichert, der im Parameter Ausgabeverzeichnis angegeben ist.

Table
Ausgabetabelle für Datumsfelder

Die Ausgabetabellen für Daten des Typs "Datum". Die Tabelle wird in dem Workspace gespeichert, der im Parameter Ausgabeverzeichnis angegeben ist.

Table
Ausgabetabelle für alle Felder

Die Ausgabetabellen für Daten aller Typen. Die Tabelle wird in dem Workspace gespeichert, der im Parameter Ausgabeverzeichnis angegeben ist.

Table

arcpy.management.FieldStatisticsToTable(in_table, in_fields, out_location, out_tables, {group_by_field}, {out_statistics})
NameErläuterungDatentyp
in_table

Die Eingabetabelle mit den Feldern, die zur Berechnung der Tabelle der Statistiken verwendet werden sollen.

Table View
in_fields
[in_fields,...]

Das Feld, das die Werte enthält, die zur Berechnung der Statistiken verwendet werden.

Field
out_location

Der Speicherort, an dem die Ausgabetabellen erstellt werden. Der Speicherort kann eine Geodatabase, ein Ordner oder ein Feature-Dataset sein.

Workspace; Feature Dataset
out_tables
[[field_type, output_name],...]

Die Ausgabetabellen mit den Statistiken. Die Spalte field_type gibt die Typen der Felder an, die in eine Ausgabetabelle exportiert werden sollen. Der Name der jeweiligen Ausgabetabelle wird in der Spalte output_name angegeben. Sie können zum Beispiel eine einzelne Tabelle mit Zusammenfassungen aller Feldtypen erstellen oder separate Tabellen für Zusammenfassungen der Feldtypen "Numerisch", "Text" und "Datum" erstellen.

Für die Spalte field_type sind die folgenden Optionen verfügbar:

  • NUMERIC: Bei dieser Option wird eine Tabelle mit der Zusammenfassung der numerischen Felder der Eingabe (Datentypen "Short", "Long", "Float" und "Double") erstellt.
  • TEXT: Bei dieser Option wird eine Tabelle mit der Zusammenfassung der Textfelder der Eingabe (Datentyp "Text") erstellt.
  • DATE: Bei dieser Option wird eine Tabelle mit der Zusammenfassung der Datumsfelder der Eingabe (Datentyp "Date") erstellt.
  • ALL: Bei dieser Option wird eine Tabelle mit der Zusammenfassung aller numerischen, Text- und Datumsfelder der Eingabe erstellt. Ausgabefelder mit Statistiken, die für mehrere Feldtypen berechnet werden können, werden mit dem Datentyp "Text" gespeichert. Ausgabestatistiken, die für Text- und Datumsfelder nicht berechnet werden können, bleiben leer.

Value Table
group_by_field
(optional)

Das Feld, das zum Gruppieren der Zeilen in Kategorien verwendet werden soll. Wenn eine Gruppierung nach Feld angegeben wurde, wird für jeden Einzelwert in der Gruppierung nach Feld jedes Feld der Eingabe einmal als Zeile in der Ausgabetabelle ausgegeben.

Field
out_statistics
[[out_statistic, output_name],...]
(optional)

Gibt die Statistiken an, die zusammengefasst werden sollen, sowie die Namen der Ausgabefelder, die diese Statistiken enthalten. Die Statistik wird in der Spalte out_statistic angegeben. Der Name des Ausgabefeldes wird in der Spalte output_name angegeben. Wenn keine Werte angegeben wurden, werden alle möglichen Statistiken für alle Eingabefelder berechnet.

Für die Spalte out_statistic sind die folgenden Optionen verfügbar (wobei nur die Statistiken verfügbar sind, die für die Eingabefelder berechnet werden können):

  • FIELDNAME: Der Name des Feldes.
  • ALIAS: Der Aliasname des Feldes.
  • FIELDTYPE: Der Feldtyp des Feldes ("Short", "Long", "Double", "Float", "Text" oder "Date").
  • NULLS: Die Anzahl der Datensätze mit NULL-Werten im Feld.
  • MINIMUM: Der kleinste Wert im Feld.
  • MAXIMUM: Der größte Wert im Feld.
  • MEAN: Der Mittelwert (Summe geteilt durch Gesamtzahl) aller Werte im Feld. Bei der Berechnung des mittleren Datums für Datumsfelder wird jedes Datum in eine Zahl umgewandelt, indem die Differenz zwischen dem Datum und einem Referenzdatum (z. B. 1900-01-01) in Millisekunden berechnet wird.
  • STANDARDDEVIATION: Die Standardabweichung der Werte im Feld. Sie wird als Quadratwurzel der Varianz berechnet, wobei die Varianz der durchschnittlichen quadrierten Differenz aller Werte vom Durchschnitt des Feldes entspricht.
  • MEDIAN: Der Durchschnitt aller Werte im Feld. Der Medianwert ist der mittlere Wert in der sortierten Werteliste. Bei einer geraden Werteanzahl ist der Medianwert der Mittelwert der beiden mittleren Werten in der Verteilung.
  • COUNT: Die Anzahl der Einzelwerte im Feld.
  • NUMBEROFUNIQUEVALUES: Die Anzahl der Einzelwerte im Feld.
  • MODE: Der am häufigsten auftretende Wert im Feld.
  • LEASTCOMMON: Der seltenste Wert im Feld
  • OUTLIERS: Die Anzahl der Datensätze mit Ausreißerwerten im Feld. Ausreißer sind Werte, die um mehr als das 1,5-fache des Interquartil-Bereichs oberhalb des dritten Quartils oder unterhalb des ersten Quartils der Werte des Feldes liegen.
  • SUM: Die Summe aller Werte im Feld,
  • RANGE: Die Differenz zwischen dem größten und dem kleinsten Wert im Feld.
  • INTERQUARTILERANGE: Der Bereich zwischen den Werten des ersten Quartils und den Werten des dritten Quartils der Werte des Feldes. Dies ist der Bereich der mittleren Hälfte der Daten.
  • FIRSTQUARTILE: Der Wert des ersten Quartils des Feldes. Quartile unterteilen die sortierte Werteliste in vier Gruppen mit der jeweils gleichen Anzahl an Werten. Das erste Quartil entspricht dem oberen Grenzwert der ersten Gruppe in aufsteigender Reihenfolge.
  • THIRDQUARTILE: Der Wert des dritten Quartils des Feldes. Quartile unterteilen die sortierte Werteliste in vier Gruppen mit der jeweils gleichen Anzahl an Werten. Das dritte Quartil entspricht dem oberen Grenzwert der dritten Gruppe in aufsteigender Reihenfolge.
  • COEFFICIENTOFVARIATION: Der Variationskoeffizient für die Werte im Feld. Der Variationskoeffizient gibt die relative Verbreitung der Werte an. Er berechnet sich als die durch den Mittelwert des Feldes geteilte Standardabweichung.
  • SKEWNESS: Die Schiefe aller Werte im Feld. Die Schiefe misst die Symmetrie der Verteilung. Die Schiefe wird berechnet, indem das dritte Moment (Durchschnitt der kubierten Datenwerte) durch die kubierte Standardabweichung geteilt wird.
  • KURTOSIS: Die Kurtosis aller Werte im Feld. Die Kurtosis beschreibt das Gewicht der Flanken einer Verteilung im Vergleich zur Normalverteilung. Mit ihrer Hilfe lässt sich feststellen, wie häufig Extremwerte auftreten. Die Kurtosis wird berechnet als das vierte Moment (der Durchschnitt der vierten Potenz der Datenwerte) geteilt durch die vierte Potenz der Standardabweichung.

Value Table

Abgeleitete Ausgabe

NameErläuterungDatentyp
out_numeric

Die Ausgabetabellen für Daten des Typs "Numerisch". Die Tabelle wird in dem Workspace gespeichert, der im Parameter Ausgabeverzeichnis angegeben ist.

Table
out_text

Die Ausgabetabellen für Daten des Typs "Text". Die Tabelle wird in dem Workspace gespeichert, der im Parameter Ausgabeverzeichnis angegeben ist.

Table
out_date

Die Ausgabetabellen für Daten des Typs "Datum". Die Tabelle wird in dem Workspace gespeichert, der im Parameter Ausgabeverzeichnis angegeben ist.

Table
out_all

Die Ausgabetabellen für Daten aller Typen. Die Tabelle wird in dem Workspace gespeichert, der im Parameter Ausgabeverzeichnis angegeben ist.

Table

Codebeispiel

FieldStatisticsToTable – Beispiel 1 (Python-Fenster)

Das folgende Skript im Python-Fenster veranschaulicht, wie Sie die Funktion FieldStatisticsToTable verwenden.

import arcpy
arcpy.management.FieldStatisticsToTable("SNAP_County_Rates", 
      "LocId;Program_Name;Participants;SNAP_Rate;TimeofYear", r"C:\Output.gdb", 
      "ALL All_Table;DATE Date_Table;NUMERIC Num_Table;TEXT Text_Table")
FieldStatisticsToTable – Beispiel 2 (eigenständiges Skript)

Im folgenden eigenständigen Python-Skript wird veranschaulicht, wie Sie die Funktion FieldStatisticsToTable verwenden.

# Import system modules.
import arcpy

try:
    # Set the workspace and input features. 
    arcpy.env.workspace = r"C:\\Statistics\\MyData.gdb" 
    in_table = "County_Data" 
 
    # Set the input fields that will be used to calculate statistics. 
    in_fields = "population_total;unemployment_rate;income;county_name;sample_date" 
 
    # Set the output location.
    out_location = r"C:\\Statistics\\MyData.gdb"

    # Set the output table field type and name.
    out_tables = "ALL AllStats_Table;DATE DateStats_Table;NUMERIC NumStats_Table;TEXT TextStats_Table"
 
    # Run the Field Statistics To Table tool 
    arcpy.management.FieldStatisticsToTable (in_table, in_fields, out_location, out_tables) 
 
except arcpy.ExecuteError: 
    # If an error occurred when running the tool, print the error message. 
    print(arcpy.GetMessages())

Umgebungen

Dieses Werkzeug verwendet keine Geoverarbeitungsumgebungen.

Lizenzinformationen

  • Basic: Ja
  • Standard: Ja
  • Advanced: Ja

Verwandte Themen