Beschriftung | Erläuterung | Datentyp |
Vorhersagetyp
| Gibt den Operationsmodus des Werkzeugs an. Das Werkzeug kann ausgeführt werden, um ein Modell ausschließlich für die Bewertung der Performance zu trainieren, Features vorherzusagen oder eine vorhergesagte Oberfläche zu erstellen.
| String |
Eingabe-Trainings-Features
| Die Feature-Class mit dem Parameter Vorherzusagende Variable und optional den erklärenden Trainings-Variablen aus Feldern. | Feature Layer |
Vorherzusagende Variable
(optional) | Die Variable aus dem Parameter Eingabe-Trainings-Features mit den Werten, die zum Trainieren des Modells verwendet werden sollen. Dieses Feld enthält bekannte (Trainings-)Werte der Variablen, mit denen eine Vorhersage an unbekannten Positionen getroffen wird. | Field |
Variable als kategorisch behandeln (optional) | Gibt an, ob es sich bei Vorherzusagende Variable um eine Kategorievariable handelt.
| Boolean |
Erklärende Trainingsvariablen
(optional) | Eine Liste der Felder, die erklärende Variablen darstellen und die Vorhersage des Wertes oder der Kategorie von Vorherzusagende Variable unterstützen. Aktivieren Sie das Kontrollkästchen Kategorisch für alle Variablen, die Klassen oder Kategorien darstellen (z. B. Landbedeckung oder Anwesenheit oder Abwesenheit). | Value Table |
Erklärende Trainings-Entfernungs-Features
(optional) | Erstellt automatisch erklärende Variablen durch die Berechnung der Entfernung zwischen bereitgestellten Features und Eingabe-Trainings-Features. Entfernungen werden von den einzelnen erklärenden Trainings-Entfernungs-Features der Eingabe zu den nächsten Eingabe-Trainings-Features berechnet. Wenn es sich bei den erklärenden Trainings-Entfernungs-Features der Eingabe um Polygone oder Linien handelt, werden die Entfernungsattribute als Entfernung zwischen den nächstgelegenen Segmenten des Feature-Paares berechnet. | Feature Layer |
Erklärende Trainings-Raster (optional) | Erstellt automatisch erklärende Trainings-Variablen im Modell, deren Werte aus Rastern extrahiert werden. Der Wert der Raster-Zelle wird für jedes Feature in den Eingabe-Trainings-Features an der genauen Position extrahiert. Beim Extrahieren des Raster-Werts für kontinuierliche Raster wird bilineares Resampling verwendet. Beim Extrahieren eines Raster-Werts aus Kategorie-Rastern wird ein Nächster-Nachbar-Resampling durchgeführt. Aktivieren Sie das Kontrollkästchen Kategorie für alle Raster, die Klassen oder Kategorien darstellen, z. B. Landbedeckung oder Anwesenheit oder Abwesenheit. | Value Table |
Eingabe-Vorhersage-Features (optional) | Eine Feature-Class, die Positionen darstellt, an denen Vorhersagen getroffen werden. Diese Feature-Class muss auch erklärende Variablen enthalten, die als Felder bereitgestellt wurden und den von den Trainings-Daten verwendeten Feldern entsprechen, falls vorhanden. | Feature Layer |
Vorhergesagte Ausgabe-Features
(optional) | Die Ausgabe-Feature-Class zum Empfangen der Ergebnisse der Vorhersageergebnisse. | Feature Class |
Vorhergesagte Ausgabe-Oberfläche (optional) | Das Ausgabe-Raster mit den Vorhersageergebnissen. Die Standard-Zellengröße entspricht der maximalen Zellengröße der Raster-Eingaben. Um eine andere Zellengröße festzulegen, verwenden Sie die Umgebungseinstellung "Zellengröße". | Raster Dataset |
Erklärende Variablen abgleichen
(optional) | Eine Liste der angegebenen Werte für Erklärende Variablen aus den Eingabe-Trainings-Features rechts und den ihnen entsprechenden Feldern aus den Eingabe-Vorhersage-Features links. | Value Table |
Entfernungs-Features abgleichen
(optional) | Eine Liste der angegebenen erklärenden Entfernungs-Features für die Eingabe-Trainings-Features rechts. Die entsprechenden Feature-Sets müssen für die Eingabe-Vorhersage-Features links angegeben werden. Erklärende Entfernungs-Features, die als Eingabe-Vorhersage-Features angemessener sind, können angegeben werden, wenn sich die für das Training verwendeten Features auf ein anderes Untersuchungsgebiet oder einen anderen Zeitraum beziehen. | Value Table |
Erklärende Raster abgleichen
(optional) | Eine Liste der angegebenen erklärenden Raster für die Eingabe-Trainings-Features rechts. Die entsprechenden Raster müssen für die Eingabe-Vorhersage-Features oder die vorhergesagte Oberfläche, die erstellt werden soll, links angegeben werden. Erklärende Raster, die als Eingabe-Vorhersage-Features angemessener sind, können angegeben werden, wenn sich die für das Training verwendeten Features auf ein anderes Untersuchungsgebiet oder einen anderen Zeitraum beziehen. | Value Table |
Trainierte Ausgabe-Features
(optional) | Trainierte Ausgabe-Features enthält alle für das Training verwendeten erklärenden Variablen (einschließlich Sample-Raster-Werte und Entfernungsberechnungen) sowie das beobachtete Feld Vorherzusagende Variable und die zugehörigen Vorhersagen, mit denen die Performance des trainierten Modells weiter geprüft werden kann. | Feature Class |
Ausgabetabelle zur Variablenbedeutung
(optional) | Falls angegeben, enthält die Tabelle Informationen, die die Bedeutung der einzelnen, im erstellten Modell verwendeten erklärenden Variablen (Felder, Entfernungs-Features und Raster) beschreiben. Auf das Diagramm, das über diese Tabelle erstellt wird, können Sie im Bereich Inhalt zugreifen. | Table |
Polygone für Training in Raster-Auflösung konvertieren
(optional) | Gibt an, wie Polygone beim Trainieren des Modells behandelt werden, wenn es sich bei den Eingabe-Trainings-Features um Polygone mit kategorischer vorherzusagender Variable handelt und nur erklärende Trainings-Raster angegeben wurden.
| Boolean |
Anzahl der Strukturen
(optional) | Die Anzahl der Strukturen, die im Forest-Modell erstellt werden sollen. Eine höhere Anzahl von Strukturen führt zu einer genaueren Modellvorhersage, für die Berechnung des Modells wird jedoch mehr Zeit benötigt. Die Standardzahl von Strukturen beträgt 100. | Long |
Minimale Elementgröße
(optional) | Die minimale Anzahl der Beobachtungen, die mindestens erforderlich sind, um ein Element (also den Endpunkt einer Struktur, der keine weiteren Verzweigungen hat) beizubehalten. Das Standardminimum ist 5 für die Regression und 1 für die Klassifizierung. Bei sehr großen Daten führt eine Erhöhung dieser Zahlen zu einer Erhöhung der Laufzeit des Werkzeugs. | Long |
Maximale Strukturtiefe
(optional) | Die maximale Anzahl von Teilungen entlang einer Struktur. Je größer die maximale Tiefe, desto mehr Teilungen werden erstellt. Dadurch steigt das Risiko einer Überanpassung des Modells. Die Standardeinstellung ist datenabhängig und abhängig von der Anzahl der erstellten Strukturen und der berücksichtigten Variablen. | Long |
Pro Struktur verfügbare Daten (%)
(optional) | Gibt den Prozentsatz der für jede Entscheidungsstruktur verwendeten Eingabe-Trainings-Features an. Die Standardeinstellung liegt bei 100 Prozent der Daten. Samples für jede Struktur werden nach dem Zufallsprinzip aus zwei Dritteln der angegebenen Daten entnommen. Alle Entscheidungsbäume im Wald werden mithilfe einer zufälligen Stichprobe oder einer zufälligen Teilmenge (etwa zwei Drittel) der verfügbaren Trainingsdaten erstellt. Durch die Verwendung eines niedrigeren Prozentsatzes der Eingabedaten für die einzelnen Entscheidungsstrukturen wird die Geschwindigkeit des Werkzeugs bei sehr großen Datasets beschleunigt. | Long |
Anzahl der nach dem Zufallsprinzip erfassten Variablen
(optional) | Gibt die Anzahl der erklärenden Variablen für die Erstellung der einzelnen Entscheidungsstrukturen an. Alle Entscheidungsstrukturen in der Gesamtstruktur werden mithilfe einer zufälligen Teilmenge der erklärenden Variablen erstellt. Durch eine Erhöhung der Anzahl der in den einzelnen Entscheidungsbäumen verwendeten Variablen steigt die Wahrscheinlichkeit einer Überanpassung des Modells, vor allem dann, wenn dominante Variablen vorhanden sind. Eine gängige Praxis besteht darin, die Quadratwurzel aus der Gesamtzahl der erklärenden Variablen (Felder, Entfernungen und Raster) zu ziehen, wenn Vorherzusagende Variable numerisch ist, oder die Gesamtzahl der erklärenden Variablen (Felder, Entfernungen und Raster zusammengenommen) durch 3 zu teilen, wenn Vorherzusagende Variable kategorisch ist. | Long |
% der Trainingsdaten für die Validierung ausgeschlossen (optional) | Gibt den Prozentsatz (zwischen 10 und 50 Prozent) der Eingabe-Trainings-Features an, die als Test-Dataset für die Validierung reserviert sind. Das Modell wird ohne diese zufällige Teilmenge der Daten trainiert, und die beobachteten Werte für diese Features werden mit den vorhergesagten Werten verglichen. Der Standardwert ist 10 Prozent. | Double |
Ausgabetabelle für Klassifizierungs-Performance (Konfusionsmatrix) (optional) | Falls angegeben, wird eine Konfusionsmatrix für die Klassifizierung erstellt, die die Performance des erstellten Modells zusammenfasst. Mit dieser Tabelle können andere Diagnosen berechnet werden, die über Kennzahlen für Genauigkeit und Empfindlichkeit hinausgehen, die das Werkzeug in den Ausgabemeldungen berechnet. | Table |
Ausgabetabelle der Validierung (optional) | Wenn die angegebene Anzahl der ausgeführten Validierungen größer als 2 ist, erstellt diese Tabelle für jedes Modell ein Diagramm der Verteilung von R2. Mit dieser Verteilung können Sie die Stabilität Ihres Modells bewerten. | Table |
Spärliche Kategorien ausgleichen
(optional) | Wenn Ihr Dataset Kategorien enthält, die seltener als andere vorkommen, wird durch Aktivieren dieses Parameters sichergestellt, dass jede Kategorie in jeder Struktur vertreten ist.
| Boolean |
Anzahl der ausgeführten Validierungen
(optional) | Das Werkzeug führt die angegebene Anzahl von Wiederholungen aus. Die Verteilung von R2 für jede Ausführung kann mit dem Parameter Ausgabetabelle der Validierung angezeigt werden. Wenn diese Option festgelegt ist und Vorhersagen generiert werden, wird nur das Modell, das den höchsten R2-Wert erzeugt, für Vorhersagen verwendet. | Long |
Unsicherheit berechnen
(optional) | Gibt an, ob beim Trainieren oder beim Vorhersagen von Features oder Rastern die Vorhersageunsicherheit berechnet wird.
| Boolean |
Abgeleitete Ausgabe
Beschriftung | Erläuterung | Datentyp |
Ausgabe-Unsicherheits-Raster-Layer | Wenn Sie Unsicherheit berechnen aktivieren, berechnet das Werkzeug für jeden Wert der Vorherzusagenden Variablen ein Vorhersageintervall von 90 Prozent. | Raster-Layer |