Analyse der kausalen Inferenz (Spatial Statistics)

Zusammenfassung

Schätzt den kausalen Effekt einer kontinuierlichen Expositionsvariable auf eine kontinuierliche Ergebnisvariable durch Approximation an ein randomisiertes Experiment und die Berücksichtigung konfundierender Variablen.

Bei statistischen Experimenten wird die Ursache-Wirkungs-Beziehung zwischen einer Expositionsvariable (z. B. der Dosis eines Arzneimittels) und einer Ergebnisvariable (z. B. einem gesundheitlichen Ergebnis) bestimmt, indem jedem Teilnehmer nach dem Zufallsprinzip ein bestimmtes Expositionsniveau zugewiesen wird, sodass etwaige Unterschiede in den Ergebnissen nur auf die Unterschiede bei den Expositionen und nicht auf andere Attribute der Teilnehmer, wie Alter, Vorerkrankungen und Zugang zum Gesundheitswesen, zurückzuführen sein müssen. Da es jedoch häufig nicht möglich oder unethisch ist, kontrollierte Experimente durchzuführen, werden Beziehungen oft durch Beobachtungsstudien hergestellt. Um die Auswirkung der Luftverschmutzung auf die Depressionsrate zu untersuchen, kann man beispielsweise nicht absichtlich Personen einer hohen Luftverschmutzung aussetzen, um die Auswirkung auf Depressionen zu ermitteln. Stattdessen kann man nur die Belastung durch Umweltverschmutzung und die Depressionsraten der Personen in einer Stichprobe beobachten. Da es jedoch viele Variablen (sogenannte konfundierende Variablen) gibt, die sich sowohl auf die Umweltverschmutzung als auch auf die Depressionen auswirken, kann der kausale Effekt nicht direkt geschätzt werden, ohne diese Variablen zu berücksichtigen.

Um den Prozess eines randomisierten, kontrollierten Experiments zu emulieren, berechnet das Werkzeug Wahrscheinlichkeits-Scores für jede Beobachtung, und die Wahrscheinlichkeits-Scores werden verwendet, um die Beobachtungen so zu gewichten, dass die kausale Beziehung zwischen der Expositions- und Ergebnisvariable erhalten bleibt, aber Korrelationen zwischen den konfundierenden Variablen und der Expositionsvariable entfernt werden. Dieses gewichtete Dataset wird häufig als Pseudo-Grundgesamtheit bezeichnet und hat Eigenschaften analog eines kontrollierten Experiments, bei dem jedem Teilnehmer nach dem Zufallsprinzip eine Exposition zugewiesen wird. Anhand der gewichteten Beobachtungen erstellt das Werkzeug eine Exposure-Response-Funktion (ERF), die schätzt, wie das durchschnittliche Ergebnis aussehen würde, wenn alle Mitglieder der Grundgesamtheit einen bestimmten Expositionswert erhalten, die konfundierenden Variablen aber unverändert bleiben würden.

Weitere Informationen zur Funktionsweise der "Analyse der kausalen Inferenz"

Abbildung

Abbildung des Werkzeugs "Analyse der kausalen Inferenz"
Der kausale Effekt zwischen einer Exposition und einem Ergebnis wird geschätzt, indem konfundierende Variablen ausgeglichen werden.

Verwendung

  • Bei der Analyse der kausalen Inferenz wird davon ausgegangen, dass alle wichtigen konfundierenden Variablen im Modell enthalten sind. Dies bedeutet, dass die Schätzung des kausalen Effekts verzerrt wird, wenn Variablen, die sich auf die Expositions- und konfundierenden Variablen auswirken, nicht als konfundierende Variablen einbezogen werden. Das Werkzeug kann nicht ermitteln, ob alle wichtigen konfundierenden Variablen einbezogen wurden. Daher ist es entscheidend zu überlegen, welche Variablen mit Ihren Expositions- und Ergebnisvariablen in Zusammenhang stehen könnten, und diese in das Modell aufzunehmen. Wenn es wichtige konfundierende Variablen gibt, die nicht einbezogen werden können, müssen Sie die Ergebnisse des Werkzeugs mit äußerster Vorsicht und Skepsis interpretieren. Alternativ können Sie das Werkzeug auch erst verwenden, wenn Sie Daten für alle konfundierenden Variablen erfassen können.

  • Die Expositionsvariable muss kontinuierlich sein (nicht binär oder kategorial), aber die konfundierenden Variablen können kontinuierlich, kategorial oder binär sein. Es wird empfohlen, dass die Ergebnisvariable kontinuierlich ist, wobei binäre Ergebnisvariablen zulässig sind und häufig als Wahrscheinlichkeiten oder Proportionen interpretiert werden können.

  • Das Werkzeug akzeptiert sowohl räumliche als auch nichträumliche Eingabe-Datasets. Sie können Tabellen, Punkte, Polygone und Polylinien als Eingabe verwenden, und die Ausgabe weist denselben Typ wie die Eingabe auf.

  • Die primäre Ausgabe des Werkzeugs ist eine ERF, die in einer aktiven Karte als Grafik-Layer und in den Geoverarbeitungsmeldungen als Bild zurückgegeben wird. Mithilfe des Parameters Exposure-Response-Funktion-Ausgabetabelle können Sie auch eine Tabelle erstellen, die verschiedene Exposure-Response-Werte enthält.

    Weitere Informationen zur ERF

  • Mithilfe des Parameters Wahrscheinlichkeits-Score-Berechnungsmethode können Sie angeben, wie Wahrscheinlichkeits-Scores geschätzt werden sollen. Bei Wahrscheinlichkeits-Scores handelt es sich um die Wahrscheinlichkeiten, einen bestimmten Expositionswert zu erhalten, wenn eine Reihe konfundierender Variablen vorhanden ist. Wahrscheinlichkeits-Scores werden geschätzt, indem ein Modell erstellt wird, das die Expositionsvariable anhand der konfundierenden Variablen voraussagt. Folgende Berechnungsmethoden für den Wahrscheinlichkeits-Score sind verfügbar:

  • Mithilfe des Parameters Ausgleichsmethode können Sie angeben, wie die Wahrscheinlichkeits-Scores zum Ausgleich der konfundierenden Variablen verwendet werden sollen. Es sind zwei Ausgleichsmethoden verfügbar:

    • Wahrscheinlichkeits-Score-Abgleich: Jede Beobachtung wird mit verschiedenen anderen Beobachtungen abgeglichen, die ähnliche Wahrscheinlichkeits-Scores aber unterschiedliche Expositionswerte aufweisen. Durch den Vergleich des Ergebniswertes der Beobachtung mit dem Ergebniswert der Entsprechungen können Sie erkennen, wie der Ergebniswert der Beobachtung bei einem anderen Expositionswert ausgesehen haben könnte. Nach dem Abgleich aller Beobachtungen mit verschiedenen anderen Beobachtungen, wird jeder Beobachtung eine Ausgleichsgewichtung zugewiesen, die der Anzahl der Übereinstimmungen der Beobachtung mit einer anderen Beobachtung entspricht. Dieses Gewichtungsschema wird damit begründet, dass Beobachtungen mit einer großen Anzahl an Übereinstimmungen konfundierende Variablen aufweisen, die bei vielen Werten der Expositionsvariable gleich waren, sodass sie für den kausalen Effekt am repräsentativsten sind.
    • Umkehrung der Wahrscheinlichkeits-Score-Gewichtung: Jeder Beobachtung werden Ausgleichsgewichtungen zugewiesen, indem der Wahrscheinlichkeits-Score umgekehrt und mit der allgemeinen Wahrscheinlichkeit des Vorliegens der jeweiligen Exposition multipliziert wird. Hierdurch erhalten Beobachtungen mit niedrigen Wahrscheinlichkeits-Scores höhere Ausgleichsgewichtungen und Beobachtungen mit hohen Wahrscheinlichkeits-Scores niedrigere Ausgleichsgewichtungen. Dieses Gewichtungsschema wird damit begründet, dass die Wahrscheinlichkeits-Scores ein Maß dafür sind, wie häufig oder selten der Expositionswert für die jeweilige Gruppe konfundierender Variablen ist. Durch die Erhöhung des Einflusses (Erhöhung der Ausgleichsgewichtung) ungewöhnlicher Beobachtungen (Beobachtungen mit niedrigen Wahrscheinlichkeits-Scores) und die Verringerung des Einflusses häufiger Beobachtungen bleiben die Gesamtverteilungen konfundierender Variablen für alle Werte der Expositionsvariable proportional erhalten.

    Weitere Informationen zu Wahrscheinlichkeits-Scores, dem Wahrscheinlichkeits-Score-Abgleich und der Umkehrung der Wahrscheinlichkeits-Score-Gewichtung

  • Standardmäßig werden mit dem Werkzeug Beobachtungen gekürzt (aus der Analyse entfernt), die das obere und untere 1 Prozent der Expositionswerte aufweisen. Extreme Werte oder Ausreißer in der Expositionsvariable können bei Analysen der kausalen Inferenz zu Verzerrungen führen. Durch Kürzen dieser extremen Werte können Sie die Auswirkungen einflussreicher Beobachtungen reduzieren, die die Schätzung des kausalen Effekts verzerren könnten. Sie können das Ausmaß der Expositionskürzung mithilfe der Parameter Unteres Expositionsquantil und Oberes Expositionsquantil ändern. Mithilfe der Parameter Unteres Quantil des Wahrscheinlichkeits-Scores und Oberes Quantil des Wahrscheinlichkeits-Scores können Sie Beobachtungen auch auf Basis ihrer Wahrscheinlichkeits-Scores kürzen. Standardmäßig wird jedoch keine Kürzung des Wahrscheinlichkeits-Scores vorgenommen. Wenn die Gewichtung von Wahrscheinlichkeits-Scores umgekehrt wird, müssen häufig einige der niedrigsten Wahrscheinlichkeits-Scores gekürzt werden, da Wahrscheinlichkeits-Scores nahe Null zu hohen und instabilen Ausgleichsgewichtungen führen können.

  • In den Ausgabe-Features oder der Ausgabetabelle sind Felder mit den Wahrscheinlichkeits-Scores, Ausgleichsgewichtungen und ein Feld, das angibt, ob das Feature gekürzt wurde (0 bedeutet, dass das Feature gekürzt wurde, und 1 bedeutet, dass das Feature in die Analyse einbezogen wurde) enthalten. Kopien der Expositions-, Ergebnis- und konfundierenden Variablen sind ebenfalls enthalten.

  • Das Erreichen eines Ausgleichs zwischen den konfundierenden Variablen und der Expositionsvariable ist der Schlüssel zur Ableitung der kausalen Beziehung zwischen der Expositions- und Ergebnisvariable. Um festzustellen, ob die Ausgleichsgewichtungen die konfundierenden Variablen effektiv ausgleichen, berechnet das Werkzeug gewichtete Korrelationen zwischen den einzelnen konfundierenden Variablen und der Expositionsvariable (gewichtet anhand der Ausgleichsgewichtungen). Die gewichteten Korrelationen werden anschließend aggregiert und mit einem Schwellenwert verglichen. Wenn die aggregierte Korrelation unter dem Schwellenwert liegt, werden die konfundierenden Variablen als ausgeglichen eingestuft. Sie können den Aggregationstyp (Mittelwert, Medianwert oder Maximum der absoluten Korrelation) angeben, indem Sie den Parameter Ausgleichstyp verwenden und den Schwellenwert im Parameter Ausgleichsschwellenwert festlegen. Standardmäßig verwendet das Werkzeug den Mittelwert der absoluten Korrelation und einen Schwellenwert von 0,1. Die Verwendung von 0,1 als Schwellenwert ist eine gängige Konvention, aber der Schwellenwert sollte sich nach der Fachkompetenz, den Forschungszielen und den intrinsischen Eigenschaften der untersuchten Grundgesamtheit richten. Ein niedrigerer Schwellenwert bedingt eine geringere Toleranz für Verzerrungen bei der Schätzung des kausalen Effekts. Bei niedrigeren Schwellenwerten ist es jedoch schwieriger, einen Ausgleich zu erzielen.

  • Wenn die Ausgleichsgewichtungen die konfundierenden Variablen nicht ausreichend ausgleichen, gibt das Werkzeug einen Fehler zurück und erzeugt keine ERF. Es werden aber verschiedene Meldungen mit Informationen darüber angezeigt, wie effektiv die konfundierenden Variablen ausgeglichen wurden. Es wird empfohlen, dass Sie zunächst versuchen, den Fehler durch die Auswahl konfundierender Variablen und unterschiedlicher Optionen für die Parameter Wahrscheinlichkeits-Score-Berechnungsmethode und Ausgleichsmethode zu beheben. Wenn der Fehler damit nicht behoben wird, kann durch die Verwendung einer anderen Option für den Parameter Ausgleichstyp oder die Erhöhung des Wertes für den Parameter Ausgleichsschwellenwert erreicht werden, dass eine ERF erzeugt wird, was jedoch zu Verzerrungen bei der Schätzung des kausalen Effekts führen kann.

    Weitere Informationen zum Erzielen ausgeglichener konfundierende Variablen

  • Die konfundierenden Variablen sollten eine Vielzahl an Werten über den gesamten Bereich der Expositionsvariable enthalten. Bei kategorialen konfundierenden Variablen sollte es innerhalb jeder Ebene der Kategorie eine große Bandbreite an Expositionswerten geben, und es darf in jeder kategorialen Variable höchstens 60 Kategorien geben. Wenn beim Wahrscheinlichkeits-Score-Abgleich keine ausreichende Variation der Expositionsvariable für alle Werte der einzelnen konfundierenden Variablen vorhanden ist, ist es schwierig einen Ausgleich zu erzielen.

  • Der Parameter Zielergebniswerte für die Berechnung neuer Expositionen kann verwendet werden, um Was-wäre-wenn-Szenarien (auch als kontrafaktische Szenarien bezeichnet) für alle Beobachtungen zu untersuchen. Das Werkzeug berechnet unter Verwendung einer lokalen ERF für jede Beobachtung das erforderliche Expositionsniveau für die einzelnen Beobachtungen, um das gewünschte Ergebnis zu erzielen. Beispielsweise kann jede Landkreisverwaltung den Grad der Luftverschmutzung schätzen, der für eine unter einem bestimmten Zielwert liegende Asthma-Hospitalisierungsrate erforderlich wäre. Wenn Zielergebniswerte angegeben werden, enthalten die Ausgabe-Features bzw. die Ausgabetabelle für jedes Zielergebnis zwei zusätzliche Felder: eines für den neuen Expositionswert und das andere für die Differenz zwischen dem neuen und dem aktuellen Expositionswert. Wenn es mehrere Expositionswerte gibt, die das Zielergebnis generieren würden, verwendet das Werkzeug den Wert, der dem aktuellen Expositionswert der Beobachtung am nächsten ist. Entsprechend können Sie auch Zielexpositionswerte für den Parameter Zielexpositionswerte für die Berechnung neuer Ergebnisse angeben, um zu untersuchen, wie sich die Ergebnisvariable lokal für verschiedene Zielexpositionen ändern könnte.

    Wenn eine ERF-Ausgabetabelle erstellt wird, werden alle Zielergebnis- oder Zielexpositionswerte am Ende der Tabelle angefügt. Wenn es mehrere Lösungen für ein Zielergebnis gibt, werden sämtliche Lösungen in die Tabelle aufgenommen.

  • Wenn der Parameter Exposure-Response-Funktion-Pop-ups aktivieren aktiviert ist, werden für jede Beobachtung lokale Exposure-Response-Funktionen erstellt. Die lokalen ERFs werden als Diagramme in den Pop-ups der Ausgabe-Features oder -Tabelle angezeigt. Die Erstellung lokaler ERFs erfordert die zusätzliche Annahme eines bestimmten Verfahrenseffekts, der bei Variablen wie Hautfarbe, Einkommen und Geschlecht häufig nicht gegeben ist.

    Weitere Informationen zu Schätzungen und Annahmen bei lokalen ERFs

    Vorsicht:

    Wenn es viele Beobachtungen gibt, kann die Erstellung von Pop-ups speicher- und rechenintensiv sein. Es wird empfohlen, das Werkzeug in der explorativen Phase der Modellierung ohne die Aktivierung von Pop-ups auszuführen und diese erst dann zu erstellen, wenn alle anderen Werkzeugparameter festgelegt wurden.

  • Eine häufige Fehlannahme besteht darin, dass der kausale Effekt allein dadurch geschätzt werden kann, dass die konfundierenden Variablen als erklärende Variablen in ein Vorhersagemodell wie bei den Werkzeugen Generalisierte lineare Regression oder Forest-basierte und geboostete Klassifizierung und Regression einbezogen werden. Dies gilt jedoch nur, wenn alle erklärenden Variablen unabhängig von der Expositionsvariable sind und alle relevanten Variablen in das Modell einbezogen werden. Da die meisten Datasets Variablen enthalten, die alle miteinander in Beziehung stehen, kann der kausale Effekt nicht direkt geschätzt werden.

  • Die allgemeine Methodik des Werkzeugs basiert auf den folgenden Referenzen:

    • Khoshnevis, Naeem, Xiao Wu und Danielle Braun. 2023. "CausalGPS: Matching on Generalized Propensity Scores with Continuous Exposures." R-Paketversion 0.4.0. https://CRAN.R-project.org/package=CausalGPS.
    • Wu, Xiao, Fabrizia Mealli, Marianthi-Anna Kioumourtzoglou, Francesca Dominici und Danielle Braun. 2022. "Matching on Generalized Propensity Scores with Continuous Exposures." Journal of the American Statistical Association. https://doi.org/10.1080/01621459.2022.2144737.

Parameter

BeschriftungErläuterungDatentyp
Eingabe-Features oder -Tabelle

Die Eingabe-Features oder -Tabelle mit den Feldern der Expositions-, Ergebnis- und konfundierenden Variablen.

Feature Layer; Table View
Ergebnisfeld

Das numerische Feld der Ergebnisvariable. Dies ist die Variable, die auf Änderungen der Expositionsvariable reagiert. Die Ergebnisvariable muss kontinuierlich oder binär (nicht kategorial) sein.

Field
Expositionsfeld

Das numerische Feld der Expositionsvariable (die zuweilen als Verfahrensvariable bezeichnet wird). Dies ist die Variable, die Änderungen der Ergebnisvariable verursacht. Die Expositionsvariable muss kontinuierlich (nicht binär oder kategorial) sein.

Field
Konfundierende Variablen

Die Felder der konfundierenden Variablen. Dies sind die Variablen, die sowohl mit der Expositions- als auch der Ergebnisvariable in Beziehung stehen, und sie müssen ausgeglichen werden, um den kausalen Effekt zwischen der Expositions- und Ergebnisvariable zu schätzen. Die konfundierenden Variablen können kontinuierlich, kategorial oder binär sein. Textfelder müssen kategorial sein, ganzzahlige Felder können entweder kategorial oder kontinuierlich sein, und andere numerische Felder müssen kontinuierlich sein.

Für eine unverzerrte Exposure-Response-Funktion müssen alle Variablen, die mit den Expositions- und Ergebnisvariablen zusammenhängen, als konfundierende Variablen einbezogen werden.

Value Table
Ausgabe-Features oder -Tabelle

Die Ausgabe-Features oder -Tabelle mit den Wahrscheinlichkeits-Scores, Ausgleichsgewichtungen und einem Feld, das angibt, ob das Feature gekürzt (aus der Analyse ausgeschlossen) wurde. Die Expositions-, Ergebnis- und konfundierenden Variablen sind ebenfalls enthalten.

Feature Class; Table
Wahrscheinlichkeits-Score-Berechnungsmethode
(optional)

Gibt die Methode an, die zur Berechnung der Wahrscheinlichkeits-Scores der einzelnen Beobachtungen verwendet wird.

Der Wahrscheinlichkeits-Score einer Beobachtung ist die Wahrscheinlichkeit, den beobachteten Expositionswert auf Basis der Werte der konfundierenden Variablen zu erhalten. Hohe Wahrscheinlichkeits-Scores bedeuten, dass die Exposition bei Personen mit den zugewiesenen konfundierenden Variablen häufig vorkommt, und niedrige Wahrscheinlichkeits-Scores bedeuten, dass der Expositionswert bei Personen mit den konfundierenden-Variablen unüblich ist. Wenn eine Person beispielsweise einen hohen Blutdruck hat (Exposition), aber keine Risikofaktoren für hohen Blutdruck (Störfaktoren), würde diese Person einen niedrigen Wahrscheinlichkeits-Score haben, weil es ungewöhnlich ist, ohne Risikofaktoren einen hohen Blutdruck zu haben. Im Gegensatz dazu würde ein hoher Blutdruck bei einer Person mit vielen Risikofaktoren zu einem höheren Wahrscheinlichkeits-Score führen, weil dies häufiger vorkommt.

Wahrscheinlichkeits-Scores werden von einem statistischen Modell geschätzt, das die Expositionsvariable vorhersagt, wobei die konfundierenden Variablen als erklärende Variablen verwendet werden. Sie können ein OLS-Regressionsmodell oder ein Modell für maschinelles Lernen verwenden, das Gradient-Boosting-Regressionsbäume verwendet. Es wird empfohlen, zunächst die Regression zu verwenden und erst dann Gradient Boosting, wenn die konfundierenden Variablen nicht durch die Regresion ausgeglichen werden können.

  • RegressionZur Schätzung der Wahrscheinlichkeits-Scores wird die OLS-Regression verwendet. Dies ist die Standardeinstellung.
  • Gradient BoostingZur Schätzung der Wahrscheinlichkeits-Scores werden Gradient-Boosting-Regressionsbäume verwendet.
String
Ausgleichsmethode
(optional)

Gibt die Methode an, die zum Ausgleich der konfundierenden Variablen verwendet wird.

Bei beiden Methoden werden mehrere Ausgleichsgewichtungen geschätzt, die die Korrelation zwischen den konfundierenden Variablen und der Expositionsvariable beseitigen. Es wird empfohlen, zunächst den Abgleich vorzunehmen und erst dann die Umkehrung der Wahrscheinlichkeits-Score-Gewichtung durchzuführen, wenn die konfundierenden Variablen nicht durch den Abgleich ausgeglichen werden können. Bei der Umkehrung der Wahrscheinlichkeits-Score-Gewichtung erfolgt die Berechnung schneller als beim Wahrscheinlichkeits-Score-Abgleich. Daher wird diese Methode auch empfohlen, wenn die Berechnungszeit des Abgleichs für die Daten nicht erreichbar ist.

  • Wahrscheinlichkeits-Score-AbgleichZum Ausgleich der konfundierenden Variablen wird der Wahrscheinlichkeits-Score-Abgleich verwendet. Dies ist die Standardeinstellung.
  • Umkehrung der Wahrscheinlichkeits-Score-GewichtungZum Ausgleich der konfundierenden Variablen wird die Umkehrung der Wahrscheinlichkeits-Score-Gewichtung verwendet.
String
Exposure-Response-Funktion-Pop-ups aktivieren
(optional)

Gibt an, ob für die einzelnen Beobachtungen Pop-up-Diagramme erstellt werden sollen, die die lokale ERF für die jeweilige Beobachtung anzeigen.

  • Aktiviert: In den Ausgabe-Features oder der Ausgabetabelle werden lokale ERF-Pop-up-Diagramme erstellt.
  • Deaktiviert: In den Ausgabe-Features oder der Ausgabetabelle werden keine lokalen ERF-Pop-up-Diagramme erstellt. Dies ist die Standardeinstellung.
Boolean
Exposure-Response-Funktion-Ausgabetabelle
(optional)

Eine Tabelle, die Werte der Exposure-Response-Funktion enthält. Die Tabelle enthält 200 gleichmäßig verteilte Expositionswerte zwischen der minimalen und maximalen Exposition (nach der Kürzung), zusammen mit dem geschätzten Ergebnis aus der Exposure-Response-Funktion. Das Antwortfeld repräsentiert den Durchschnittswert der Ergebnisvariable, wenn alle Mitglieder der Grundgesamtheit den zugewiesenen Expositionswert erhalten haben. Wenn Bootstrap-Konfidenzintervalle erstellt werden, werden zusätzliche Felder erstellt, die die obere und untere Grenze des Konfidenzintervalls für den Expositionswert sowie die Standardabweichung und die Anzahl der zur Erstellung des Konfidenzintervalls verwendeten Stichproben enthalten. Wenn Zielergebnis- oder Expositionswerte bereitgestellt werden, werden diese am Ende der Tabelle angefügt.

Table
Zielergebniswerte zum Berechnen neuer Expositionen
(optional)

Eine Liste der Zielergebniswerte, anhand derer die erforderlichen Änderungen der Exposition zur Erreichung der Ergebnisse für die einzelnen Beobachtungen berechnet werden. Wenn es sich bei der Expositionsvariable beispielsweise um einen Luftqualitätsindex handelt, und die Ergebnisvariable die jährliche Asthma-Hospitalisierungsrate der Landkreisverwaltungen darstellt, können Sie bestimmen, um welches Maß der Luftqualitätsindex verbessert werden muss, um Asthma-Hospitalisierungsraten unterhalb von 0,01, 0,005, und 0,001 zu erreichen. Für jeden angegebenen Zielergebniswert werden zwei neue Felder in der Ausgabe erstellt. Das erste Feld enthält den Expositionswert, der zum Zielergebnis führen würde, und das zweite Feld enthält die zur Erreichung des Zielergebnisses erforderliche Änderung der Expositionsvariable (positive Werte bedeuten, dass die Exposition erhöht werden muss, und negative Werte, dass die Exposition verringert werden muss). In manchen Fällen gibt es nicht für alle Beobachtungen eine Lösung. Daher sollten Sie nur Zielergebnisse angeben, die durch eine Änderung der Expositionsvariable erreicht werden können. Beispielsweise gibt es keinen PM2.5-Wert, der zu einer Asthma-Hospitalisierungsrate von Null führen kann, sodass die Verwendung eines Zielergebnisses von Null keine Lösung ergibt. Wenn es mehrere Expositionswerte gibt, die zum Zielergebnis führen würden, wird derjenige verwendet, für den die geringste Änderung der Exposition erforderlich ist.

Wenn eine ERF-Ausgabetabelle erstellt wird, enthält sie alle Zielergebniswerte und die zugehörigen Expositionswerte, die am Ende der Tabelle hinzugefügt werden. Sofern es mehrere Lösungen gibt, werden der Tabelle mehrere Datensätze mit mehrfach vorhandenen Ergebniswerten hinzugefügt.

Wenn lokale ERF-Pop-up-Diagramme erstellt werden, werden die Zielergebnisse und zugehörigen Expositionswerte in den Pop-ups der einzelnen Beobachtungen angezeigt.

Double
Zielexpositionswerte zum Berechnen neuer Ergebnisse
(optional)

Eine Liste der Zielexpositionswerte, die zum Berechnen neuer Ergebnisse für die einzelnen Beobachtungen verwendet werden. Für jeden Zielexpositionswert schätzt das Werkzeug den neuen Ergebniswert, den die Beobachtung erhalten würde, wenn ihre Expositionsvariable in die Zielexposition geändert würde. Wenn es sich bei der Expositionsvariable beispielsweise um einen Luftqualitätsindex handelt und die Ergebnisvariable die jährliche Asthma-Hospitalisierungsrate der Landkreisverwaltungen darstellt, können Sie schätzen, wie sich die Hospitalisierungsrate für jede Beobachtung bei unterschiedlichen Luftqualitätsindizes verändern würde. Für jeden angegebenen Zielexpositionswert werden zwei neue Felder in der Ausgabe erstellt. Das erste Feld enthält den geschätzten Ergebniswert, wenn die Beobachtung die Zielexposition erhalten hat, und das zweite Feld enthält die geschätzte Änderung der Ergebnisvariable (positive Werte bedeuten, dass sich der Wert der Ergebnisvariable erhöht und negative Werte, dass sich ihr Wert verringert.). Die Zielexpositionen müssen innerhalb des Bereichs der Expositionsvariable nach der Kürzung liegen.

Wenn eine ERF-Ausgabetabelle erstellt wird, enthält sie alle Zielexpositionswerte und die zugehörigen Response-Werte, die am Ende der Tabelle hinzugefügt werden.

Wenn lokale ERF-Pop-up-Diagramme erstellt werden, werden die Zielexpositionswerte und zugehörigen Ergebnisse in den Pop-ups der einzelnen Features angezeigt.

Double
Unteres Expositionsquantil
(optional)

Das untere Quantil, das zum Kürzen der Expositionsvariable verwendet wird. Alle Beobachtungen mit Expositionswerten unterhalb dieses Quantils werden vor der Schätzung der Wahrscheinlichkeits-Scores aus der Analyse ausgeschlossen. Der Wert muss zwischen 0 und 1 liegen. Der Standardwert ist 0,01. Dies bedeutet, dass die unteren 1 Prozent der Expositionswerte gekürzt werden. Es wird empfohlen, einige der niedrigsten Expositionswerte zu kürzen, um die Schätzung der Wahrscheinlichkeits-Scores zu optimieren.

Double
Oberes Expositionsquantil
(optional)

Das obere Quantil, das zum Kürzen der Expositionsvariable verwendet wird. Alle Beobachtungen mit Expositionswerten oberhalb dieses Quantils werden vor der Schätzung der Wahrscheinlichkeits-Scores aus der Analyse ausgeschlossen. Der Wert muss zwischen 0 und 1 liegen. Der Standardwert ist 0,99. Dies bedeutet, dass die oberen 1 Prozent der Expositionswerte gekürzt werden. Es wird empfohlen, einige der höchsten Expositionswerte zu kürzen, um die Schätzung der Wahrscheinlichkeits-Scores zu optimieren.

Double
Unteres Quantil des Wahrscheinlichkeits-Scores
(optional)

Das untere Quantil, das zum Kürzen der Wahrscheinlichkeits-Scores verwendet wird. Alle Beobachtungen mit Wahrscheinlichkeits-Scores unterhalb dieses Quantils werden vor Durchführung des Wahrscheinlichkeits-Score-Abgleichs oder Umkehrung der Wahrscheinlichkeits-Score-Gewichtung aus der Analyse ausgeschlossen. Der Wert muss zwischen 0 und 1 liegen. Der Standardwert ist 0. Dies bedeutet, dass keine Kürzung erfolgt.

Bei Umkehrung der Wahrscheinlichkeits-Score-Gewichtung ist häufig eine geringere Kürzung des Wahrscheinlichkeits-Scores erforderlich. Wahrscheinlichkeits-Scores nahe Null können zu großen und instabilen Ausgleichsgewichtungen führen.

Double
Oberes Quantil des Wahrscheinlichkeits-Scores
(optional)

Das obere Quantil, das zum Kürzen der Wahrscheinlichkeits-Scores verwendet wird. Alle Beobachtungen mit Wahrscheinlichkeits-Scores oberhalb dieses Quantils werden vor Durchführung des Wahrscheinlichkeits-Score-Abgleichs oder Umkehrung der Wahrscheinlichkeits-Score-Gewichtung aus der Analyse ausgeschlossen. Der Wert muss zwischen 0 und 1 liegen. Der Standardwert ist 1. Dies bedeutet, dass keine Kürzung erfolgt.

Double
Anzahl Expositionsabschnitte
(optional)

Die Anzahl der Expositionsabschnitte, die für den Wahrscheinlichkeits-Score-Abgleich verwendet wird. Beim Abgleich wird die Expositionsvariable in gleichmäßig verteilte Abschnitte (gleiche Intervalle) unterteilt und der Abgleich innerhalb jedes Abschnitts durchgeführt. Es sind mindestens zwei Expositionsabschnitte erforderlich, und es wird empfohlen, dass in jedem Abschnitt mindestens fünf Expositionswerte enthalten sind. Wird kein Wert angegeben, wird er während der Ausführung des Werkzeugs geschätzt und in den Meldungen angezeigt.

Long
Relative Gewichtung von Wahrscheinlichkeit zu Exposition
(optional)

Die relative Gewichtung (auch als Maßstab bezeichnet) des Wahrscheinlichkeits-Scores zur Expositionsvariable, die bei der Durchführung des Wahrscheinlichkeits-Score-Abgleichs verwendet wird. Innerhalb der einzelnen Expositionsabschnitte werden Übereinstimmungen anhand der Unterschiede bei den Wahrscheinlichkeits-Scores und den Werten der Expositionsvariable ermittelt. Dieser Parameter gibt an, wie die einzelnen Kriterien priorisiert werden sollen. Ein Wert von 0,5 bedeutet beispielsweise, dass der Wahrscheinlichkeits-Score und die Expositionsvariablen bei der Suche nach übereinstimmenden Beobachtungen gleich gewichtet werden.

Wird kein Wert angegeben, wird er während der Ausführung des Werkzeugs geschätzt und in den Meldungen angezeigt. Der Wert für den optimalen Ausgleich ist schwer vorherzusagen. Es empfiehlt sich daher, dass Sie den Wert vom Werkzeug schätzen lassen. Durch die manuelle Angabe eines Wertes kann die Berechnungszeit verkürzt oder es können vorherige Ergebnisse reproduziert werden. Wenn die resultierende Exposure-Response-Funktion vertikale Bänder von Beobachtungen mit hohen Gewichtungen zeigt, kann eine Erhöhung der relativen Gewichtung eine realistischere und genauere Exposure-Response-Funktion ergeben.

Double
Ausgleichstyp
(optional)

Gibt die Methode an, die verwendet wird, um zu ermitteln, ob die konfundierenden Variablen ausgeglichen sind. Nachdem die Gewichtungen mit dem Wahrscheinlichkeits-Score-Abgleich oder der Umkehrung der Wahrscheinlichkeits-Score-Gewichtung geschätzt wurden, werden für jede konfundierende Variable gewichtete Korrelationen berechnet. Wenn der Mittelwert, Medianwert oder das Maximum der absoluten Korrelation unter dem Ausgleichsschwellenwert liegt, werden die konfundierenden Variablen als ausgeglichen angesehen. Dies bedeutet, dass sie in ausreichendem Maß nicht mit der Expositionsvariable korreliert sind.

  • MittelwertKonfundierende Variablen gelten als ausgeglichen, wenn der Mittelwert der absoluten Korrelation unter dem Ausgleichsschwellenwert liegt. Dies ist die Standardeinstellung.
  • MedianwertKonfundierende Variablen gelten als ausgeglichen, wenn der Medianwert der absoluten Korrelation unter dem Ausgleichsschwellenwert liegt.
  • MaximumKonfundierende Variablen gelten als ausgeglichen, wenn das Maximum der absoluten Korrelation unter dem Ausgleichsschwellenwert liegt.
String
Ausgleichsschwellenwert
(optional)

Der Schwellenwert, der mit den gewichteten Korrelationen der konfundierenden Variablen verglichen wird, um festzustellen, ob diese ausgeglichen sind. Der Wert muss zwischen 0 und 1 liegen. Ein höherer Ausgleichsschwellenwert weist auf eine größere Toleranz für ein Ungleichgewicht bei den konfundierenden Variablen und Verzerrungen bei der Exposure-Response-Funktion hin. Die Standardeinstellung ist 0,1.

Double
Methode zur Bandbreitenschätzung
(optional)

Gibt die Methode an, die zur Schätzung der Bandbreite der Exposure-Response-Funktion verwendet wird.

  • Plug-inZur Schätzung der Bandbreite wird eine Plug-in-Methode verwendet. Dies ist die Standardeinstellung.
  • KreuzvalidierungEs wird die Bandbreite verwendet, mit der der Mean-Square-Kreuzvalidierungsfehler minimiert wird.
  • ManuellEs wird eine benutzerdefinierte Bandbreite verwendet.
String
Bandbreite
(optional)

Der Bandbreitenwert der Exposure-Response-Funktion bei Verwendung einer manuellen Bandbreite.

Double
Bootstrap-Konfidenzintervalle erstellen
(optional)

Gibt an, ob 95-Prozent-Konfidenzintervalle für die Exposure-Response-Funktion unter Verwendung von M-out-of-N-Bootstrapping erstellt werden. Die Konfidenzintervalle werden im Ausgabe-Grafik-Layer als gestrichelte Linien oberhalb und unterhalb der Exposure-Response-Funktion angezeigt.

  • Aktiviert: Es werden Konfidenzintervalle für die Exposure-Response-Funktion erstellt.
  • Deaktiviert: Es werden keine Konfidenzintervalle für die Exposure-Response-Funktion erstellt. Dies ist die Standardeinstellung.
Boolean

arcpy.stats.CausalInferenceAnalysis(in_features, outcome_field, exposure_field, confounding_variables, out_features, {ps_method}, {balancing_method}, {enable_erf_popups}, {out_erf_table}, {target_outcomes}, {target_exposures}, {lower_exp_trim}, {upper_exp_trim}, {lower_ps_trim}, {upper_ps_trim}, {num_bins}, {scale}, {balance_type}, {balance_threshold}, {bw_method}, {bandwidth}, {create_bootstrap_ci})
NameErläuterungDatentyp
in_features

Die Eingabe-Features oder -Tabelle mit den Feldern der Expositions-, Ergebnis- und konfundierenden Variablen.

Feature Layer; Table View
outcome_field

Das numerische Feld der Ergebnisvariable. Dies ist die Variable, die auf Änderungen der Expositionsvariable reagiert. Die Ergebnisvariable muss kontinuierlich oder binär (nicht kategorial) sein.

Field
exposure_field

Das numerische Feld der Expositionsvariable (die zuweilen als Verfahrensvariable bezeichnet wird). Dies ist die Variable, die Änderungen der Ergebnisvariable verursacht. Die Expositionsvariable muss kontinuierlich (nicht binär oder kategorial) sein.

Field
confounding_variables
[[var1, cat1], [var2, cat2],...]

Die Felder der konfundierenden Variablen. Dies sind die Variablen, die sowohl mit der Expositions- als auch der Ergebnisvariable in Beziehung stehen, und sie müssen ausgeglichen werden, um den kausalen Effekt zwischen der Expositions- und Ergebnisvariable zu schätzen. Die konfundierenden Variablen können kontinuierlich, kategorial oder binär sein. Textfelder müssen kategorial sein, ganzzahlige Felder können entweder kategorial oder kontinuierlich sein, und andere numerische Felder müssen kontinuierlich sein.

Für eine unverzerrte Exposure-Response-Funktion müssen alle Variablen, die mit den Expositions- und Ergebnisvariablen zusammenhängen, als konfundierende Variablen einbezogen werden.

Value Table
out_features

Die Ausgabe-Features oder -Tabelle mit den Wahrscheinlichkeits-Scores, Ausgleichsgewichtungen und einem Feld, das angibt, ob das Feature gekürzt (aus der Analyse ausgeschlossen) wurde. Die Expositions-, Ergebnis- und konfundierenden Variablen sind ebenfalls enthalten.

Feature Class; Table
ps_method
(optional)

Gibt die Methode an, die zur Berechnung der Wahrscheinlichkeits-Scores der einzelnen Beobachtungen verwendet wird.

Der Wahrscheinlichkeits-Score einer Beobachtung ist die Wahrscheinlichkeit, den beobachteten Expositionswert auf Basis der Werte der konfundierenden Variablen zu erhalten. Hohe Wahrscheinlichkeits-Scores bedeuten, dass die Exposition bei Personen mit den zugewiesenen konfundierenden Variablen häufig vorkommt, und niedrige Wahrscheinlichkeits-Scores bedeuten, dass der Expositionswert bei Personen mit den konfundierenden-Variablen unüblich ist. Wenn eine Person beispielsweise einen hohen Blutdruck hat (Exposition), aber keine Risikofaktoren für hohen Blutdruck (Störfaktoren), würde diese Person einen niedrigen Wahrscheinlichkeits-Score haben, weil es ungewöhnlich ist, ohne Risikofaktoren einen hohen Blutdruck zu haben. Im Gegensatz dazu würde ein hoher Blutdruck bei einer Person mit vielen Risikofaktoren zu einem höheren Wahrscheinlichkeits-Score führen, weil dies häufiger vorkommt.

Wahrscheinlichkeits-Scores werden von einem statistischen Modell geschätzt, das die Expositionsvariable vorhersagt, wobei die konfundierenden Variablen als erklärende Variablen verwendet werden. Sie können ein OLS-Regressionsmodell oder ein Modell für maschinelles Lernen verwenden, das Gradient-Boosting-Regressionsbäume verwendet. Es wird empfohlen, zunächst die Regression zu verwenden und erst dann Gradient Boosting, wenn die konfundierenden Variablen nicht durch die Regresion ausgeglichen werden können.

  • REGRESSIONZur Schätzung der Wahrscheinlichkeits-Scores wird die OLS-Regression verwendet. Dies ist die Standardeinstellung.
  • GRADIENT_BOOSTINGZur Schätzung der Wahrscheinlichkeits-Scores werden Gradient-Boosting-Regressionsbäume verwendet.
String
balancing_method
(optional)

Gibt die Methode an, die zum Ausgleich der konfundierenden Variablen verwendet wird.

Bei beiden Methoden werden mehrere Ausgleichsgewichtungen geschätzt, die die Korrelation zwischen den konfundierenden Variablen und der Expositionsvariable beseitigen. Es wird empfohlen, zunächst den Abgleich vorzunehmen und erst dann die Umkehrung der Wahrscheinlichkeits-Score-Gewichtung durchzuführen, wenn die konfundierenden Variablen nicht durch den Abgleich ausgeglichen werden können. Bei der Umkehrung der Wahrscheinlichkeits-Score-Gewichtung erfolgt die Berechnung schneller als beim Wahrscheinlichkeits-Score-Abgleich. Daher wird diese Methode auch empfohlen, wenn die Berechnungszeit des Abgleichs für die Daten nicht erreichbar ist.

  • MATCHINGZum Ausgleich der konfundierenden Variablen wird der Wahrscheinlichkeits-Score-Abgleich verwendet. Dies ist die Standardeinstellung.
  • WEIGHTINGZum Ausgleich der konfundierenden Variablen wird die Umkehrung der Wahrscheinlichkeits-Score-Gewichtung verwendet.
String
enable_erf_popups
(optional)

Gibt an, ob für die einzelnen Beobachtungen Pop-up-Diagramme erstellt werden sollen, die die lokale ERF für die jeweilige Beobachtung anzeigen.

  • CREATE_POPUPIn den Ausgabe-Features oder der Ausgabetabelle werden lokale ERF-Pop-up-Diagramme erstellt.
  • NO_POPUPIn den Ausgabe-Features oder der Ausgabetabelle werden keine lokalen ERF-Pop-up-Diagramme erstellt. Dies ist die Standardeinstellung.
Boolean
out_erf_table
(optional)

Eine Tabelle, die Werte der Exposure-Response-Funktion enthält. Die Tabelle enthält 200 gleichmäßig verteilte Expositionswerte zwischen der minimalen und maximalen Exposition (nach der Kürzung), zusammen mit dem geschätzten Ergebnis aus der Exposure-Response-Funktion. Das Antwortfeld repräsentiert den Durchschnittswert der Ergebnisvariable, wenn alle Mitglieder der Grundgesamtheit den zugewiesenen Expositionswert erhalten haben. Wenn Bootstrap-Konfidenzintervalle erstellt werden, werden zusätzliche Felder erstellt, die die obere und untere Grenze des Konfidenzintervalls für den Expositionswert sowie die Standardabweichung und die Anzahl der zur Erstellung des Konfidenzintervalls verwendeten Stichproben enthalten. Wenn Zielergebnis- oder Expositionswerte bereitgestellt werden, werden diese am Ende der Tabelle angefügt.

Table
target_outcomes
[target_outcomes,...]
(optional)

Eine Liste der Zielergebniswerte, anhand derer die erforderlichen Änderungen der Exposition zur Erreichung der Ergebnisse für die einzelnen Beobachtungen berechnet werden. Wenn es sich bei der Expositionsvariable beispielsweise um einen Luftqualitätsindex handelt, und die Ergebnisvariable die jährliche Asthma-Hospitalisierungsrate der Landkreisverwaltungen darstellt, können Sie bestimmen, um welches Maß der Luftqualitätsindex verbessert werden muss, um Asthma-Hospitalisierungsraten unterhalb von 0,01, 0,005, und 0,001 zu erreichen. Für jeden angegebenen Zielergebniswert werden zwei neue Felder in der Ausgabe erstellt. Das erste Feld enthält den Expositionswert, der zum Zielergebnis führen würde, und das zweite Feld enthält die zur Erreichung des Zielergebnisses erforderliche Änderung der Expositionsvariable (positive Werte bedeuten, dass die Exposition erhöht werden muss, und negative Werte, dass die Exposition verringert werden muss). In manchen Fällen gibt es nicht für alle Beobachtungen eine Lösung. Daher sollten Sie nur Zielergebnisse angeben, die durch eine Änderung der Expositionsvariable erreicht werden können. Beispielsweise gibt es keinen PM2.5-Wert, der zu einer Asthma-Hospitalisierungsrate von Null führen kann, sodass die Verwendung eines Zielergebnisses von Null keine Lösung ergibt. Wenn es mehrere Expositionswerte gibt, die zum Zielergebnis führen würden, wird derjenige verwendet, für den die geringste Änderung der Exposition erforderlich ist.

Wenn eine ERF-Ausgabetabelle erstellt wird, enthält sie alle Zielergebniswerte und die zugehörigen Expositionswerte, die am Ende der Tabelle hinzugefügt werden. Sofern es mehrere Lösungen gibt, werden der Tabelle mehrere Datensätze mit mehrfach vorhandenen Ergebniswerten hinzugefügt.

Wenn lokale ERF-Pop-up-Diagramme erstellt werden, werden die Zielergebnisse und zugehörigen Expositionswerte in den Pop-ups der einzelnen Beobachtungen angezeigt.

Double
target_exposures
[target_exposures,...]
(optional)

Eine Liste der Zielexpositionswerte, die zum Berechnen neuer Ergebnisse für die einzelnen Beobachtungen verwendet werden. Für jeden Zielexpositionswert schätzt das Werkzeug den neuen Ergebniswert, den die Beobachtung erhalten würde, wenn ihre Expositionsvariable in die Zielexposition geändert würde. Wenn es sich bei der Expositionsvariable beispielsweise um einen Luftqualitätsindex handelt und die Ergebnisvariable die jährliche Asthma-Hospitalisierungsrate der Landkreisverwaltungen darstellt, können Sie schätzen, wie sich die Hospitalisierungsrate für jede Beobachtung bei unterschiedlichen Luftqualitätsindizes verändern würde. Für jeden angegebenen Zielexpositionswert werden zwei neue Felder in der Ausgabe erstellt. Das erste Feld enthält den geschätzten Ergebniswert, wenn die Beobachtung die Zielexposition erhalten hat, und das zweite Feld enthält die geschätzte Änderung der Ergebnisvariable (positive Werte bedeuten, dass sich der Wert der Ergebnisvariable erhöht und negative Werte, dass sich ihr Wert verringert.). Die Zielexpositionen müssen innerhalb des Bereichs der Expositionsvariable nach der Kürzung liegen.

Wenn eine ERF-Ausgabetabelle erstellt wird, enthält sie alle Zielexpositionswerte und die zugehörigen Response-Werte, die am Ende der Tabelle hinzugefügt werden.

Wenn lokale ERF-Pop-up-Diagramme erstellt werden, werden die Zielexpositionswerte und zugehörigen Ergebnisse in den Pop-ups der einzelnen Features angezeigt.

Double
lower_exp_trim
(optional)

Das untere Quantil, das zum Kürzen der Expositionsvariable verwendet wird. Alle Beobachtungen mit Expositionswerten unterhalb dieses Quantils werden vor der Schätzung der Wahrscheinlichkeits-Scores aus der Analyse ausgeschlossen. Der Wert muss zwischen 0 und 1 liegen. Der Standardwert ist 0,01. Dies bedeutet, dass die unteren 1 Prozent der Expositionswerte gekürzt werden. Es wird empfohlen, einige der niedrigsten Expositionswerte zu kürzen, um die Schätzung der Wahrscheinlichkeits-Scores zu optimieren.

Double
upper_exp_trim
(optional)

Das obere Quantil, das zum Kürzen der Expositionsvariable verwendet wird. Alle Beobachtungen mit Expositionswerten oberhalb dieses Quantils werden vor der Schätzung der Wahrscheinlichkeits-Scores aus der Analyse ausgeschlossen. Der Wert muss zwischen 0 und 1 liegen. Der Standardwert ist 0,99. Dies bedeutet, dass die oberen 1 Prozent der Expositionswerte gekürzt werden. Es wird empfohlen, einige der höchsten Expositionswerte zu kürzen, um die Schätzung der Wahrscheinlichkeits-Scores zu optimieren.

Double
lower_ps_trim
(optional)

Das untere Quantil, das zum Kürzen der Wahrscheinlichkeits-Scores verwendet wird. Alle Beobachtungen mit Wahrscheinlichkeits-Scores unterhalb dieses Quantils werden vor Durchführung des Wahrscheinlichkeits-Score-Abgleichs oder Umkehrung der Wahrscheinlichkeits-Score-Gewichtung aus der Analyse ausgeschlossen. Der Wert muss zwischen 0 und 1 liegen. Der Standardwert ist 0. Dies bedeutet, dass keine Kürzung erfolgt.

Bei Umkehrung der Wahrscheinlichkeits-Score-Gewichtung ist häufig eine geringere Kürzung des Wahrscheinlichkeits-Scores erforderlich. Wahrscheinlichkeits-Scores nahe Null können zu großen und instabilen Ausgleichsgewichtungen führen.

Double
upper_ps_trim
(optional)

Das obere Quantil, das zum Kürzen der Wahrscheinlichkeits-Scores verwendet wird. Alle Beobachtungen mit Wahrscheinlichkeits-Scores oberhalb dieses Quantils werden vor Durchführung des Wahrscheinlichkeits-Score-Abgleichs oder Umkehrung der Wahrscheinlichkeits-Score-Gewichtung aus der Analyse ausgeschlossen. Der Wert muss zwischen 0 und 1 liegen. Der Standardwert ist 1. Dies bedeutet, dass keine Kürzung erfolgt.

Double
num_bins
(optional)

Die Anzahl der Expositionsabschnitte, die für den Wahrscheinlichkeits-Score-Abgleich verwendet wird. Beim Abgleich wird die Expositionsvariable in gleichmäßig verteilte Abschnitte (gleiche Intervalle) unterteilt und der Abgleich innerhalb jedes Abschnitts durchgeführt. Es sind mindestens zwei Expositionsabschnitte erforderlich, und es wird empfohlen, dass in jedem Abschnitt mindestens fünf Expositionswerte enthalten sind. Wird kein Wert angegeben, wird er während der Ausführung des Werkzeugs geschätzt und in den Meldungen angezeigt.

Long
scale
(optional)

Die relative Gewichtung (auch als Maßstab bezeichnet) des Wahrscheinlichkeits-Scores zur Expositionsvariable, die bei der Durchführung des Wahrscheinlichkeits-Score-Abgleichs verwendet wird. Innerhalb der einzelnen Expositionsabschnitte werden Übereinstimmungen anhand der Unterschiede bei den Wahrscheinlichkeits-Scores und den Werten der Expositionsvariable ermittelt. Dieser Parameter gibt an, wie die einzelnen Kriterien priorisiert werden sollen. Ein Wert von 0,5 bedeutet beispielsweise, dass der Wahrscheinlichkeits-Score und die Expositionsvariablen bei der Suche nach übereinstimmenden Beobachtungen gleich gewichtet werden.

Wird kein Wert angegeben, wird er während der Ausführung des Werkzeugs geschätzt und in den Meldungen angezeigt. Der Wert für den optimalen Ausgleich ist schwer vorherzusagen. Es empfiehlt sich daher, dass Sie den Wert vom Werkzeug schätzen lassen. Durch die manuelle Angabe eines Wertes kann die Berechnungszeit verkürzt oder es können vorherige Ergebnisse reproduziert werden. Wenn die resultierende Exposure-Response-Funktion vertikale Bänder von Beobachtungen mit hohen Gewichtungen zeigt, kann eine Erhöhung der relativen Gewichtung eine realistischere und genauere Exposure-Response-Funktion ergeben.

Double
balance_type
(optional)

Gibt die Methode an, die verwendet wird, um zu ermitteln, ob die konfundierenden Variablen ausgeglichen sind. Nachdem die Gewichtungen mit dem Wahrscheinlichkeits-Score-Abgleich oder der Umkehrung der Wahrscheinlichkeits-Score-Gewichtung geschätzt wurden, werden für jede konfundierende Variable gewichtete Korrelationen berechnet. Wenn der Mittelwert, Medianwert oder das Maximum der absoluten Korrelation unter dem Ausgleichsschwellenwert liegt, werden die konfundierenden Variablen als ausgeglichen angesehen. Dies bedeutet, dass sie in ausreichendem Maß nicht mit der Expositionsvariable korreliert sind.

  • MEANKonfundierende Variablen gelten als ausgeglichen, wenn der Mittelwert der absoluten Korrelation unter dem Ausgleichsschwellenwert liegt. Dies ist die Standardeinstellung.
  • MEDIANKonfundierende Variablen gelten als ausgeglichen, wenn der Medianwert der absoluten Korrelation unter dem Ausgleichsschwellenwert liegt.
  • MAXIMUMKonfundierende Variablen gelten als ausgeglichen, wenn das Maximum der absoluten Korrelation unter dem Ausgleichsschwellenwert liegt.
String
balance_threshold
(optional)

Der Schwellenwert, der mit den gewichteten Korrelationen der konfundierenden Variablen verglichen wird, um festzustellen, ob diese ausgeglichen sind. Der Wert muss zwischen 0 und 1 liegen. Ein höherer Ausgleichsschwellenwert weist auf eine größere Toleranz für ein Ungleichgewicht bei den konfundierenden Variablen und Verzerrungen bei der Exposure-Response-Funktion hin. Die Standardeinstellung ist 0,1.

Double
bw_method
(optional)

Gibt die Methode an, die zur Schätzung der Bandbreite der Exposure-Response-Funktion verwendet wird.

  • PLUG_INZur Schätzung der Bandbreite wird eine Plug-in-Methode verwendet. Dies ist die Standardeinstellung.
  • CVEs wird die Bandbreite verwendet, mit der der Mean-Square-Kreuzvalidierungsfehler minimiert wird.
  • MANUALEs wird eine benutzerdefinierte Bandbreite verwendet.
String
bandwidth
(optional)

Der Bandbreitenwert der Exposure-Response-Funktion bei Verwendung einer manuellen Bandbreite.

Double
create_bootstrap_ci
(optional)

Gibt an, ob 95-Prozent-Konfidenzintervalle für die Exposure-Response-Funktion unter Verwendung von M-out-of-N-Bootstrapping erstellt werden.

  • CREATE_CIEs werden Konfidenzintervalle für die Exposure-Response-Funktion erstellt.
  • NO_CIEs werden keine Konfidenzintervalle für die Exposure-Response-Funktion erstellt. Dies ist die Standardeinstellung.
Boolean

Codebeispiel

CausalInferenceAnalysis: Beispiel 1 (Python-Fenster)

Das folgende Python-Skript veranschaulicht, wie die Funktion CausalInferenceAnalysis verwendet wird.

import arcpy
arcpy.stats.CausalInferenceAnalysis(
    in_features="crop_locations",
    outcome_field="corn_yield",
    exposure_field="fertilizer",
    confounding_variables="soil_type true;temperature false",
    out_features=r"CausalInference_corn_yield",
    ps_method="REGRESSION",
    balancing_method="MATCHING",
    enable_erf_popups="CREATE_POPUP",
    out_erf_table=r"erftable",
    target_outcomes=[],
    target_exposures=[],
    lower_exp_trim=0.01,
    upper_exp_trim=0.99,
    lower_ps_trim=0,
    upper_ps_trim=1,
    num_bins=None,
    scale=None,
    balance_type="MEAN",
    balance_threshold=0.1,
    bw_method="PLUG_IN",
    create_bootstrap_ci="CREATE_CI"
)
CausalInferenceAnalysis: Beispiel 2 (eigenständiges Skript)

Das folgende Python-Skript veranschaulicht, wie die Funktion CausalInferenceAnalysis verwendet wird.

# Estimate the causal effect between fertilizer amount 
# and corn yield using soil type and temperature as
# confounding variables.

# Import required modules.
import arcpy

# Set the workspace.
arcpy.env.workspace = "c:/data/crops.gdb"

# Run Causal Inference Analysis tool with gradient boosting
# and inverse propensity score weighting.
try:
    arcpy.stats.CausalInferenceAnalysis(
        in_features="crop_locations",
        outcome_field="corn_yield",
        exposure_field="fertilizer",
        confounding_variables="soil_type true;temperature false",
        out_features=r"CausalInference_corn_yield",
        ps_method="GRADIENT_BOOSTING",
        balancing_method="WEIGHTING",
        enable_erf_popups="CREATE_POPUP",
        out_erf_table=r"erftable",
        target_outcomes=[],
        target_exposures=[],
        lower_exp_trim=0.01,
        upper_exp_trim=0.99,
        lower_ps_trim=0,
        upper_ps_trim=1,
        num_bins=None,
        scale=None,
        balance_type="MEAN",
        balance_threshold=0.1,
        bw_method="PLUG_IN",
        create_bootstrap_ci="CREATE_CI"
    )

except arcpy.ExecuteError:
    # If an error occurred when running the tool, print the error message.
    print(arcpy.GetMessages())

Lizenzinformationen

  • Basic: Ja
  • Standard: Ja
  • Advanced: Ja

Verwandte Themen