Sollen beim Messen der Verteilung von Features Gewichtungen verwendet werden?
Wenn Sie Eigenschaften von Feature-Positionen messen möchten, führen Sie die Analyse ohne Gewichtungsfeld aus. Die ungewichtete Analyse wird häufig für Ereignisse verwendet, die an einem bestimmten Ort und zu einer bestimmten Zeit auftreten. Beispiele wären die Analyse von Verbrechen oder Krankheiten.
Wenn einige Features wichtiger als andere sind, können Sie das Gewichtungsfelds verwenden, um diese Feature-Unterschiede widerzuspiegeln. Angenommen, Sie möchten den besten Standort für eine neuen Großmarkt für Lebensmittelgeschäfte finden. Sie wünschen sich eine zentrale Lage, möchten aber auch einen Standort finden, der für Länden mit den höchsten Umsätzen günstig gelegen. In diesem Fall kann ein Attribut, das Umsätze (z. B. Ladenumsätze oder vielleicht ein Proxy wie die Ladengröße) widerspiegelt, als Gewichtung in statistischen Berechnungen verwendet werden; Läden mit größeren Umsätzen haben einen stärkeren Einfluss auf statistische Ergebnisse als Läden mit kleineren Umsätzen. In der Abbildung unten stellen die größeren Punkte größere Umsätze dar.
Die gewichtete Analyse wird häufig für Analysen stationärer Features verwendet, z. B. Läden oder Stationen für die Überwachung der Luftverschmutzung. Im Gegensatz zu Ereignissen (z. B. Verbrechen) wird die Verteilung stationärer Features in der Regel vorab festgelegt, da sie aus bestimmten Gründen an dem jeweiligen Standort platziert wurden. Infolgedessen ist eine ungewichtete Analyse, die nur feste Feature-Positionen betrachtet, möglicherweise nicht sehr sinnvoll. Eine Messung der räumlichen Merkmale von Features, wenn diese von einem Attribut gewichtet werden, kann dagegen sehr nützlich sein. Sie können beispielsweise den Standort von Stationen zur Überwachung der Luftverschmutzung und die Ozonmesswerte an den Stationen über einen bestimmten Zeitraum verwenden, um die höchste Ozonkonzentration zu berechnen.
Angeben einer Gewichtung
Gewichtungen sind numerische Attribute, die den Features im Dataset zugewiesen sind. Je höher der Zahlenwert, desto größer die Gewichtung für dieses Feature. Wenn Sie z. B. den am besten zu erreichenden Standort für ein Seminar für Mitarbeiter im Finanzwesen finden möchten, könnten Sie den gewichteten Mittelpunkt von Unternehmen mit der Anzahl von Mitarbeitern als Gewichtungsfeld berechnen. Oder ein Umweltanalytiker könnte den gewichteten arithmetischen Mittelpunkt für unterschiedliche Schadstoffe mithilfe der Messwerte bezüglich der Luftverschmutzung von den Überwachungsstationen berechnen. Die Informationen könnten für das Vergleichen von Orten mit hoher Luftverschmutzung mit potenziellen Quellen, z. B. Fabriken oder LKW-Depots, nützlich sein.