Найти схожие местоположения (GeoAnalytics Desktop)

Краткая информация

Определяет, какой из объектов-кандидатов имеет наибольшее сходство или наибольшее различие с одним или несколькими входными объектами на основе их атрибутов.

Иллюстрация

Иллюстрация инструмента Найти схожие местоположения

Использование

  • Можно использовать таблицу, точечные, линейные или полигональные объекты.

  • Требуется входной слой поиска (слой кандидатов). Объекты в слое поиска будут отсортированы от наибольшего до наименьшего сходства.

  • Если во Входном слое больше одного объекта, сопоставление проводится по средним значениям Входного слоя. Поэтому, например, если у вас есть два Входных слоя, и один из Полей анализа является численностью населения, инструмент будет искать Слои поиска с населением, наиболее соответствующим среднему значению. Если значения населения равны 100 и 102, например, инструмент ищет кандидаты со значением около 101.

    Примечание:

    Если имеется более одного Входного слоя, выберите атрибуты Полей анализа с аналогичными значениями. Если, например, первый объект имеет значение населения 100, а другой – 100 000 жителей, инструмент возьмет среднее от этих значений и будет искать кандидатов с населением около 50050. Обратите внимание, что это усредненное значение далеко от значения численности населения любого Входного слоя.

  • С помощью параметра Наибольшее или наименьшее сходство можно искать объекты с наибольшим или наименьшим сходством по сравнению с объектами Входного слоя, используя опции Наибольшее сходство или Наименьшее сходство соответственно. В некоторых случаях вам может понадобиться увидеть оба значения. Если значение параметра Число результатов равно 3 и значение параметра Наибольшее или наименьшее сходство установлено Оба, например, инструмент вернет три наиболее сходных и три наименее сходных объекта-кандидата.

  • Каждое полученное решение в Выходных объектах будет либо решением наибольшего сходства, либо решением наименьшего сходства с целевым Входным слоем; одно решение не может быть тем и другим (и полученные решения не будут дублироваться в Выходных объектах). Соответственно, когда для параметра Наибольшее или наименьшее сходство вы выбираете Оба, максимально возможное число сопоставленных результатов (Число результатов) будет равно половине тех, что находятся в Слое поиска.

  • Будет возвращено максимум 10000 объектов.
  • Параметр Метод сопоставления имеет следующие варианты значений:

    • Значения атрибутов – наиболее похожие кандидаты будут иметь наименьшую сумму квадратов различий для всех атрибутов Полей анализа. Все значения стандартизированы до расчета различий.
    • Профили атрибутов - вычисляется косинусный коэффициент подобия. Косинусный коэффициент подобия определяет те же связи среди стандартизованных значений атрибутов, а не пытается сопоставить значения. Например, предположим, что три Поля анализа называются A1, A2 и A3. A2 вдвое больше A1, а A3 почти равен A2. Если значение параметра Метода сопоставления будет Профили атрибутов, инструмент будет искать кандидатов с теми же атрибутивными соотношениями: A2 вдвое больше A1, а А3 почти равно A2. Так как этот метод ищет отношения между атрибутами, вы должны указать минимум два Поля анализа. Вы можете использовать метод косинусного подобия (опция Профили атрибутов) для поиска места, схожего с Лос Анджелесом, но по другой шкале, например, рассматривая профиль численности населения, сравнив количество машин с количеством жителей моложе 20-ти лет. Косинусный коэффициент подобия может иметь значения от 1.0 (полное сходство) до -1.0 (полное различие). Индекс косинусного подобия записывается в Выходные объекты в поле simindex.

  • Поля анализа должны быть числовыми и присутствовать с тем же именем, а также быть того же типа в обоих наборах данных: у Входного слоя и в Поле поиска. Если инструмент не находит соответствующие поля в Слое поиска, появится предупреждение о том, что отсутствующие атрибуты не будут участвовать в анализе.

  • Все атрибуты, использованные для сопоставления, записываются в выходные данные. Параметр Присоединяемые поля позволяет указать поля, которые будут добавлены в выходную таблицу. По умолчанию добавляются все поля. Используйте параметр Присоединяемые поля для выбора полей, которые хотите добавить из Слоя поиска.

  • Все Входные слои и итоги сопоставления записываются в выходные объекты вместе с Полями анализа и Присоединяемыми полями. Кроме того, в выходные объекты будут добавлены следующие поля:

    Имя поляОписаниеПримечания

    location_type

    Строка, указывающая какие объекты являются базовым слоем (входным), а какие слоем кандидатов (поиска).

    simrank

    Когда вы выбираете значение Наиболее схожие или Оба для параметра Наиболее или наименее схожие, все найденные решения получают ранг от наиболее до наименее схожих. Наиболее сходное решение получает значение ранга 1.

    Это поле включается в Выходные объекты, когда вы выбираете Наиболее схожие или Оба для параметра Наиболее или наименее схожие.

    dissimrank

    Когда вы выбираете значение Наименее схожие или Оба для параметра Наиболее или наименее схожие, все найденные решения получают ранг от наименее к наиболее схожим. Наименее схожее решение получает значение ранга 1.

    Это поле включается в Выходные объекты, когда вы выбираете Наименее схожие или Оба для параметра Наиболее или наименее схожие.

    simindex

    В этом поле определяется количественное значение сходства с целевым объектом. Когда вы указываете Значения атрибутов для Метода сопоставления, значение представляет собой сумму квадратов разности значений.

    Подробнее о вычислении этого индекса см. в разделе Как работает Поиск сходства.

    Это поле включается в Выходные объекты, когда вы выбираете Значения атрибута как Метод сопоставления.

    cosimindex

    В этом поле определяется количественное значение сходства с целевым объектом. Когда вы указываете Профили атрибутов для Метода сопоставления, это значение представляет собой сходство косинусов.

    Подробнее о вычислении этого индекса см. в разделе Как работает Поиск сходства.

    Это поле включается в Выходные объекты, когда вы выбираете Профили атрибутов как Метод сопоставления.

    labelrank

    Это поле используется только для целей отображения. Инструмент использует это поле для задания метода отображения результатов анализа по умолчанию.

    reference_id

    Уникальное значение ID для базовых объектов. Объектам поиска дается значение null.

    search_id

    Уникальное значение ID для объектов поиска. Базовым объектам дается значение null.

  • Выходные данные объектов автоматически добавляются в таблицу содержания с методом отображения по умолчанию, примененного к полю labelrank.

  • Чтобы повысить производительность инструмента Найти схожие местоположения, выполните одно или несколько следующих действий:

    • Установите параметр среды Экстент так, чтобы вы анализировали только интересующие вас данные.
    • Выберите только несколько объектов для справочного слоя.
    • Используйте локальные данные там, где запускается анализ.

  • Этот инструмент геообработки работает на Spark. Анализ выполняется на настольном компьютере с использованием параллельно работающих ядер. Чтобы узнать больше о выполнении анализа см. раздел Информация по инструментами GeoAnalytics Desktop.

  • При запуске инструментов GeoAnalytics Desktop аналитика выполняется на настольном компьютере. Для оптимальной производительности, данные должны быть доступны на настольном ПК. Если используется размещенный векторный слой, рекомендуется применить ArcGIS GeoAnalytics Server. Если данные не являются локальными, инструмент будет работать дольше. Чтобы использовать ArcGIS GeoAnalytics Server для выполнения анализа, см. GeoAnalytics Tools.

  • Аналогичный анализ можно выполнить при помощи инструмента Поиск сходства из набора инструментов Пространственная статистика в ArcGIS Pro.

Параметры

ПодписьОписаниеТип данных
Входной слой

Базовый слой (или выборка в слое), содержащий объекты для сопоставления. Инструмент ищет объекты, подобные этим объектам. Если указано более одного объекта, сопоставление основывается на средних значениях атрибутов.

Table View
Слой поиска

Слой кандидатов (или выборка в слое), содержащий объекты-кандидаты. Инструмент ищет среди этих кандидатов объекты с наибольшим сходством (или наибольшим различием) с Входным слоем.

Table View
Выходной набор данных

Имя выходного класса пространственных объектов. Выходной класс объектов содержит запись для каждого из Входных слоев и для всех найденных объектов.

Feature Class; Table
Поля анализа

Список числовых атрибутов, отображающий критерии соответствия.

String
Наибольшее или наименьшее сходство

Указывает, являются ли объекты наиболее или наименее похожими на параметр Входной слой.

  • Наибольшее сходствоНаходит объекты с наибольшим сходством.
  • Наименьшее сходствоНаходит объекты с наименьшим сходством.
  • ОбаНаходит объекты с наибольшим и с наименьшим сходством.
String
Метод сопоставления

Указывает, будет ли сопоставление основываться на значениях или на отношениях между косинусами.

  • Значения атрибутаСходство или различие будет основано на сумме квадратов разницы значений стандартизованных атрибутов для всех атрибутов Полей анализа.
  • Профили атрибутовСходство или различие будет вычислено как функция сходства по косинусу для всех атрибутов Полей анализа.
String
Число результатов

Число сопоставлений для поиска. Ввод нулевого значения, либо числа большего, чем общее число объектов Слоя поиска, приведет к ранжированию всех объектов-кандидатов с максимальным значением 10000.

Long
Присоединить поля
(Дополнительный)

Дополнительный список атрибутов для включения с выходными данными. Вам может потребоваться включить, например, идентификатор имени, категорийное поле или поле даты. Эти поля не используются для определения сходства, они включаются для справки в атрибуты выходных параметров. По умолчанию добавляются все поля.

Field

arcpy.gapro.FindSimilarLocations(input_layer, search_layer, output, analysis_fields, most_or_least_similar, match_method, number_of_results, {append_fields})
ИмяОписаниеТип данных
input_layer

Базовый слой (или выборка в слое), содержащий объекты для сопоставления. Инструмент ищет объекты, подобные этим объектам. Если указано более одного объекта, сопоставление основывается на средних значениях атрибутов.

Table View
search_layer

Слой кандидатов (или выборка в слое), содержащий объекты-кандидаты. Инструмент ищет среди этих кандидатов объекты с наибольшим сходством (или наибольшим различием) с input_layer.

Table View
output

Выходной набор данных содержит запись для каждого значения параметра input_layer и для всех найденных объектов.

Feature Class; Table
analysis_fields
[analysis_fields,...]

Список числовых атрибутов, отображающий критерии соответствия.

String
most_or_least_similar

Указывает, являются ли объекты наиболее или наименее похожими на параметр input_layer.

  • MOST_SIMILARНаходит объекты с наибольшим сходством.
  • LEAST_SIMILARНаходит объекты с наименьшим сходством.
  • BOTHНаходит объекты с наибольшим и с наименьшим сходством.
String
match_method

Указывает, будет ли сопоставление основываться на значениях или на отношениях между косинусами.

  • ATTRIBUTE_VALUESСходство или различие будет основано на сумме квадратов разницы значений стандартизованных атрибутов для всех атрибутов analysis_fields.
  • ATTRIBUTE_PROFILESСходство или различие будет вычислено как функция сходства по косинусу для всех атрибутов analysis_fields.
String
number_of_results

Число сопоставлений для поиска. Ввод нулевого значения, либо числа большего, чем общее число объектов search_layer, приведет к ранжированию всех объектов-кандидатов с максимальным значением 10000.

Long
append_fields
[append_fields,...]
(Дополнительный)

Дополнительный список атрибутов для включения с выходными данными. Вам может потребоваться включить идентификатор имени, категорийное поле или поле даты, например. Эти поля не используются для определения сходства, они включаются для справки в атрибуты выходных параметров. По умолчанию добавляются все поля.

Field

Пример кода

FindSimilarLocations, пример (окно Python)

Пример скрипта в окне Python для использования функции FindSimilarLocations.

#-------------------------------------------------------------------------------
# Name: FindSimilarLocations.py
# Description: Find Similar stores to a top performing store

# Import system modules
import arcpy

arcpy.env.workspace = "C:/data/SalesData.gdb"

# Set local variables
referenceStore = "TopPerformer"
candidateStores = "AllStores"
analysisFields = [ "SickDays", "TotalCustomers", "AvgPurchaseAmount"]
outputName = "BestStores_10"

# Run Find Similar Locations
arcpy.gapro.FindSimilarLocations(referenceStore, candidateStores, 
                                 outputName, analysisFields, 
                                 "MOST_SIMILAR", "ATTRIBUTE_VALUES", 10)

Информация о лицензиях

  • Basic: Нет
  • Standard: Нет
  • Advanced: Да

Связанные разделы