Найти схожие местоположения (GeoAnalytics)

Краткая информация

Определяет, какой из объектов-кандидатов имеет наибольшее сходство или наибольшее различие с одним или несколькими входными объектами на основе их атрибутов.

Прежние версии:

Расширение ArcGIS GeoAnalytics Server является устаревшим в ArcGIS Enterprise. Финальная версия GeoAnalytics Server включена в ArcGIS Enterprise 11.3. Этот инструмент геообработки доступен в версии ArcGIS Enterprise 11.3 и более ранних

Иллюстрация

Иллюстрация инструмента Найти схожие местоположения

Использование

  • Можно использовать таблицу, точечные, линейные или полигональные объекты.

  • Требуется входной слой поиска (слой кандидатов). Объекты в слое поиска будут отсортированы от наибольшего до наименьшего сходства.

  • Если в значении параметра Входной слой больше одного объекта, сопоставление проводится по средним значениям Входного слоя. Например, если у вас есть два объекта Входного слоя, и один из атрибутов параметра Поля анализа является численностью населения, инструмент будет искать значения параметра Слой поиска с населением, наиболее соответствующим среднему значению. Если значения населения равны 100 и 102, например, инструмент ищет кандидаты со значением около 101.

    Примечание:

    Если имеется более одного значения параметра Входной слой, выберите атрибуты Полей анализа с аналогичными значениями. Например, если значение численности населения для одного из входных значений равно 100, а для другого — 100 000, инструмент будет искать совпадения с численностью населения, близкой к среднему значению этих двух значений, которое равно 50 050. Обратите внимание, что это усредненное значение далеко от значения численности населения любого из значений Входного слоя.

  • С помощью параметра Наибольшее или наименьшее сходство можно искать объекты с наибольшим или наименьшим сходством по сравнению с объектами Входного слоя, используя опции Наибольшее сходство или Наименьшее сходство соответственно. В некоторых случаях вам может понадобиться увидеть оба значения. Если значение параметра Число результатов равно 3 и значение параметра Наибольшее или наименьшее сходство установлено Оба, например, инструмент вернет три наиболее сходных и три наименее сходных объекта-кандидата.

  • Каждое совпадающее решение в параметре Выходные объекты будет либо решением наибольшего сходства, либо решением наименьшего сходства со значением целевого Входного слоя; одно решение не может быть тем и другим (и полученные решения не будут дублироваться в Выходных объектах). Соответственно, когда для параметра Наибольшее или наименьшее сходство вы выбираете Оба, максимально возможное число сопоставленных результатов (значение параметра Число результатов) будет равно половине тех, что находятся в значении Слой поиска.

  • Будет возвращено максимум 10000 объектов.
  • Параметр Метод сопоставления имеет следующие варианты значений:

    • Значения атрибутов – наиболее похожие кандидаты будут иметь наименьшую сумму квадратов различий для всех атрибутов Полей анализа. Все значения будут стандартизированы до расчета различий.
    • Профили атрибутов - вычисляется косинусный коэффициент подобия. Косинусный коэффициент подобия определяет те же связи среди стандартизованных значений атрибутов, а не пытается сопоставить значения. Например, предположим, что три значения Поля анализа называются A1, A2 и A3. A2 вдвое больше A1, а A3 почти равен A2. Если параметр Метод сопоставления имеет значение Профили атрибутов, инструмент будет искать кандидатов с такими же атрибутивными отношениями: A2 вдвое больше A1, а A3 почти равен A2. Поскольку этот метод ищет отношения между атрибутами, необходимо указать как минимум два атрибута Поля анализа. Вы можете использовать метод косинусного подобия (опция Профили атрибутов) для поиска места, схожего с Лос Анджелесом, но по другой шкале, например, рассматривая профиль численности населения, сравнив количество машин с количеством жителей моложе 20-ти лет. Косинусный коэффициент подобия может иметь значения от 1.0 (полное сходство) до -1.0 (полное различие). Значение косинусного коэффициента подобия записывается в Выходные объекты в поле simindex.

  • Параметр Поля анализа должен быть числовыми и присутствовать с тем же именем и типом поля в обоих параметрах Входной слой и Поле поиска. Если инструмент не находит соответствующие поля в значении Слой поиска, появится предупреждение о том, что отсутствующие атрибуты не будут участвовать в анализе.

  • Все атрибуты, использованные для сопоставления, записываются в выходные данные. Параметр Присоединяемые поля позволяет указать поля, которые будут добавлены в выходную таблицу. По умолчанию поля не добавляются. Используйте параметр Присоединяемые поля для выбора полей, которые хотите добавить из значения Слой поиска.

  • Все Входные слои и итоги сопоставления записываются в выходные объекты вместе со значениями параметров Поля анализа и Присоединяемые поля. Кроме того, в выходные объекты будут добавлены следующие поля:

    Имя поляОписаниеПримечания

    location_type

    Строка, указывающая какие объекты являются базовым слоем (входным), а какие слоем кандидатов (поиска).

    simrank

    Когда вы указываете значение Наиболее схожие или Оба для значения параметра Наиболее или наименее схожие, все найденные решения получают ранг от наиболее до наименее схожих. Наиболее сходное решение получает значение ранга 1.

    Это поле включается в Выходные объекты, когда вы указываете Наиболее схожие или Оба для значения параметра Наиболее или наименее схожие.

    dissimrank

    Когда вы указываете значение Наименее схожие или Оба для значения параметра Наиболее или наименее схожие, все найденные решения получают ранг от наименее к наиболее схожим. Наименее сходное решение имеет значение ранга 1.

    Это поле включается в Выходные объекты, когда вы указываете Наименее схожие или Оба для значения параметра Наиболее или наименее схожие.

    simindex

    В этом поле определяется количественное значение сходства с целевым объектом. Когда вы указываете Значения атрибутов для Метода сопоставления, значение представляет собой сумму квадратов разности значений.

    Подробнее о вычислении этого индекса см. в разделе Как работает Поиск сходства.

    Это поле включается в Выходные объекты, когда вы указываете Значения атрибута в качестве значения параметра Метод сопоставления.

    cosimindex

    В этом поле определяется количественное значение сходства с целевым объектом. Когда вы указываете Профили атрибутов для Метода сопоставления, это значение представляет собой сходство косинусов.

    Подробнее о вычислении этого индекса см. в разделе Как работает Поиск сходства.

    Это поле включается в Выходные объекты, когда вы указываете Профили атрибутов в качестве значения параметра Метод сопоставления.

    labelrank

    Это поле используется только для целей отображения. Инструмент использует это поле для задания метода отображения результатов анализа по умолчанию.

    reference_id

    Уникальное значение ID для базовых объектов. Для объектов поиска получено пустое значение.

    Данное поле доступно в версии ArcGIS Enterprise 10.6.1 или более поздней.

    search_id

    Уникальное значение ID для объектов поиска. Для базовых объектов получено пустое значение.

    Данное поле доступно в версии ArcGIS Enterprise 10.6.1 или более поздней.

  • Выходные данные автоматически добавляются в таблицу содержания с методом отображения по умолчанию, который применяется к полю labelrank.

  • Чтобы повысить производительность инструмента Найти схожие местоположения, выполните одно или несколько из следующего:

    • Установите параметр среды Экстент так, чтобы вы анализировали только интересующие вас данные.
    • Выберите только несколько объектов для справочного слоя.
    • Используйте локальные данные там, где запускается анализ.

  • Этот инструмент геообработки работает на ArcGIS GeoAnalytics Server. Анализ завершен в GeoAnalytics Server, результаты сохранены в ваших ресурсах в ArcGIS Enterprise.

  • При запуске инструментов GeoAnalytics Server анализ выполняется на GeoAnalytics Server. Для оптимальной производительности сделайте данные доступными для GeoAnalytics Server через векторные слои, размещенные на вашем портале ArcGIS Enterprise или через файловое хранилище больших данных. Данные, которые не являются локальными для GeoAnalytics Server, будут перемещены на GeoAnalytics Server до начала анализа. Это означает, что для запуска инструмента потребуется больше времени, а в некоторых случаях перемещение данных с ArcGIS Pro на GeoAnalytics Server может завершиться ошибкой. Порог сбоя зависит от скорости сети, а также от размера и сложности данных. Рекомендуется всегда публиковать данные или создавать файловое хранилище больших данных.

    Более подробно о публикации локаторов на портале

    Более подробно о создании файловых хранилищ больших данных в Server Manager

  • Аналогичный анализ можно выполнить при помощи инструмента Поиск сходства из набора инструментов Пространственная статистика в ArcGIS Pro.

Параметры

ПодписьОписаниеТип данных
Входной слой

Базовый слой (или выборка в слое), содержащий объекты для сопоставления. Инструмент ищет объекты, подобные этим объектам. Если указано более одного объекта, сопоставление основывается на средних значениях атрибутов.

Record Set
Слой поиска

Слой кандидатов (или выборка в слое), содержащий объекты-кандидаты. Инструмент ищет среди этих кандидатов объекты с наибольшим сходством (или наибольшим различием) со значением параметра Входной слой.

Record Set
Выходное имя

Имя выходного класса пространственных объектов. Выходной класс объектов содержит запись для каждого из значения параметра Входной слой и для всех найденных объектов решений.

String
Поля анализа

Список числовых атрибутов, отображающий критерии соответствия.

String
Наибольшее или наименьшее сходство

Указывает, являются ли объекты наиболее или наименее похожими на значение параметра Входной слой.

  • Наибольшее сходствоБудут найдены наиболее похожие объекты.
  • Наименьшее сходствоБудут найдены наименее похожие объекты.
  • ОбеБудут найдены как наиболее похожие, так и наименее похожие объекты.
String
Метод сопоставления

Указывает, будут ли сопоставления по сходству и различию основываться на значениях или отношениях между косинусами.

  • Значения атрибутаСходство или различие будет основано на сумме квадратов разницы значений стандартизованных атрибутов для всех атрибутов Полей анализа.
  • Профили атрибутовСходство или различие будет вычислено как функция сходства по косинусу для всех атрибутов Полей анализа.
String
Число результатов

Число сопоставлений решений, которые будут найдены. Ввод нулевого значения, либо числа большего, чем общее число объектов Слоя поиска, приведет к ранжированию всех объектов-кандидатов с максимальным значением 10000.

Long
Присоединить поля
(Дополнительный)

Дополнительный список атрибутов для включения с выходными данными. Вам может потребоваться включить, например, идентификатор имени, категорийное поле или поле даты. Эти поля не используются для определения сходства, они включаются для справки в атрибуты выходных параметров. По умолчанию поля не добавляются.

Field
Хранилище данных
(Дополнительный)

Указывает ArcGIS Data Store, где будут сохранены выходные данные. Все результаты, находящиеся в хранилище пространственно-временных больших данных, будут храниться в системе WGS84. Результаты в реляционном хранилище данных сохраняют свои систему координат.

  • Хранилище пространственно-временных больших данныхРезультаты будут храниться в хранилище больших пространственно-временных данных. Это значение по умолчанию
  • Реляционное хранилище данныхРезультаты будут храниться в хранилище реляционных данных.
String

Производные выходные данные

ПодписьОписаниеТип данных
Выходной класс объектов

Найдены объекты из входных данных и для всех объектов решений.

Record Set

arcpy.geoanalytics.FindSimilarLocations(input_layer, search_layer, output_name, analysis_fields, most_or_least_similar, match_method, number_of_results, {append_fields}, {data_store})
ИмяОписаниеТип данных
input_layer

Базовый слой (или выборка в слое), содержащий объекты для сопоставления. Инструмент ищет объекты, подобные этим объектам. Если указано более одного объекта, сопоставление основывается на средних значениях атрибутов.

Record Set
search_layer

Слой кандидатов (или выборка в слое), содержащий объекты-кандидаты. Инструмент ищет среди этих кандидатов объекты с наибольшим сходством (или наибольшим различием) со значением параметра input_layer.

Record Set
output_name

Имя выходного сервиса пространственных объектов. Сервис выходных объектов содержит запись для каждого из значений параметра input_layer и для всех найденных объектов решений.

String
analysis_fields
[analysis_fields,...]

Список числовых атрибутов, отображающий критерии соответствия.

String
most_or_least_similar

Указывает, являются ли объекты наиболее или наименее похожими на значение параметра input_layer.

  • MOST_SIMILARБудут найдены наиболее похожие объекты.
  • LEAST_SIMILARБудут найдены наименее похожие объекты.
  • BOTHБудут найдены как наиболее похожие, так и наименее похожие объекты.
String
match_method

Указывает, будут ли сопоставления по сходству и различию основываться на значениях или отношениях между косинусами.

  • ATTRIBUTE_VALUESСходство или различие будет основано на сумме квадратов разницы значений стандартизованных атрибутов для всех атрибутов analysis_fields.
  • ATTRIBUTE_PROFILESСходство или различие будет вычислено как функция сходства по косинусу для всех атрибутов analysis_fields.
String
number_of_results

Число сопоставлений решений, которые будут найдены. Ввод нулевого значения, либо числа большего, чем общее число объектов search_layer, приведет к ранжированию всех объектов-кандидатов с максимальным значением 10000.

Long
append_fields
[append_fields,...]
(Дополнительный)

Дополнительный список атрибутов для включения с выходными данными. Вам может потребоваться включить идентификатор имени, категорийное поле или поле даты, например. Эти поля не используются для определения сходства, они включаются для справки в атрибуты выходных параметров. По умолчанию поля не добавляются.

Field
data_store
(Дополнительный)

Указывает ArcGIS Data Store, где будут сохранены выходные данные. Все результаты, находящиеся в хранилище пространственно-временных больших данных, будут храниться в системе WGS84. Результаты в реляционном хранилище данных сохраняют свои систему координат.

  • SPATIOTEMPORAL_DATA_STOREРезультаты будут храниться в хранилище больших пространственно-временных данных. Это значение по умолчанию
  • RELATIONAL_DATA_STOREРезультаты будут храниться в хранилище реляционных данных.
String

Производные выходные данные

ИмяОписаниеТип данных
output

Найдены объекты из входных данных и для всех объектов решений.

Record Set

Пример кода

FindSimilarLocations (окно Python)

Скрипт окна Python, демонстрирующий использование функции FindSimilarLocations.

# Name: FindSimilarLocations.py
# Description: Find Similar stores to a top performing store
#
# Requirements: ArcGIS GeoAnalytics Server

# Import system modules
import arcpy
function
# Set local variables
referenceStore = "https://MyGeoAnalyticsMachine.domain.com/geoanalytics/rest/services/DataStoreCatalogs/bigDataFileShares_Stores/BigDataCatalogServer/TopPerformer"
candidateStores = "https://MyGeoAnalyticsMachine.domain.com/geoanalytics/rest/services/DataStoreCatalogs/bigDataFileShares_Stores/BigDataCatalogServer/AllStores"
analysisFields = [ "SickDays", "TotalCustomers", "AvgPurchaseAmount"]
outputName = "BestStores_10"
dataStore = "SPATIOTEMPORAL_DATA_STORE"

# Run Find Similar Locations
arcpy.geoanalytics.FindSimilarLocations(referenceStore, candidateStores, 
                                        outputName, analysisFields, 
                                        "MOST_SIMILAR", "ATTRIBUTE_VALUES", 10, 
                                        None, dataStore)

Параметры среды

Особые случаи

Выходная система координат

Система координат, используемая при анализе. Если данный параметр не указан, анализ будет выполнен во входной системе координат. Для GeoAnalytics Tools готовые результаты будут храниться в пространственно-временном хранилище данных в WGS84.

Информация о лицензиях

  • Basic: Обязательно ArcGIS GeoAnalytics Server
  • Standard: Обязательно ArcGIS GeoAnalytics Server
  • Advanced: Обязательно ArcGIS GeoAnalytics Server

Связанные разделы