Этот инструмент геообработки доступен с версией ArcGIS Enterprise 10.6.1 или более новой.
В инструменте Поиск кластеров точек используется один входной точечный слой. Этот инструмент извлекает кластеры из Входного точечного слоя и определяет окружающий шум.
Для инструмента Поиск кластеров точек необходимо, чтобы Входной точечный слой был в системе координат проекции, или чтобы параметр среды Выходная система координат был установлен на система координат проекции.
Есть два Метода кластеризации. Заданное расстояние (DBSCAN) использует алгоритм DBSCAN и находит кластеры точек в непосредственной близости, на основе заданного расстояния поиска. Автонастройка (HDBSCAN) применяет алгоритм HDBSCAN (доступный в ArcGIS Enterprise 10.7 и более поздней версии) и находит кластеры точек так же, как и DBSCAN, но работает с меняющимися расстояниями, позволяя определить кластеры с меняющимися плотностями, на основе вероятности кластеров (или стабильности). Если выбран DBSCAN, кластеры могут быть найдены либо только в двумерном пространстве, либо и в пространстве, и во времени. Если вы установите отметку Использовать время для поиска кластеров, а входной слой имеет включенное время и тип Мгновенный, DBSCAN обнаружит пространственно-временные кластеры точек, находящихся в непосредственной близости, на основе заданного расстояния поиска и продолжительности поиска (поддерживается в ArcGIS Enterprise 10.8 и более поздних версиях).
Параметр Минимальное число объектов на кластер, используется по-разному, в зависимости от выбранного метода кластеризации:
- Заданное расстояние (DBSCAN) – определяет число объектов, которое должно быть найдено в радиусе поиска от точки, с которой начинается формирование кластера. В результатах могут встречаться кластеры с меньшим числом объектов, чем задано этим значением. Расстояние поиска настраивается в параметре Расстояние поиска. При использовании времени для поиска кластеров требуется Длительности поиска. При поиске содержимого кластеров Минимальное число объектов на кластер должно находиться в пределах Расстояния поиска и Длительности поиска, чтобы сформировать кластер. Обратите внимание, что это расстояние и длительность не связаны с диаметром или временным экстентом обнаруженных кластеров точек.
- Самонастраивающаяся кластеризация (HDBSCAN)–- задает число объектов, окружающих каждую точку (включая саму точку), которые будут учитываться при оценке плотности. Это число также соответствует минимальному размеру кластера, размешенному при извлечении кластеров.
Этот инструмент создает выходной класс объектов с новым целочисленным полем CLUSTER_ID, где обозначается принадлежность объектов кластерам. Отображение по умолчанию основано на поле COLOR_ID. Разным кластерам присваиваются различные цвета. Цвета распределяются и повторяются таким образом, что каждый кластер визуально отличается от соседних.
Если для обнаружения пространственно-временных кластеров используется метод кластеризации Заданное расстояние (HDBSCAN), в результаты также будут включены следующие поля:
- FEAT_TIME – Исходное мгновенное время каждого объекта.
- START_DATETIME – время начала временного экстента кластера, к которому принадлежит объект.
- END_DATETIME – время окончания временного экстента кластера, к которому принадлежит объект.
Свойства времени результирующего слоя будут установлены как интервал в полях START_DATETIME и END_DATETIME, гарантируя, что все элементы кластера будут нарисованы вместе при визуализации пространственно-временных кластеров с помощью бегунка времени. Эти поля используются только для визуализации. Для объектов шума поля START_DATETIME и END_DATETIME будут равны FEAT_TIME.
Если выбран Метод кластеризации Автонастройка (HDBSCAN), в выходном классе объектов также будут содержаться следующие поля:
- PROB – вероятность принадлежности объекта к назначенному ему кластеру.
- OUTLIER – вероятность того, что объект является выбросом со своим собственным кластером. Более значение означает большую вероятность выброса.
- EXEMPLAR – обозначает наиболее репрезентативные объекты каждого кластера. Такие объекты обозначаются значением 1.
- STABILITY - присутствие каждого кластера в диапазоне масштабов. Большее значение показывает, что кластер входит в более широкий диапазон масштабов.
При использовании алгоритма HDBSCAN со слоем, содержащим более 3 миллионов объектов, может произойти сбой, если администратор не увеличил значение параметра javaHeapSize в GeoAnalyticsTools GP Service. Для 3 миллионов объектов требуется около 2 ГБ свободного пространства. Количество RAM, указанное в javaHeapSize, должно быть доступно на каждом компьютере GeoAnalytics Server, в дополнение к 16 ГБ, обычно требующимися для GeoAnalytics Server. Например, если необходимо кластеризовать 9 миллионов объектов методом HDBSCAN, необходимо задать для javaHeapSize не менее 6144 МБ, или 6 ГБ. В этом случае, каждый компьютер GeoAnalytics Server должен иметь не менее 22 ГБ доступной RAM.
Можно повысить производительность инструмента Найти кластеры точек, выполнив одно или несколько из следующих действий:
- Установите параметр среды Экстент так, чтобы вы анализировали только интересующие вас данные.
- Выбирайте расстояние и длительность поиска. Меньшее расстояние поиска или радиус могут работать лучше на тех же данных.
- Используйте локальные данные там, где запускается анализ.
Этот инструмент геообработки работает на ArcGIS GeoAnalytics Server. Анализ выполняется на вашем GeoAnalytics Server, а результаты сохраняются в ресурсы на ArcGIS Enterprise.
При запуске инструментов GeoAnalytics Server анализ выполняется на GeoAnalytics Server. Для оптимальной производительности сделайте данные доступными для GeoAnalytics Server через векторные слои, размещенные на вашем портале ArcGIS Enterprise или через файловое хранилище больших данных. Данные, которые не являются локальными для GeoAnalytics Server, будут перемещены на GeoAnalytics Server до начала анализа. Это означает, что для запуска инструмента потребуется больше времени, а в некоторых случаях перемещение данных с ArcGIS Pro на GeoAnalytics Server может завершиться ошибкой. Порог сбоя зависит от скорости сети, а также от размера и сложности данных. Рекомендуется всегда публиковать данные или создавать файловое хранилище больших данных.
Более подробно о публикации локаторов на портале
Более подробно о создании файловых хранилищ больших данных в Server Manager