Все сравнения выполняются путем сравнения по категориям уровня значимости (горячая 99%, горячая 95%, горячая 90%, не значима, холодная 90%, холодная 95% и холодная 99%) между соответствующими объектами и их соседями в двух входных слоях. Сходство определяет, насколько пространственное распределение совпадает для горячих точек, холодных точек и областей незначимых точек в обоих результирующих слоях. Связь (или зависимость) определяется выраженностью статистических отношений между переменными горячих точек (подобно коэффициенту корреляции для непрерывных переменных). Различие между сходством и связью важно, так как, как правило, результаты двух вариантов анализа горячих точек очень похожи (много совпадающих объектов и их соседей имеют схожий уровень значимости), но при этом незначительную связь или зависимость. Это значит, что даже если уровни значимости схожи, попытки повлиять на одну переменную (например, попытка снизить негативный эффект) не приведут к изменениям в другой переменной. Высокий уровень сходства, но при этом несвязанные результаты часто встречаются, если в обоих результирующих слоях имеется доминирование какой-либо категории, например область не значимых точек, или если в обоих результирующих слоях встречаются большие кластеры объектов со схожим уровнем значимости.
Сходство между двумя результатами анализа горячих точек измеряется в уровне сходства, в диапазоне от 0 до 1. Если много совпадающих объектов в обоих результирующих слоях имеют одинаковый уровень значимости, значение будет стремиться к 1. Если много совпадающих объектов не сопоставляются по уровням значимости, значение будет близко к 0. Связь измеряется значением каппа: выраженная связность в результатах будет иметь значения каппа близко к 1, а несвязанные (независимые) результаты будут иметь значения каппа ближе к 0 (или небольшие отрицательные). Значение каппа - это пересчитанный вариант значения сходства, которое учитывает пространственную кластеризацию и последовательность категорий для выделения статистической связности между результатами анализа горячих точек. Для обеих значений используется принадлежность к нечеткому множеству для возможности частичного сопоставления между совпадающими объектами на основании сходства уровней значимости и пространственной окрестности. Например, горячие точки с уровнем 99% могут считаться идеально совпадающими с другими горячими точками с уровнем 99%, частично совпадать с горячими точкам с уровнем 95%, и полностью не совпадать с холодными точками с уровнем 99%. Для двух совпадающих объектов так же можно определить частичное соответствие, если у этих объектов не одинаковый уровень значимости, но у других объектов в их окрестности - одинаковый.
Инструмент вычисляет глобальное сходство и глобальное значение каппа для оценки общего сходства и связи между результатами горячих точек, а также локальные версии вычисляются для каждой пары совпадающих объектов. Это позволяет вам сопоставлять сравнения для оценки областей, уровень сходства или выраженность связи которых больше или меньше, чем глобальные значения. Выходные объекты также включают диаграммы и пользовательские символы, позволяющие выделить области, в которых результаты горячих точек наиболее несхожи, а также результаты суммирования пар уровней значимости для всех совпадающих объектов.
Для параметров Входной результат горячих точек 1 и Входной результат горячих точек 2 должны быть указаны выходные объекты инструментов Анализ горячих точек (Getis-Ord Gi*) или Оптимизированный анализ горячих точек. Каждый объект в каждом результирующем слое должен быть спарен с таким же объектом в другом результирующем слое, что дает возможность сравнить для них категории уровней значимости. Если объекты двух слоев результатов горячих точек пространственно не совпадают (например, как полигоны, у которых нет общей границы), для этих двух векторных слоев будет рассчитано пересечение перед выполнением анализа, и сравнение будет выполнено только где пересечение присутствует. Будьте внимательны, если у полигонов двух слоев результатов горячих точек разный размер, так как при пересечении большие полигоны разбиваются на множество мелких, что меняет последовательность категорий уровня значимости. Для запуска инструмента требуется пересечение не менее 20 объектов.
Результаты сравнения будут возвращены в сообщениях геообработки, как составной слой выходного класса объектов, а также в виде диаграмм.
В сообщении будет общая информация о результатах сравнения двух слоев горячих точек. Сообщения содержат следующую информацию:
- Значение сходства — значение в диапазоне от 0 до 1, измеряющее общее сходство между двумя слоями результатов анализа горячих точек. Значение можно интерпретировать как нечеткая вероятность того, что любая пара совпадающих объектов имеет одинаковую категорию уровня значимости.
- Ожидаемое значение сходства — ожидаемое значение сходства, при допущении того, что два слоя результатов анализа горячих точек не связаны (независимы). Значение сходства больше ожидаемого значения указывает на зависимость между двумя картами. Это значение наиболее информативно, и используется для пересчета значения сходства при вычислении значения Каппа. Значение вычисляется путем создания пар между каждым объектом одного слоя горячих точек с произвольным объектом другого слоя и вычислением сходства. При создании пары между каждым объектом с произвольным объектом (а не с совпадающим объектом) ожидаемое значение пространственно корректируется с учетом пространственной кластеризации и последовательности категорий в обоих слоях результатов анализа горячих точек. Параметр Число перестановок указывает, число произвольных спариваний для каждого объекта, и ожидаемое значение сходства рассчитывается как среднее значение сходства из значений сходства каждой перестановки.
- Пространственная нечеткая Каппа — измерение связи между переменными анализа горячих точек, которая вычисляется пересчетом значения сходства по ожидаемому значению. Если связь результатов горячих точек выражена - это значение будет близ1, а для несвязанных (независимых) результатов это значение будет близко к 0. Отрицательные значения указывают на отрицательные отношения между переменными анализа горячих точек. Хотя значение не имеет ограничения по нижней границы, на практике они редко бывают меньше -3.
- Суммы весов между парами уровней значимости горячих точек.
- Таблицы в сообщениях отображает количества и проценты для каждой пары уровней значимости горячих точек. В этих сообщения количества и проценты уровней значимости второго результирующего слоя разбиваются по категориям первого результирующего слоя. Например, в пределах области горячих точек с уровнем значимости 90% в первом результирующем слое вы можете увидеть количество и процент горячих точек с уровнем значимости 90% во втором результирующем слое, а также количества и процент точек для всех остальных категорий уровня значимости во втором слое. Это используется, если два результата горячих точек считались для одной и той же переменной, измеренной в разное время. В этом случае таблица позволяет вам оценить, как категории изменились во времени между измерениями.
Выходные объекты содержат поля со значением сходства, ожидаемым значением сходства, значением Каппа и категориями уровней значимости каждой пары совпадающих объектов. Если инструмент запускается на карте, вы получаете составной слой, куда входят три слоя, которые позволят вам изучить сходство, связь и уровень значимости для пар пространственно. В первом слое показаны значения сходства, разбитые на 5 классов по равным интервалам в диапазоне от 0 до 1, и низкие значения сходства показаны более темными оттенками, чтобы выделить наиболее несвязанные участки. Во втором слое показаны значения пространственной нечеткой каппы, символами, классифицированными на 6 классов по равным интервалам. В третьем слое показаны все варианты комбинаций уровней значимости, с применением пользовательских символов для идентификации объектов, для которых в одном результирующем слое горячих точек определена статистически значимая горячая точка, а в другом - статистически значимая холодная точка (в символах уровни значимости 90%, 95% и 99% не различаются, чтобы уменьшить число комбинаций).
Финальный слой также включает диаграмму интенсивности и пользовательскую линейчатую диаграмму для последующего изучения пар уровней значимости. На диаграммах отражена та же информация, что и в таблице, но числа и проценты показаны разными цветами, что упрощает интерпретацию. Также можно использовать выборку на карте и диаграмме, чтобы выбрать, например, все объекты, у которых выявлены горячие точки с вероятностью 99% в одном слое, и холодные точки с вероятностью 99% в другом слое, что указывает на максимально возможное несходство.
Более подробно о выходных данных инструмента
Параметр Метод взвешивания сходства определяет сходство между каждой комбинацией категорий уровней значимости с использованием принадлежности к нечеткому множеству. Каждый вес - это значение от 0 до 1, которое указывает, насколько схожими могут быть категории при выполнении сравнения. Например, если вы задаете вес - 0.75 между горячими точками со значимостью 99% и 95%, это означает, что хотя они не совсем совпадают, но уровень сходства для них выше уровня различий.
По умолчанию опция Нечеткие веса взвешивает категории по близости к уровню значимости (определяется отношением критических значений). Другие опции дают вам возможность комбинировать категории, назначая вес 1 для каждой из них. Например, опция Комбинировать уровни значимости 95% и 99% объединяет горячие точки с уровнем значимости 99% и 95% в одну категорию, холодные точки 99% и 95% - в другую категорию, и горячие точки 90%, не значимые и холодные точки 90% - в третью. Эта опция рассматривает все горячие (или холодные) точки с уровнем значимости выше 95% как одинаковую (статистически значимую) категорию, а все объекты с уровнем значимости ниже 95% как одинаковую (статистически незначимую) категорию. Это полезно, если вы хотите сравнить два результата анализа горячих точек с уровнем значимости 95%, и считать все горячие и холодные точки с уровнем 90% не значимыми. Опция Обратить отношения горячих и холодных точек назначает высокие значения веса сходства между горячими и холодными точками. Например, горячие точки со значимостью 99% считаются совпадающими с холодными точками в другом слое со значимостью 99%, и полностью несовпадающими с горячими точками другого слоя со значимостью 99%. Эта опция полезна при измерении сходства и связи между переменными с отрицательными отношениями, например при сравнении горячих точек случаев младенческой смертности с холодными точками при измерении медианного дохода.
Опция Пользовательские веса позволяет задать пользовательские веса для сходства, чтобы объединять категории и указывать собственные предпочтения. Пользовательские веса можно задать в параметре Пользовательские веса сходства. Параметр отображает всплывающую матрицу с 49 (7х7) комбинациями уровней значимости. Для указания веса для пары категорий, введите значение в соответствующую ячейку и нажмите Enter. Вы можете экспортировать пользовательские веса в таблицу из всплывающего диалогового окна, и использовать позднее с помощью опции Получить веса из таблицы.
Веса сходства также влияют на вычисления значений сходства и каппа. Даже если уровни значимости комбинируются на основании весов сходства, таблицы в сообщениях инструмента, символы выходного слоя и диаграммы расценивают их как отдельные категории.
Узнайте больше о сходстве категорий
Если в результатах горячих точек высокая доля незначимых, значение сходства также будет высоким, так как сопоставляются незначимые области. Тем не менее, если вас не интересуют объекты с незначимыми точками, вам может быть не нужно рассчитывать значения сходства и каппа для подтверждения наличия большого числа незначимых точек в обоих слоях результатов анализа горячих точек. Вы можете использовать параметр Исключить незначимые объекты, чтобы исключить пары совпадающих объектов из сравнения, если в обоих случаях результаты анализа горячих точек статистически не значимы. Если исключение задано, инструмент вычислит условные значения сходства и каппа на основе сравнения только статистически значимых горячих и холодных точек. Исключая незначимые объекты из вычислений вы можете вычислить значения сходства и каппа только для статистически значимых горячих и холодных точек, для более точного отражения их сходства и связи.
Если какая-либо категория уровня значимости объединена с категорией незначимых объектов, через указание веса относительного сходства равным 1, такие категории также исключаются из сравнения.
Если какой-либо из входных слоев результатов анализа горячих точек содержит перекрывающиеся полигоны, перекрытия будут пересечены в новые объекты. Это может привести к тому, что значения сходства не будут равны 1 даже для слоев результатов с одинаковыми категориями уровней значимости. Используйте параметр среды Допуск по XY для удаления непреднамеренных перекрытий, таких как ошибки геокодирования. Рекомендуется просмотреть количество объектов в выходных объектах, чтобы определить, не больше ли пересечений, чем ожидалось.
Параметр Число соседей определяет число дополнительных объектов в окрестности, которые также используются при вычислении сходства с учетом расстояния. Так же, как метод взвешивания сходства, сходство на основе расстояния позволяет определить частичное соответствие, если у этих объектов не одинаковый уровень значимости, но у других объектов в их окрестности определяется совпадающий уровень значимости. Так как анализ горячих точек является пространственным методом, который учитывает локальные окрестности, уровень значимости каждого объекта - это характеристика значений не только самого объекта, но и его ближайших соседей. В этом смысле, если какой-либо объект в окрестности демонстрирует сходства, он некоторым образом вносит вклад в сходство своих соседей.
Частичное сходство в окрестности формируется по взвешенному расстоянию в порядке убывания соседей. Объект получает значение веса расстояния 1, и далее веса снижаются последовательно для каждого соседа. Общее сходство между двумя объектами рассчитывается как сходство категорий (по методу взвешивания сходства), умноженное на сходство на основе расстояния.
Более подробно о сходстве по расстоянию и взвешивании соседства
Изменение порядка входных слоев результатов анализа горячих точек не влияет на значение сходства, но ожидаемое значение сходства и значение каппа немного изменятся из-за случайности в перестановках. Также в сообщениях, в таблицах и даиграммах оси поменяются местами, что упростит интерпретацию в ряде случаев. Так как в сообщениях и диаграммах показываются категории уровней значимости второго слоя результатов горячих точек, разбитые на фрагменты категориями первого слоя, вы получите отображение категорий первого слоя, разбитых по категориям второго слоя, поменяв порядок входных слоев.