В этом документе содержится дополнительная информация о параметрах инструментов, а также описываются основные термины и понятия, важные для анализа данных с помощью Инструментов пространственной статистики. Используйте этот документ как справочник, когда вам потребуется дополнительная информация о параметрах инструмента.
Примечание:
- Инструменты в наборе инструментов Пространственная статистика не работают напрямую со слоями событий. Данные событий XY следует до начала анализа преобразовать в класс пространственных объектов при помощи инструмента Копировать объекты.
- При использовании шейп-файлов, помните, что в них нельзя хранить нулевые (null) значения. Инструменты или другие процедуры, создающие шейп-файлы из прочих входных данных, могут хранить значения NULL в виде 0 или интерпретировать их как нуль. В некоторых случаях нули в шейп-файлах хранятся как очень маленькие отрицательные числа. Это может привести к неожиданным результатам. Дополнительные сведения см. в разделе Рекомендации по геообработке выходных данных шейп-файла.
Определение пространственных взаимоотношений
Важное отличие между пространственной и традиционной (пространственной или непространственной) статистикой состоит в том, что пространственная статистика интегрирует пространство и пространственные отношения непосредственно в вычисления. Следовательно, многие инструменты из набора Пространственной статистики требуют, чтобы значение параметра Определение пространственных взаимоотношений было выбрано до выполнения анализа. Общая концептуальная модель (определение) включает обратное расстояние, время в пути, фиксированное расстояние, K ближайших соседей и смежность. Концептуальная модель определения пространственных взаимоотношений, которую вы используете, зависит от того, что именно вы измеряете. Если вы измеряете кластеризацию отдельных видов размножающихся семенами растений, вероятно, обратное расстояние подходит лучше всего. Однако, если вы оцениваете географическое распределение жителей пригородов, приезжающих на работу в город, время пути и стоимость пути будут лучше всего описывать пространственные отношения. Для некоторых видов анализа, пространство и время могут иметь меньшее значение, чем абстрактные концепции, такие как знакомство с чем-либо (чем более знакомо что-либо, тем большей функциональностью оно обладает) или пространственное взаимодействие (например, между Нью-Йорком и Лос-Анджелесом совершается значительно больше телефонных звонков, чем между Нью-Йорком и небольшим городом рядом с ним, таким как Покипси – можно предположить, что Лос-Анджелес и Нью-Йорк функционально ближе).
Инструмент Пространственно ограниченная многовариантная кластеризация содержит параметр Пространственные ограничения, и хотя опции параметра аналогичны описанным для параметра Определение пространственных взаимоотношений, они используются по-разному. При наложении пространственного ограничения, только объекты с хотя бы одним соседом (что также определяется близостью, отношениями ближайшей окрестности или методами триангуляции) могут входить в одну группу. Дополнительные сведения и примеры см. в разделе Как работает инструмент Пространственно ограниченная многовариантная кластеризация.
Опции параметра Определение пространственных взаимоотношений описываются ниже. Выбранные вами опции определяют взаимоотношения в окрестностях для инструментов, которые оценивают каждый пространственный объект в контексте окрестных объектов. К таким инструментам относятся Пространственная автокорреляция (глобальный индекс Морана I), Анализ горячих точек (Getis-Ord Gi*) и Анализ кластеров и выбросов (Anselin локальный индекс Морана I). Обратите внимание, что некоторые из этих опций доступны только, если вы используете инструмент Построить матрицу пространственных весов.
Обратное расстояние, обратное расстояние в квадрате (сопротивление)
При использовании опций обратного расстояния, концептуальная модель (определение) пространственных взаимоотношений зависит от сопротивления, или затухания в зависимости от расстояния. Все пространственные объекты воздействуют/влияют на другие пространственные объекты, но, с увеличением расстояния, это влияние снижается. В общем случае, если вы используете модель обратных расстояний, вам потребуется ввести значение Диапазон расстояний или пороговое расстояние для сокращения количества необходимых вычислений, особенно для больших наборов данных. Если эти значения не указаны, вычисляется пороговое значение по умолчанию. Вы можете ввести все объекты в ближайшую окрестность, задав значение 0 для параметра Диапазон расстояний или пороговое расстояние.
Обратное евклидово расстояние подходит для моделирования непрерывных данных, например изменений температуры. Обартное Манхэттенское расстояние лучше всего работает, если в анализе участвуют местоположения магазинов или других городских предприятий, в том случае, если данные дорожной сети недоступны. Концептуальная модель при использовании опции Обратные расстояния в квадрате не отличатся от модели, использующей Обратные расстояния, за исключением случаев, когда уклон острее, и влияния соседей спадают быстрее и только ближайший сосед оказывает наиболее значимое влияние на вычисления для данного объекта.
Диапазон расстояний (сфера влияния)
Для таких инструментов как Анализ горячих точек диапазоном фиксированных расстояний является Определение пространственных взаимоотношений по умолчанию. С помощью опции Полоса фиксированных расстояний вводится модель "сферы влияния" или "скользящего окна". Каждый пространственный объект анализируется в контексте окружающих его объектов, расположенных на расстоянии, заданном параметром Диапазон расстояний или пороговое расстояние. Соседи в пределах заданного расстояния имеют одинаковый вес. Пространственные объекты, находящиеся вне указанного расстояния, не оказывают влияния на вычисления (их вес принимается за 0). Используйте метод Полоса фиксированных расстояний, если вы хотите оценить статистические параметры данных при определенном (фиксированном) пространственном масштабе. Если вы изучаете закономерности ежедневных поездок в город из пригородов и знаете, что среднее расстояние поездки составляет 15 миль, вы можете использовать для анализа фиксированное расстояние в 15 миль. В разделе Выбор фиксированного расстояния приведены стратегии, которые помогут определить соответствующий вашему анализу масштаб.
Зона индифферентности
Опция Зона индифферентности для параметра Определение пространственных отношений комбинирует модели Обратное расстояние и Диапазон фиксированных расстояний. Пространственные объекты, расположенные в пределах диапазона расстояний или порогового расстояния, включаются в анализ целевого пространственного объекта. После достижения критического расстояния, уровень влияния (вес) быстро уменьшается. Предположим, вы ищите работу и выбираете между офисами, расположенными на расстоянии 5 и 6 миль от дома. В этом случае, расстояние, скорее всего, не будет иметь для вас большого значения. Теперь, предположим, что один офис расположен в 5 милях от дома, а другой – в 20 милях. В этом случае, расстояние становится существенным и не может не учитываться при принятии решения. Используйте этот метод, если вы хотите иметь фиксированный масштаб анализа, но не хотите ограничиваться жесткими рамками окрестных объектов, включенных в вычисления для целевого объекта.
Смежность полигонов (первого порядка)
Для классов полигональных объектов можно выбрать опцию Только совпадающие ребра (которую иногда называют Rook's Case) или Совпадающие ребра и углы (которую иногда называют Queen's Case). В рамках метода Только совпадающие ребра полигоны, имеющие общее ребро (т. е. совпадающую границу), включаются в вычисления для целевого полигона. Полигоны, не имеющие общих ребер, исключаются из вычислений. В рамках метода Совпадающие ребра и углы полигоны, имеющие общее ребро или угол, включаются в вычисления для целевого полигона. Если часть двух полигонов пересекается, они считаются соседями и включатся в соответствующие вычисления. Используйте одну из этих концептуальных моделей смежности с объектами-полигонами в том случае, если вы моделируете распространение некоторых типов инфекционных заболеваний или работаете с непрерывными данными, представленными в виде полигонов.
Ближайшая окрестность K
Отношения в окрестности можно также сконструировать так, что каждый пространственный объект будет доступен в пределах пространственного контекста, состоящего из заданного числа ближайших окрестностей. Если K (число окрестностей) равно 8, в вычисления для целевого пространственного объекта будут включены восемь ближайших окрестностей. В тех местах, где плотность пространственных объектов высока, пространственный контекст анализа будет меньше. Соответственно, если плотность объектов невелика, пространственный контекст анализа будет больше. Преимущество этой модели пространственных отношений состоит в том, что для каждого целевого объекта будет задано некоторое количество окрестностей, даже если плотность пространственных объектов в изучаемой области варьирует в широких пределах. Этот метод можно применить, когда вы работаете с инструментом Построить матрицу пространственных весов. Опция Ближайшая окрестность K со значением 8 для параметра Количество соседей – это модель по умолчанию, используемая с инструментом Исследовательская регрессия для оценки невязок регрессии.
Триангуляция Делоне (естественная окрестность)
Опция Триангуляция Делоне создает окрестности методом построения треугольников Вороного по точечным объектам или по центроидам пространственных объектов, так, чтобы каждая точка/центроид становилась узлом (вершиной) треугольника. Узлы, соединенные ребрами треугольников, рассматриваются как окрестности. Использование триангуляции Делоне позволяет обеспечить для каждого пространственного объекта наличие хотя бы одной окрестности, даже если в данных присутствуют острова или плотность пространственных объектов меняется в широких пределах. Опцию DELAUNAY_TRIANGULATION не следует использовать для наборов данных с совпадающими объектами. Этот метод можно применить, когда вы работаете с инструментом Построить матрицу пространственных весов.
Пространственно-временное окно
С помощью этой опции можно определить отношения объектов как в пространственном (фиксированное расстояние), так и во временном (фиксированный интервал) окне. Эта опция доступна при создании файла матрицы пространственных весов с помощью инструмента Построить матрицу пространственных весов. При выборе опции Пространственно-временное окно также требуется указать Поле даты/времени, Тип интервала даты/времени (например, Часы, Дни или Месяцы) и Значение интервала даты/времени. Значение интервала – целое число. Если вы выбрали опцию Часы в качестве типа интервала и значение 3 как значение интервала, два объекта будут считаться соседями, если значения в поле Дата/Время расположены в пределах трех часов друг от друга. С такой моделью объекты будут соседями, если они расположены на определенном расстоянии и в пределах заданного временного интервала целевого объекта. В качестве примера можно выбрать опцию Пространственно-временное окно для параметра Определение пространственных взаимоотношений, если требуется создать файл матрицы пространственных весов для использования инструмента Анализ горячих точек, чтобы выявить горячие точки в пространстве-времени. Дополнительные сведения, в том числе о визуализации результатов, см. в разделе Пространственно-временной анализ. Имеются также другие возможности для визуализации в 3D пространственно-временного куба netCDF.
Получение пространственных весов из файла (пространственные отношения, заданные пользователем)
Можно создать файл для хранения соседних отношений объектов с помощью инструмента Построить файл матрицы пространственных весов. Если пространственные отношения для ваших объектов определены в таблице, используйте инструмент Построить матрицу пространственных весов, чтобы преобразовать эту таблицу в файл матрицы пространственных весов (.swm). Определенные поля нужно включить в таблицу, чтобы использовать опцию Конвертировать таблицу для получения SWM-файла. Можно указать путь к форматированному текстовому ASCII-файлу, который задает пользовательское определение пространственных взаимоотношений (например, на основе пространственных взаимодействий).
Лучшие практики для выбора определения пространственных отношений
Чем более точно вы сможете смоделировать взаимодействие пространственных объектов в пространстве, тем более точные результаты вы получите. Выбор параметра Определение пространственных взаимоотношений должен отражать внутренние отношения между пространственными объектами, которые вы анализируете. Иногда на выбор могут влиять характеристики имеющихся данных.
Методы обратно-взвешенного расстояния, (Обратное расстояние, Обратное расстояние в квадрате), например, лучше всего подходят для непрерывных данных или для моделирования процессов, в которых два объекта сближены в пространстве настолько, что с большей вероятностью оказывают влияние друг на друга. При такой пространственной модели, каждый объект является потенциальной окрестностью любого другого объекта, и, при использовании больших наборов данных, количество вычислений может стать значительным. Всегда следует пытаться включить значение Диапазон расстояний или пороговое расстояние при использовании модели обратно-взвешенного расстояния. Это особенно важно для больших наборов данных. Если вы оставите параметр Диапазон расстояний или пороговое расстояние пустым, пороговое расстояние будет вычислено автоматически, но оно может оказаться не вполне подходящим расстоянием для вашего анализа. По умолчанию пороговое расстояние равно минимальному расстоянию, которое гарантирует, что для каждого объекта имеется хотя бы одна окрестность.
Метод Полоса фиксированных расстояний хорошо работает с точечными данными. Это опция по умолчанию, используемая инструментом Анализ горячих точек (Getis-Ord Gi*). Метод полосы фиксированных расстояний хорошо работает с полигональными данными, имеющими различные размеры полигонов (большие полигоны по краям изучаемой области и очень маленькие полигоны в центре изучаемой области, например), если вам требуется обеспечить согласованный масштаб анализа. В нижеследующем разделе Выбор значения полосы фиксированных расстояний приведены стратегии, которые помогут определить значение диапазона расстояний, подходящее для вашего анализа.
Модель Зоны индифферентности хорошо работает при правильно подобранном фиксированном расстоянии, но слишком резкие границы отношений окрестностей мешают точному представлению данных. Имейте в виду, что в модели зоны индифферентности каждый пространственный объект рассматривается как окрестность другого объекта. Следовательно, эта опция не подходит для больших наборов данных, поскольку указанные значения Диапазона расстояний или порогового расстояния не ограничивают число окрестностей, а только определяют, где интенсивность пространственных отношений начинает снижаться.
Модель смежных полигонов (Только совпадающие ребра, Совпадающие ребра и углы) эффективна, когда полигоны имеют одинаковые размеры и однотипное распределение, а пространственные отношения являются функцией близости полигонов (если два полигона имеют общую границу, пространственное взаимодействие между ними возрастает). Если вы выбрали модель смежности полигонов, почти всегда потребуется выбрать нормализацию ряда (значений) для инструментов, которые имеют параметр Нормализация ряда.
Опция K ближайших соседей (K nearest neighbors) эффективна, если вам необходимо задать минимальное количество окрестностей для анализа. Если значения, связанные с пространственными объектами, ассиметричны (не имеют нормального распределения), важно, чтобы каждый объект оценивался в контексте как минимум восьми (или около того) окрестностей. Если распределение данных в изучаемом районе неоднородно, т.е., некоторые пространственные объекты расположены очень далеко от всех остальных объектов, этот метод работает очень хорошо. Заметьте, однако, что пространственный контекст анализа меняется в зависимости от изменения плотности используемых пространственных объектов. Если фиксированный масштаб анализа имеет меньшее значение, чем фиксированное число окрестностей, можно использовать метод K ближайших соседей.
Некоторые аналитики рассматривают триангуляцию Делоне в качестве способа создания естественных окрестностей для набора пространственных объектов. Этот метод является хорошим вариантом, если ваши данные содержат островные полигоны (изолированные полигоны, которые не имеют общих границ с другими полигонами), или в тех случаях, когда пространственные объекты распределены слишком неравномерно. Эту опцию не следует использовать для наборов данных с совпадающими объектами. Так же, как и метод K ближайших соседей, триангуляция Делоне обеспечивает для каждого пространственного объекта наличие минимум одной окрестности, при этом на основе распределения данных определяется количество окрестностей, которое может быть присвоено каждому объекту.
Опция Окно пространства-времени позволяет определить отношения объектов как с точки зрения пространственной, так и временной близости. Эта опция используется для определения горячих точек в пространстве-времени или формирования групп, членство в которых определяется близостью в пространстве и времени. Примеры пространственно-временного анализа, а также стратегии для эффективного отображения результатов такого анализа представлены в разделе Пространственно-временной анализ.
Для некоторых приложений пространственные взаимодействия лучше всего моделируются в терминах времени пути или расстояния пути. Если вы моделируете доступность до городских служб, например, или определяете "горячие точки" преступности, наилучшим выбором будет моделирование пространственных отношений в терминах сети. Используйте инструмент Построить матрицу пространственных весов для сети, чтобы создать файл матрицы пространственных весов (.swm) перед анализом. Выберите GET_SPATIAL_WEIGHTS_FROM_FILE для значения Определения пространственных взаимоотношений и для Файл матрицы весов укажите полный путь к созданному ранее файлу SWM.
Подсказка:
Многие организации сохраняют собственные сетевые наборы улиц, с которыми вы можете работать. В качестве альтернативы Street Map Premium for ArcGIS содержит предварительно построенные наборы сетевых данных в формате SDC, покрывающие Северную Америку, Латинскую Америку, Европу, Среднюю Восточную Африку, Японию, Австралию и Новую Зеландию. Эти наборы сетевых данных могут напрямую использоваться данным инструментом.
Если ни одна из опций параметра Определение пространственных взаимоотношений не подходит для вашего анализа, можно создать текстовый ASCII-файл или таблицу, содержащие необходимые вам отношения между пространственными объектами, и затем использовать их для построения файла матрицы пространственных весов. Если одна из указанных выше опций соответствует, но не идеально подходит для ваших целей, можно использовать инструмент Построить матрицу пространственных весов для создания базового SWM-файла и измените файл матрицы пространственных весов.
Метод расстояния
Многие инструменты из набора инструментов Пространственная статистика используют в вычислениях расстояние. Эти инструменты предоставляют вам выбор между евклидовым или манхэттенским расстоянием.
- Евклидово расстояние вычисляется по формуле
D = sq root [(x1–x2)**2.0 + (y1–y2)**2.0]
где (x1, y1) – координаты точки A, (x2, y2) – координаты точки B, а D – расстояние по прямой между точками A и B.
- Манхэттоновское расстояние вычисляется по формуле
D = abs(x1–x2) + abs(y1–y2)
где (x1, y1) — координаты точки A, (x2, y2) — координаты точки B, а D — сумма вертикальной и горизонтальной разности между точками A и B. Это расстояние, которое необходимо пройти, если возможность перемещения ограничена только направлениями север-юг и запад-восток. Этот метод дает более точные результаты, чем Евклидово расстояние, если путь ограничен дорожной сетью и если стоимость перемещения по уличной сети не доступна.
Когда ваши входные объекты не имеют проекции (т.е. когда координаты заданы в градусах, минутах и секундах), или когда в качестве выходной системы координат используется Географическая система координат, а также когда вы указываете путь выходного класса объектов к набору классов объектов, имеющему пространственную привязку Географической системы координат, расстояния будут рассчитываться с помощью хордовых измерений, а параметр Метод определения расстояния будет отключен. Измерения хордовых расстояний применяются постольку, поскольку они могут быть быстро вычислены и дают очень хорошие оценки истинных геодезических расстояний, по крайней мере для точек, расстояние между которыми в пределах порядка тридцати градусов. В основе хордовых расстояний лежит скорее сфероид, чем форма сплющенного у полюсов эллипсоида Земли. Если взять две любые точки на поверхности Земли, то хордовым расстоянием между ними будет длина прямой линии, проходящей через трехмерное тело Земли и соединяющей эти две точки. Хордовые расстояния выражаются в метрах.
Внимание:
Следует обязательно производить проецирование ваших данных, если область исследования превышает 30 градусов. Хордовые расстояния не обеспечивают точных оценок геодезических расстояний, превышающих 30 градусов.
Собственный потенциал (поле, дающее интразональный вес)
Некоторые инструменты в наборе инструментов Пространственная статистика позволяют вычислить поле, представляющее вес, который используется для собственного потенциала. Собственный потенциал – это расстояние или вес между объектом и этим же объектом. Часто вес имеет значение 0, но в некоторых случаях может потребоваться определить другое фиксированное или изменяющееся для каждого объекта значение. Если ваша модель пространственных отношений основана на расстояниях в пределах или между переписными участками, то, например, вы можете решить смоделировать собственный потенциал, чтобы отразить средние расходы на путешествие с учетом размеров полигона:
dii = 0.5*[(Ai / π)**0.5]
где dii – транспортные расходы, связанные с внутризональным путешествием для полигонального объекта i, и Ai – область, связанная с полигональным объектом i.
Нормализация
Нормализация ряда рекомендуется, независимо от того, распределены ли объекты потенциально предвзято в зависимости от дизайна примера или от установленной схемы агрегации. Когда выбирается нормализация ряда, каждый вес делится на его сумму весов ряда (сумму весов всех соседних объектов). Взвешивание с нормализацией весов ряда значений часто используется с фиксированным расстоянием до соседних окрестностей и практически всегда используется для соседей, основанных на полигональной смежности. Это для того, чтобы смягчить смещение из-за того, что объекты имеют разное количество соседей. Нормализация ряда масштабирует все веса так, что они варьируют между 0 и 1, создавая относительную, а не абсолютную схему взвешивания. В любом случае, когда вы работаете с полигональными объектами, представляющими административные границы, вы, вероятно, захотите выбрать опцию Нормализации ряда.
Ниже приведены примеры:
- Предположим, что у вас есть полный набор всех инцидентов-правонарушений. В некоторых частях изучаемой территория представлено много точек, так как это места с высоким уровнем преступности. В других частях точек меньше, так как здесь уровень преступности низкий. Плотность точек очень хорошо отражает (представляет) то, что вы пытаетесь понять: пространственные закономерности преступлений. Возможно, вы не будете выполнять нормализацию ряда для пространственных весов.
- Предположим, вы взяли образцы почвы. По какой-то причине (погода была хорошая или вы были в месте без заборов, болот и горных вершин, которые нужно было преодолеть) у вас много образцов из определенных частей изучаемой территории и меньше образцов из других частей. Другими словами, плотность точек не является результатом тщательно спланированной произвольной выборки, из-за чего могло возникнуть собственное смещение. Кроме того, большое число точек необязательно является отражением пространственного распределения анализируемых данных. Чтобы минимизировать смещение, которое могло возникнуть в процессе получения образцов, необходимо выполнить нормализацию ряда пространственных весов. После выполнения нормализации ряда, тот факт, что у одного объекта два соседа, а другого их 18, не будет сильно влиять на результаты. Все веса в сумме будут давать 1.
- При агрегации данных вы придаете им определенную структуру. В редких случаях эта структура будет хорошим отражением анализируемых данных и исследуемого явления. Например: хотя полигоны переписи (как и районы переписи) сформированы на основе численности населения, даже если ваш анализ связан с вопросами численности, вам все равно придется нормализовать веса, так как эти полигоны представляют всего один из множества способов представления данных. Для полигональных данных нормализация ряда пространственных весов выполняется практически всегда.
Диапазон расстояний или пороговое расстояние
Параметр Диапазон расстояний или пороговое расстояние позволяет установить масштаб анализа для большинства определений пространственных взаимоотношений (например, Обратное расстояние и Полоса фиксированных расстояний. Это положительное числовое значение, представляющее предельное расстояние. Объекты, расположенные за пределами указанного предельного расстояния, игнорируются в анализе для данного объекта. Однако для Зоны индифферентности влияние объектов, расположенных вне приведенного расстояния, сокращается в соответствие с близостью, в то время как расположенные в пределах порогового расстояния, рассматриваются в одинаковых условиях.
Выбор подходящего расстояния очень важен. Некоторые пространственные статистические показатели требуют для каждого объекта иметь как минимум одного соседа для того, чтобы анализ был надежный. Если значения, которое вы устанавливаете для параметра Диапазон расстояний или пороговое расстояние, слишком мало (и у некоторых объектов нет соседей), появится предупреждение и вам будет предложено увеличить расстояние. Инструмент Вычислить диапазон расстояний до числа соседних объектов позволяет оценить минимальное, среднее и максимальное расстояния для указанного количества соседей, и может помочь вам определить подходящий диапазон расстояний для анализа. См. также Выбор полосы фиксированных расстояний для дополнительных инструкций.
Когда значение не указано, рассчитывается пороговое расстояние по умолчанию. Приведенная ниже таблица демонстрирует, какие результаты выдают различные опции параметра Определение пространственных взаимоотношений для каждого из трех возможных типов (отрицательные значения не действительны):
Обратное расстояние, обратное расстояние в квадрате | Полоса фиксированных расстояний, Зона индифферентности | Близость полигонов, Триангуляция Делоне, К ближайших соседей | |
---|---|---|---|
0 | Пороговое и предельное значения не применяются; каждый объект – сосед для каждого другого объекта. | Неверно. Будет сгенерирована ошибка выполнения. | Игнорировано. |
пустой | Будет вычислено расстояние по умолчанию. Значение по умолчанию – это минимальное расстояние, которое гарантирует каждому объекту как минимум 1 соседа. | Будет вычислено расстояние по умолчанию. Значение по умолчанию – это минимальное расстояние, которое гарантирует каждому объекту как минимум 1 соседа. | Игнорировано. |
положительное число | Ненулевое, положительное значение будет использовано как предельное расстояние; соседские взаимосвязи будут только существовать среди объектов в пределах этой дистанции. | Для полосы фиксированных расстояний, только объекты в пределах этого указанного предельного расстояния будут соседями. Для зоны индифферентности, объекты в пределах указанного предельного расстояния будут соседями; объекты за пределами этого расстояния тоже будут соседями, но будут иметь все меньший и меньший вес/влияние по мере увеличения расстояния. | Игнорировано. |
Количество соседей
Укажите положительное целое число, чтобы представить количество соседей, которые должны быть включены в анализ. Когда для параметра Определение пространственных отношений выбрано значение K ближайших соседей, каждый объект будет оценен в контексте ближайших К соседей (где К – указанное количество соседей). Если при запуске инструмента Построить матрицу пространственных весов для Обратного расстояния или Фиксированного диапазона расстояний задать значение параметра Количество соседей, каждый объект будет гарантированно иметь как минимум К соседей. При расчете на основе примыкания полигонов, для любого объекта, для которого не указано Количество соседей, будут найдены соседние объекты на основании расчета близости по центроидам.
Файл матрицы весов
Некоторые инструменты позволяют вам определить пространственные отношения среди объектов, указывая путь к матрице пространственных весов. Пространственные веса – числа, которые отражают расстояние, время, или цену между объектами в базе данных. Файл матрицы пространственных весов можно создать с помощью инструмента Построить матрицу пространственных весов или использовать обычный ASCII-файл.
Когда файл матрицы пространственных весов – просто текстовый ASCII-файл, первая строка должна быть именем уникального поля ID. Это позволяет гибко использовать любое числовое поле из набора данных в качестве ID, при генерации файла; однако поле с ID должно быть целочисленным (длинным или коротким) и содержать уникальные значения для каждого объекта. После первой линии, файл пространственных весов должен быть форматирован в 3 колонки:
- От ID объекта
- К ID объекта
- Вес
Например, предположим, что у вас есть 3 АЗС. Поле, которое вы используете в качестве поля ID, называется StationID, а ID объектов – 1, 2 и 3. Вы хотите смоделировать пространственные отношения между этими тремя АЗС, используя время в пути в минутах. Вы можете создать ASCII-файл, который выглядит следующим образом:
Обычно, когда веса представляют расстояние или время, они обращаются (например, 1/10, когда расстояние 10 миль или 10 минут) для того, чтобы ближайшие объекты имели больший вес, нежели удаленные. Заметьте из файла весов выше, что АЗС 1 в 10-ти минутах от АЗС 2. Заметьте также, что время в пути – несимметрично в этом примере (время в пути от АЗС 1 до АЗС 3 – 7 минут, но время в пути от АЗС 3 до АЗС 1 – только 6 минут). Заметьте, что вес между АЗС 1 и ей самой – 0, для АЗС 2 – пустое поле. Пустое поле означает 0.
Ручной ввод значений для матрицы пространственных весов – утомительная работа даже для маленьких наборов данных. Лучший подход – использовать инструмент Построить матрицу пространственных весов (Generate Spatial Weights Matrix) или быстро написать скрипт, чтобы выполнить эту задачу.
Файл матрицы пространственных весов (.swm)
Инструмент Создать матрицу пространственных весов создаст файл матрицы пространственных весов (.swm), определяющий пространственные отношения между всеми объектами в вашем наборе данных на основе заданных вами параметров. Этот файл создается в двоичном формате, чтобы его нельзя было просматривать напрямую. Для просмотра или изменения отношений объектов в SWM-файле используйте инструмент Преобразовать матрицу пространственных весов в таблицу.
Если пространственные отношения между объектами хранятся в таблице, можно использовать инструмент Построить матрицу пространственных весов для конвертации этой таблицы в файл .swm. В таблице должны присутствовать следующие поля:
Имя поля | Описание |
---|---|
<Уникальное имя поля ID> | Целое поле, которое существует во входящем классе объектов с уникальным ID для каждого объекта. Это от ID объекта. |
NID | Целочисленное поле, содержащее ID соседних объектов. Это к ID объекта. |
WEIGHT | Это числовой вес, определяющий пространственные отношения между объектами: от объекта и к объекту. Большие значения отражают большие веса и более сильное влияние, или взаимодействие между двумя объектами. |
Разделение файлов матриц пространственных весов
Результатом работы инструмента Построить матрицу пространственных весов является файл SWM. Этот файл связывается с входным классом объектов, полем уникального ID и выходной системой координат при создании SWM-файла. Другие люди могут продублировать пространственные отношения, которые вы определяете для анализа, используя SWM-файл и тот же входной класс объектов или класс объектов, связывающий все или часть объектов с соответствующим полем Unique ID. В частности, если вы планируете предоставить SWM-файлы для совместной работы, попытайтесь избежать ситуации, когда ваша выходная система координат отличается от пространственной привязки, ассоциированной с входным классом объектов. Лучшая стратегия – перепроецировать Входной класс объектов, затем установить Выходную систему координат такую же, как и Входной класс объектов до создания файлов SWM.