Взаимная корреляция временных рядов (Углубленный анализ пространственно-временных закономерностей)

Краткая информация

Вычисляет взаимную корреляцию с различными временными задержками между двумя временными рядами, хранящимися в кубе пространство-время.

Взаимная корреляция рассчитывается путем объединения соответствующих значений каждого временного ряда и расчета коэффициента корреляции Пирсона. Затем второй временной ряд сдвигается на один временной шаг и рассчитывается новая корреляция. Это смещение повторяется до заданного максимального количества временных шагов. Временная задержка (сдвиг) с наиболее сильной корреляцией представляет собой оценку задержки между изменениями в одном временном ряду и реакциями в другом (например, задержкой между расходами на рекламу и доходами от продаж). Вы можете фильтровать и удалять тренды из временных рядов, чтобы проверить статистически значимую зависимость между переменными. Вы также можете включить в расчеты пространственных соседей, чтобы учесть пространственные связи между двумя временными рядами.

Более подробно о работе Взаимной корреляции временных рядов

Иллюстрация

Иллюстрация инструмента Взаимная корреляция временных рядов
Взаимные корреляции рассчитываются между двумя временными рядами во всех местоположениях куба пространство-время с различными временными задержками.

Использование

  • Знак (положительный или отрицательный) значения временной задержки интерпретируется как сдвиг вторичной переменной анализа относительно первичной переменной анализа. Например, значение временной задержки, равное 5, означает, что вторичная переменная сдвигается на пять временных шагов вперед (справа по оси времени) перед вычислением взаимной корреляции. Если временная задержка с самой сильной корреляцией положительная, это означает, что изменения значения вторичной переменной анализа происходят раньше, чем изменения первичной переменной анализа. Аналогично, значение временной задержки -3 означает, что вторичный временной ряд сдвинут на три временных шага назад (влево по оси времени). Если временная задержка с самой сильной корреляцией отрицательная, это означает, что изменения первичной переменной анализа происходят раньше, чем изменения вторичной переменной анализа.

    Более подробно о временных задержках

  • Основным результатом работы инструмента является класс пространственных объектов, содержащий результаты взаимной корреляции каждого местоположения для всех временных задержек. На карту будет добавлен составной слой, содержащий шесть слоев из разных полей выходных объектов: три слоя наиболее сильных корреляций (самая сильная положительная, самая сильная отрицательная и самая сильная по абсолютному значению) и три слоя связанных временных задержек для каждой из наиболее сильных корреляций. Вы можете использовать эти слои, чтобы быстро определить, какие местоположения имели наиболее сильную корреляцию и какие временные задержки привели к корреляции.

    Дополнительно вы можете создавать всплывающие окна для выходных объектов, суммирующие и визуализирующие корреляции между всеми задержками в каждом местоположении. Вы также можете создавать выходные таблицы, содержащие все индивидуальные корреляции между местоположениями для каждого временного сдвига.

    Более подробно о выходных данных инструмента

  • Используйте параметр Пространственные соседи для включения в расчеты, чтобы вычислить взаимные корреляции с использованием окрестностей вокруг каждого местоположения. Это уместно, когда временные ряды близлежащих местоположений имеют тенденцию быть более схожими друг с другом, чем временные ряды более удаленных местоположений. Если используются соседи, взаимная корреляция местоположения представляет собой средневзвешенное значение корреляций между первичной переменной фокального местоположения и вторичной переменной каждого из его соседей (включая его самого). Например, если у местоположения пять соседей, взаимная корреляция местоположения представляет собой средневзвешенное значение шести корреляций: корреляция между первичной переменной фокального местоположения и вторичной переменной фокального местоположения; корреляция между первичной переменной фокального местоположения и вторичной переменной первого соседа; корреляция между первичной переменной фокального местоположения и вторичной переменной второго соседа и т.д. Параметр Метод взвешивания пространственных соседей определяет веса, которые будут использоваться при взвешенном среднем.

  • Чтобы проверить статистическую значимость взаимных корреляций на каждой задержке, необходимо проверить параметр Фильтрация и удаление трендов. Если этот параметр отмечен, значения p и 95-процентные доверительные интервалы будут рассчитываться для всех задержек во всех местоположениях. Кроме того, проверка значимости может выполняться только для парных корреляций между двумя временными рядами (а не для средневзвешенного значения нескольких корреляций), поэтому, если вы включаете в расчеты пространственных соседей, только выходная таблица парных корреляций будет содержать p-значения и доверительные интервалы. Если соседи не включены, выходные объекты и таблица выходных корреляций с задержкой будут содержать поля p-значения и доверительного интервала.

    Внимание:

    Тесты статистической значимости выполняются независимо для каждой временной задержки каждого местоположения, и поправка на проверку нескольких гипотез не производится. Будьте осторожны при интерпретации значения любого конкретного значения p или доверительного интервала.

    Более подробно об удалении трендов и фильтрации автокорреляции

  • Одна и та же переменная анализа может быть введена как для первичных, так и для вторичных переменных анализа (так называемый автокорреляционный анализ). Однако результаты могут быть сложными для интерпретации, поскольку временной ряд всегда идеально коррелирует сам с собой, когда значение временной задержки равно нулю (нет смещения). Выходные объекты и таблицы корреляции будут содержать результаты корреляции для всех временных задержек, а результаты с нулевой временной задержкой можно отфильтровать или отменить выбор.

Параметры

ПодписьОписаниеТип данных
Входной куб Пространство-Время

Куб пространство-время, содержащий переменную для анализа. У файлов куба пространство-время расширение - .nc; они создаются разнообразными инструментами в наборе инструментов Углубленный анализ пространственно-временных закономерностей.

File
Первичная переменная анализа

Числовая переменная куба пространство-время, содержащая значения временных рядов первичной переменной.

String
Вторичная переменная анализа

Числовая переменная куба пространство-время, содержащая значение вторичной переменной. При использовании временных задержек вторичная переменная анализа смещается относительно первичной переменной анализа.

String
Выходные объекты

Выходные объекты, содержащие взаимные корреляции всех местоположений для всех временных задержек. На выходе также будут поля самых сильных корреляций (положительных, отрицательных и абсолютных) и поля корреляций всех временных задержек. Если вы фильтруете и удаляете тренды и не используете соседей, выходные данные будут содержать поля значений p и 95-процентные доверительные интервалы всех взаимных корреляций.

Feature Class
Включение всплывающих окон временных рядов
(Дополнительный)

Указывает, будут ли во всплывающих окнах каждого выходного объекта создаваться диаграммы временных рядов, показывающие результаты взаимной корреляции. Всплывающие окна временных рядов не поддерживаются для выходных данных в формате шейп-файл.

  • Отмечено - Для выходных объектов будут созданы диаграммы временных рядов.
  • Не отмечено - Диаграммы временных рядов не будут создаваться. Это значение по умолчанию
Boolean
Максимальная временная задержка
(Дополнительный)

Максимальное количество временных задержек, которые будут использоваться для смещения вторичной переменной анализа. Взаимные корреляции будут рассчитываться для каждого значения временной задержки до максимального. Укажите положительное значение даже для отрицательных временных задержек; например, если для этого параметра указано значение 10, а направление временной задержки смещает вторичную переменную в обоих направлениях, взаимные корреляции будут рассчитываться для всех временных задержек между -10 и 10. Если значение не указано, оно будет определено на основе длины временного ряда. Укажите значение 0, чтобы вычислить только необработанную корреляцию между временными рядами без каких-либо временных задержек.

Long
Направление задержки вторичной переменной
(Дополнительный)

Указывает направление временной задержки. Вторичная переменная может быть сдвинута во времени вперед (относительно первичной переменной), назад во времени или в обоих направлениях.

  • Сдвиг вторичной переменной в обоих направленияхВторичная переменная анализа будет сдвинута в обоих направлениях. Например, если максимальная временная задержка равна 5, будут рассчитаны корреляции для всех временных задержек между -5 и 5. Это значение по умолчанию
  • Сдвиг вторичной переменной вперед во времениВторичная переменная анализа будет сдвинута вперед во времени (вправо по оси времени). Например, если максимальная временная задержка равна 5, будут рассчитаны корреляции для всех временных задержек между 0 и 5. Этот вариант подходит, когда изменения вторичной переменной анализа происходят до изменений первичной переменной анализа.
  • Сдвиг вторичной переменной назад во времениВторичная переменная анализа будет сдвинута назад во времени (влево по оси времени). Например, если максимальная временная задержка равна 5, будут рассчитаны корреляции для всех временных задержек между -5 и 0. Этот вариант подходит, когда изменения первичной переменной анализа происходят до изменений вторичной переменной анализа.
String
Пространственные соседи для включения в расчеты
(Дополнительный)

Указывает соседей вокруг каждого местоположения, которые будут использоваться в расчетах. Если используются соседи, взаимная корреляция местоположения представляет собой средневзвешенное значение корреляций между первичной переменной фокального местоположения и вторичной переменной каждого из его соседей (включая его самого).

  • Нет соседейПространственные соседи не будут включены в расчеты.
  • Диапазон расстоянийМестоположения в пределах указанного расстояния от каждого местоположения будут включены в расчеты как соседи.
  • K ближайших соседейЗаданное число ближайших местоположений будет включено в расчеты как соседи.
  • Только совпадающие ребраПолигоны, имеющие общее ребро, будут включены в качестве соседей (смежность ладьи).
  • Совпадающие ребра и углыПолигоны, имеющие общее ребро или угол, будут включены в качестве соседей (смежность ферзя).
String
Число пространственных соседей
(Дополнительный)

Число ближайших местоположений будет включено в расчеты как соседи.

Long
Диапазон расстояний
(Дополнительный)

Все местоположения в пределах этого расстояний будут включены как соседи. Если значение не будет задано, оно будет получено в процессе обработки и показано в сообщении геообработки. Если указанное расстояние приводит к получению более 1000 соседей, считаться соседями будут только ближайшие 1000 местоположений. Для полигонов для определения соседей используется расстояние между центроидами.

Linear Unit
Метод взвешивания пространственного соседа
(Дополнительный)

Задает схему взвешивания, которая будет применяться к пространственным соседям при вычислении корреляций. Веса используются при вычислении средневзвешенного значения корреляции между фокальным объектом и каждым соседом.

  • Равные весаКаждый сосед получит равный вес (невзвешенные). Это значение по умолчанию
  • Биквадратное ядроСоседи будут взвешены с использованием биквадратного ядра.
  • Гауссово ядроСоседи будут взвешены с использованием Гауссова ядра.
String
Фильтрация и удаление тренда
(Дополнительный)

Указывает, будут ли тренды, сезонность и автокорреляция удалены из основной переменной анализа и использованы для фильтрации вторичной переменной анализа.

  • Отмечено - тренды, сезонность и автокорреляция будут удалены.
  • Не отмечено - значения временных рядов не будут изменены. Это значение по умолчанию
Boolean
Выходная таблица корреляций задержек
(Дополнительный)

Таблица, содержащая корреляции каждой временной задержки каждого местоположения.

Table
Выходная таблица парных корреляций
(Дополнительный)

Таблица, содержащая парные корреляции между каждым местоположением и каждым соседом всех временных сдвигов.

Table

Производные выходные данные

ПодписьОписаниеТип данных
Выходной составной слой

Составной слой с выходными слоями.

Group Layer

arcpy.stpm.TimeSeriesCrossCorrelation(in_cube, analysis_variable_1, analysis_variable_2, output_features, {enable_pop_ups}, {max_lag}, {lag_direction}, {neighborhood_type}, {num_nbrs}, {distance_band}, {spatial_weights}, {filter_option}, {out_corr_table}, {out_pair_table})
ИмяОписаниеТип данных
in_cube

Куб пространство-время, содержащий переменную для анализа. У файлов куба пространство-время расширение - .nc; они создаются разнообразными инструментами в наборе инструментов Углубленный анализ пространственно-временных закономерностей.

File
analysis_variable_1

Числовая переменная куба пространство-время, содержащая значения временных рядов первичной переменной.

String
analysis_variable_2

Числовая переменная куба пространство-время, содержащая значение вторичной переменной. При использовании временных задержек вторичная переменная анализа смещается относительно первичной переменной анализа.

String
output_features

Выходные объекты, содержащие взаимные корреляции всех местоположений для всех временных задержек. На выходе также будут поля самых сильных корреляций (положительных, отрицательных и абсолютных) и поля корреляций всех временных задержек. Если вы фильтруете и удаляете тренды и не используете соседей, выходные данные будут содержать поля значений p и 95-процентные доверительные интервалы всех взаимных корреляций.

Feature Class
enable_pop_ups
(Дополнительный)

Указывает, будут ли во всплывающих окнах каждого выходного объекта создаваться диаграммы временных рядов, показывающие результаты взаимной корреляции. Всплывающие окна временных рядов не поддерживаются для выходных данных в формате шейп-файл.

  • CREATE_POPUPДля выходных объектов будут созданы диаграммы временных рядов.
  • NO_POPUPДиаграммы временных рядов не будут создаваться. Это значение по умолчанию
Boolean
max_lag
(Дополнительный)

Максимальное количество временных задержек, которые будут использоваться для смещения вторичной переменной анализа. Взаимные корреляции будут рассчитываться для каждого значения временной задержки до максимального. Укажите положительное значение даже для отрицательных временных задержек; например, если для этого параметра указано значение 10, а направление временной задержки смещает вторичную переменную в обоих направлениях, взаимные корреляции будут рассчитываться для всех временных задержек между -10 и 10. Если значение не указано, оно будет определено на основе длины временного ряда. Укажите значение 0, чтобы вычислить только необработанную корреляцию между временными рядами без каких-либо временных задержек.

Long
lag_direction
(Дополнительный)

Указывает направление временной задержки. Вторичная переменная может быть сдвинута во времени вперед (относительно первичной переменной), назад во времени или в обоих направлениях.

  • BOTHВторичная переменная анализа будет сдвинута в обоих направлениях. Например, если максимальная временная задержка равна 5, будут рассчитаны корреляции для всех временных задержек между -5 и 5. Это значение по умолчанию
  • FORWARDВторичная переменная анализа будет сдвинута вперед во времени (вправо по оси времени). Например, если максимальная временная задержка равна 5, будут рассчитаны корреляции для всех временных задержек между 0 и 5. Этот вариант подходит, когда изменения вторичной переменной анализа происходят до изменений первичной переменной анализа.
  • BACKWARDВторичная переменная анализа будет сдвинута назад во времени (влево по оси времени). Например, если максимальная временная задержка равна 5, будут рассчитаны корреляции для всех временных задержек между -5 и 0. Этот вариант подходит, когда изменения первичной переменной анализа происходят до изменений вторичной переменной анализа.
String
neighborhood_type
(Дополнительный)

Указывает соседей вокруг каждого местоположения, которые будут использоваться в расчетах. Если используются соседи, взаимная корреляция местоположения представляет собой средневзвешенное значение корреляций между первичной переменной фокального местоположения и вторичной переменной каждого из его соседей (включая его самого).

  • NO_NBRSПространственные соседи не будут включены в расчеты.
  • FIXED_DISTANCEМестоположения в пределах указанного расстояния от каждого местоположения будут включены в расчеты как соседи.
  • K_NEAREST_NEIGHBORSЗаданное число ближайших местоположений будет включено в расчеты как соседи.
  • CONTIGUITY_EDGES_ONLYПолигоны, имеющие общее ребро, будут включены в качестве соседей (смежность ладьи).
  • CONTIGUITY_EDGES_CORNERSПолигоны, имеющие общее ребро или угол, будут включены в качестве соседей (смежность ферзя).
String
num_nbrs
(Дополнительный)

Число ближайших местоположений будет включено в расчеты как соседи.

Long
distance_band
(Дополнительный)

Все местоположения в пределах этого расстояний будут включены как соседи. Если значение не будет задано, оно будет получено в процессе обработки и показано в сообщении геообработки. Если указанное расстояние приводит к получению более 1000 соседей, считаться соседями будут только ближайшие 1000 местоположений. Для полигонов для определения соседей используется расстояние между центроидами.

Linear Unit
spatial_weights
(Дополнительный)

Задает схему взвешивания, которая будет применяться к пространственным соседям при вычислении корреляций. Веса используются при вычислении средневзвешенного значения корреляции между фокальным объектом и каждым соседом.

  • EQUALКаждый сосед получит равный вес (невзвешенные). Это значение по умолчанию
  • BISQUAREСоседи будут взвешены с использованием биквадратного ядра.
  • GAUSSIANСоседи будут взвешены с использованием Гауссова ядра.
String
filter_option
(Дополнительный)

Указывает, будут ли тренды, сезонность и автокорреляция удалены из основной переменной анализа и использованы для фильтрации вторичной переменной анализа.

  • FILTERТренды, сезонность и автокорреляция будут удалены.
  • NO_FILTERЗначения временных рядов не будут изменены. Это значение по умолчанию
Boolean
out_corr_table
(Дополнительный)

Таблица, содержащая корреляции каждой временной задержки каждого местоположения.

Table
out_pair_table
(Дополнительный)

Таблица, содержащая парные корреляции между каждым местоположением и каждым соседом всех временных сдвигов.

Table

Производные выходные данные

ИмяОписаниеТип данных
output_layer_group

Составной слой с выходными слоями.

Group Layer

Пример кода

TimeSeriesCrossCorrelation, пример 1 (окно Python)

Следующий скрипт Python демонстрирует, как использовать функцию TimeSeriesCrossCorrelation.

import arcpy
arcpy.stpm.TimeSeriesCrossCorrelation(
    in_cube=r"c:\data\Sales.nc",
    analysis_variable_1="MARKETING",
    analysis_variable_2="REVENUE",
    output_features=r"CrossCorrResults",
    enable_pop_ups="NO_POPUP",
    max_lag=10,
    lag_direction="BOTH",
    neighborhood_type="K_NEAREST_NEIGHBORS",
    num_nbrs=8,
    distance_band=None,
    spatial_weights="EQUAL",
    filter_option="FILTER",
    out_corr_table=r"LagCorrTable",
    out_pair_table=r"PairCorrTable"
)
TimeSeriesCrossCorrelation, пример 2 (автономный скрипт)

Следующий скрипт Python демонстрирует, как использовать функцию TimeSeriesCrossCorrelation.

# Estimate the time lag between infection and 
# hospitalization for seasonal influenza.

# Import required modules.
import arcpy

# Set the workspace.
arcpy.env.workspace = "c:/data/data.gdb"

# Run Time Series Cross Correlation
# Use neighbors and calculate p-values
try:
    arcpy.stats.CausalInferenceAnalysis(
        in_cube=r"c:\data\FluData.nc",
        analysis_variable_1="FLU_CASES",
        analysis_variable_2="HOSPITALIZATIONS",
        output_features=r"CrossCorrResults",
        enable_pop_ups="POPUP",
        max_lag=10,
        lag_direction="BOTH",
        neighborhood_type="K_NEAREST_NEIGHBORS",
        num_nbrs=8,
        distance_band=None,
        spatial_weights="BISQUARE",
        filter_option="FILTER",
        out_corr_table=r"LagCorrTable",
        out_pair_table=r"PairCorrTable"
    )
except arcpy.ExecuteError:
    # If an error occurred when running the tool, print the error message.
    print(arcpy.GetMessages())

Информация о лицензиях

  • Basic: Да
  • Standard: Да
  • Advanced: Да

Связанные разделы