创建时空立方体的工作原理

通过创建时空立方体,您可以以时间序列分析、集成空间和时间模式分析以及强大的 2D 和 3D 可视化技术的形式,对时空数据进行可视化和分析。 可通过三种工具创建用于分析的时空立方体:通过聚合点创建时空立方体通过已定义位置创建时空立方体以及通过多维栅格图层创建时空立方体。 前两种工具通过生成时空立方图格(具有聚合事件点,或具有相关联时空属性的已定义要素),将时间戳要素构建成 netCDF 数据立方体。 第三种工具可将启用时间的多维栅格图层转换为时空立方体,并且不执行任何空间或时间聚合。

如果您希望时间戳点要素在空间上进行聚合,以便在整个研究区域的位置了解时空模式,请使用通过聚合点创建时空立方体工具。 这将会生成格网立方体(渔网或六边形),或由您提供的已定义位置构建的立方体作为聚合面。 在每个条柱内计算点,计算所有汇总字段统计数据并使用 Mann-Kendall 统计测量每个位置的跨时间的条柱值趋势。 使用渔网或六边形格网进行聚合时,将创建一个格网立方体。 使用一组已定义位置作为聚合面进行聚合时,将创建一个已定义位置立方体。 当点数据表示事件(例如犯罪或客户销售),并且您希望将这些事件分别聚合到表示警务区或销售区域的格网或一组面中时,通过聚合点创建时空立方体是最常见的做法。

如果要素位置不随时间变化,且会随着时间的推移采集属性或测量值(如面板数据或站点数据),请使用通过已定义位置创建时空立方体工具。 这将会生成使用这些已定义位置构建的立方体,其中每个时间段对应一组属性(如果未选择时间聚合),或者在所选择属性的每个时间段都具有汇总统计数据(如果选择了时间聚合)。 在已定义位置立方体的每个立方图格内计算该立方图格在该时间段内的所有观测值,计算变量汇总字段统计数据并使用 Mann-Kendall 统计测量每个位置的跨时间的立方图格值趋势。

如果您拥有多维栅格,且希望使用时空模式挖掘工具箱中的工具执行时空分析,请使用通过多维栅格图层创建时空立方体工具将多维栅格转换为时空立方体。 如果栅格像元是正方形(换句话说,它们在 x 和 y 中的像元大小相等),则输出时空立方体将是网格立方体,如果栅格像元是矩形,则输出时空立方体将是一个定义的位置立方体。 输出时空立方体将具有与多维栅格相同的空间和时态分辨率,此时每个维度的每个栅格像元都将转换为单个时空立方图格。 系统将使用 Mann-Kendall 统计来分析跨时间的值趋势。 本主题中的大多数信息不适用于此工具,因为时空立方体的结构将由多维栅格的结构进行定义且无法更改。

设置立方体的结构

多数情况下,您将了解如何定义立方体条柱维度,建议您考虑您要回答的特定问题所应采用的适合维度。 例如,如果您正在查看犯罪事件,您可能决定将点聚合到 400 米或 0.25 英里的条柱中,因为那是您城市街区的尺寸。 如果您有整整一年的数据,则可以决定查看每月或每周事件聚合的趋势。

格网立方体

立方体结构将具有行、列和时间步长。 如果将行数乘以列数和时间步长数,则将得到立方体中的条柱总数。 行和列可确定立方体的空间范围,而时间步长则可确定时态范围。

位置

已定义位置立方体

立方体结构将具有要素和时间步长。 如果将要素数乘以时间步长数,则将得到立方体中的条柱总数。 要素可确定立方体的空间范围,而时间步长则可确定时态范围。

多维栅格图层立方体

立方体结构将具有与多维栅格图层的像元和维度数量相同的要素和时间维度。

空间结构

格网立方体的空间默认值

在某些情况下,如果您对于将任何特定格网大小用于格网立方体没有强大的理由,则可将距离间隔参数留空并让工具计算默认值。

通过首先确定输入要素范围(最大范围)的最长边的距离来计算默认条柱距离。 条柱距离设置为最大范围除以 100 的值,或根据输入要素空间分布算法得出值中较大的一个。

已定义位置立方体的空间结构

已定义位置立方体的空间结构即为提供的位置。

多维栅格图层立方体的空间结构

立方体的空间结构由多维栅格图层的空间范围和分辨率进行定义。

时间结构

格网立方体的时间默认值

在某些情况下,如果您对于使用任何特定时间步长间隔没有强大的理由,则可将时间步长间隔参数留空并让工具计算默认值。 默认时间步长间隔基于用于确定时间步长间隔的最佳数量和宽度的两种不同算法。 这些算法的大于 10 的最低数值结果用于默认时间步长间隔数。 如果两个数值结果均小于 10,则 10 将变为默认时间步长间隔数。

已定义位置立方体的时间结构

您必须指定已定义位置立方体的时间结构。 例如,如果您每 5 年采集一次数据,则可在时间步长间隔参数中进行指定。

您也可以在已定义位置立方体中进行临时聚合。 例如,如果您的站点每 5 分钟记录一次湿度读数,则可能需要使用时间聚合将这些读数合并为每小时平均值。

如果选择了时间聚合,则可以通过对聚合到每个条柱中的要素数进行制图来评估聚合。 例如,如果您每 5 分钟采集一次数据,并将其聚合到每小时平均值,则您将在每个条柱中看到每小时聚合了 12 个要素。 如果您使用在 3D 模式下显示时空立方体工具对时间聚合计数立方体变量进行制图,并发现某些条柱的值小于 12,这表明一些湿度读数未显示。 这未必是问题,但是您有必要了解,其中一个传感器是否有问题,或者某个位置用于分析的数据是否有太多缺失。

多维栅格图层立方体的时间结构

立方体的时间结构由多维栅格图层的时间维度进行定义。

时间步长对齐

当创建没有时间聚合的已定义位置立方体时,唯一要考虑的是选择时间步长间隔时间步长对齐参考时间值(确保每个立方图格内仅有一条记录)。 时间偏差的问题是不存在的。

如果未进行聚合并希望每月创建一次时间步长间隔,而且由于采集程序,您的数据会落入第 1 个月到第 6 个月之间,则最佳做法是选择时间步长对齐参考时间选项,并选择可确保向前和向后 1 个月内每个数据点都包括在内的日期。 例如,如果存在 1 月 1 日、2 月 3 日、3 月 2 日、4 月 1 日和 5 月 3 日的数据,则应选择数据集中任意月份的首日作为参考时间,这样可确保所有数据正好包含在生成的立方体中。

将数据聚合到时空立方体中时,时间步长对齐是一个重要的参数,因为该参数决定了聚合的开始和结束位置。 请参阅以下示例:

时间步长对齐示例数据
上述图示表示了一个时间跨度从 2015 年 9 月 3 日到 2015 年 9 月 12 日的数据集。 您将使用此数据集来探究不同参数选项的影响。

结束时间

例如,如果将时间步长对齐结束时间值设置为 3 天的时间步长间隔,则分组将使用最后的数据点启动并以 3 天的时间增量向后开始聚合,直到所有数据点落在同一时间步长中为止。

通过数据集结束时间对齐进行聚合

要特别注意,根据所选的时间步长间隔值,可在立方体的开始处创建在其整个时间跨度中不具有数据的时间步长。 在上面的示例中,尽管 9/3 之前没有数据,9/1 和 9/2 仍被纳入到了第一个时间步长中。 这些空的日期是时间步长的一部分,但却不存在与其相关的数据。 这可能会使结果产生偏差,因为存在时间偏离的时间步长内的点将显著少于其他时间步长内的点,而这是聚合方案造成的人为结果。 报告指示第一个或最后一个时间步长中是否存在时间偏差。 在本例中,第一个时间步长中的三天中有两天不存在数据,所以时间偏差为 66%。

由于许多分析关注的是最近发生的事情,所以时间步长对齐的默认选项是结束时间,因此最好将此偏差放到立方体的开始位置。 另一个解决方案能够彻底去除时间偏差,可提供按时间步长间隔均匀分割的数据,因此时间段就不会出现偏差了。 要完成此操作,您可以创建一个数据选择集,其中排除落在您所希望的第一个时间段之外的点数据集。 在此示例中,选择 9/3 之后的所有数据即可解决该问题。 报告显示第一个和最后一个时间步长的时间跨度以及用于确定截止日期的信息。

另外要特别注意,在向后推移时间的过程中,如果最后的立方图格落在了作为起始点的第一个数据点上,则最后的数据点将不会被纳入到该立方图格中。 这是因为对于时间步长对齐结束时间值,每个立方图格都包括了给定立方图格中的最后日期,虽时间可向后推移却不会包括该立方图格中的第一个日期。 因此,在这种情况下,必须添加附加的立方图格以确保第一个数据点能够被纳入其中。

开始时间

例如,如果将时间步长对齐开始时间值设置为 3 天的时间步长间隔,则图格将使用第一个数据点启动并以 3 天的时间增量开始聚合,直到最后的数据点落在最后时间步长中为止。

通过数据集开始时间对齐进行聚合

有一些事情需要注意。 其中一项是针对基于所选时间步长间隔时间步长对齐开始时间值,可在时空立方体的结束处创建在其整个时间跨度中不具有数据的时间步长。 在上面的示例中,尽管 9/12 之后没有数据,9/13 和 9/14 仍被纳入到了最后一个时间步长中。 这些空的日期是时间步长的一部分,但却不存在与其相关的数据。 这可能会使结果产生偏差,因为存在时间偏离的时间步长内的点将显著少于其他时间步长内的点,而这是聚合方案造成的人为结果。 报告指示第一个或最后一个时间步长中是否存在时间偏差。 在本例中,最后一个时间步长中的三天中有两天不存在数据,所以时间偏差为 66%。 在选择开始时间 时间步长对齐时问题尤为严重,这是因为侧重于最近数据的分析会受到显著影响。 解决方案是提供由时间步长间隔均匀分割的数据,因此时间段就不会出现偏差了。 要完成此操作,您可以创建一个数据选择集,其中排除落在您所希望的最后一个时间段之外的点数据集。 在此示例中,选择 9/12 之前的所有数据即可解决该问题。 还可以从数据集的起点去掉两天,这也会使数据均匀分布到时间步长中。 报告显示第一个和最后一个时间步长的时间跨度以及用于确定截止日期的信息。

另外要特别注意,在向前推移时间的过程中,如果最后的时间步长落在了作为结束点的最后一个数据点上,则最后的数据点将不会被纳入到该立方图格中。 这是因为对于开始时间 时间步长对齐值,每个条柱都包括了给定条柱中的第一个日期,虽时间可向前推移却不会包括该条柱中的最后一个日期。 因此,在这种情况下,必须添加附加的立方图格以确保最后一个数据点能够被纳入其中。

参考时间

时间步长对齐参考时间值能够确保特定日期可对立方体中某一时间步长的开始或结束时间进行标记。

在选择落在数据集范围之后、位于最后的数据点或位于数据集中间的参考时间值时,会将其视为某一时间步长的最后一个数据点,所有其他位于任何一侧的立方图格将使用时间步长对齐进行创建,直到覆盖所有数据为止,如下图所示。

通过结束时间对齐使用参考时间

在选择落在数据集范围之前或位于第一个数据点的参考时间值时,会将其视为某一时间步长的第一个数据点,所有其他位于任何一侧的时间步长将使用时间步长对齐开始时间值进行创建,直到覆盖所有数据为止,如下图所示。

通过开始时间对齐使用参考时间

选择数据时态范围之前或之后的参考时间值可能会创建为空或部分为空的立方图格,这会对您的分析造成偏差。

格网立方体的模板立方体

注:

模板立方体无法与已定义位置立方体配合使用。 仅适用于格网立方体。

通过使用模板立方体值,您能够在分析不同的数据集时使用一致的空间范围和时间步长间隔值。 例如,您可以在获得了下一年的数据时,使用上一年的时空立方体作为模板立方体,这能够确保所使用的空间范围和时间步长间隔值的一致性,并同时使立方体得到扩展以覆盖新数据。 您也可以将一种事件类型的时空立方体用作分析另一种事件类型的模板立方体,从而确保对分析结果的比较是有效的。

选择使用模板立方体值可对时间步长对齐选项产生影响。 在选择一个落在输入要素时间跨度之前或之后的模板立方体值时,将使用模板立方体的时间步长对齐值添加时间步长,直到时间步长覆盖所有数据为止。 所得的时空立方体将在模板立方体值与输入要素在时间上不重叠的位置存在空立方体。 这会对您的分析结果造成偏差。 如果模板立方体与输入要素重叠,所得的时空立方体将覆盖模板立方体的时态范围,并使用模板立方体的时间步长对齐进行扩展,直到覆盖所有输入要素为止。 下图以蓝色显示模板立方体,而以橙色显示所得的时空立方体。

模板立方体示例

要特别注意,在使用模板立方体选项创建时空立方体时,模板立方体的时态范围将得到扩展,直到覆盖所有数据为止。 这样您便可以使用上一年的立方体,来创建包括上年数据和本年数据的立方体。 将采取其他方式处理模板立方体的空间范围。 不会对落在模板立方体的空间范围之外的任何数据进行分析。 模板立方体和所得的时空立方体将拥有相同的空间范围。 如果在创建模板立方体时出现了不应出现的新要素,则只能在空间范围内出现变化,其中空间范围内之前没有数据的位置会出现数据。

属性

聚合点

通过聚合点创建立方体时,不管是格网立方体还是已定义位置立方体,都将始终计算指定每个立方图格中点数的 COUNT 字段。 除了 COUNT 字段之外,您还可以汇总每个立方图格中的属性。 可以指定多项统计和字段组合。 空值将被排除在所有统计计算之外。 如果选择汇总字段,则每个位置在各时间步长处的每个属性都必须有值。 可以通过填充空条柱参数来选择工具填充空条柱的方法(由于空条柱没有点,因此没有任何属性值)。 可以使用多个选项,并且可针对要汇总的各字段选择不同的填充类型。 任何无法根据估算条件进行填充的立方图格都将导致整个位置从分析中排除。 使用空间相邻要素的平均值至少需要 4 个相邻要素来填充空条柱,使用时间空间相邻要素的平均值至少需要 13 个相邻要素来填充空条柱。

已定义位置

根据没有时间聚合的已定义位置来创建立方体时,如果数据集中特定时间段内有空值或缺少要素,并且您不想删除这些位置,则可以从数据中选择要包含在立方体中的变量,并选择最合适的填充空条柱选项。

根据包含时间聚合的已定义位置来创建立方体时,必须选择要包含在生成的立方体中的汇总字段以及将用于对其进行汇总的统计类型。 由于每个位置在各时间步长处都必须有值,除了选择统计类型外,还必须选择通过填充空条柱参数完成时间序列的方式。 可以使用多个选项,并且可针对要汇总的各字段选择不同的填充类型。

统计类型(已定义位置和聚合点立方体)

可用统计类型如下:

  • SUM - 添加每个立方图格中指定字段的合计值
  • MEAN - 计算每个立方图格中指定字段的平均值
  • MIN - 查找每个立方图格中指定字段所有记录的最小值
  • MAX - 查找每个立方图格中指定字段所有记录的最大值
  • STD - 查找每个立方图格中指定字段的值的标准差
  • MEDIAN - 查找每个立方图格中指定字段所有记录的中值

警告:

任何汇总字段中出现的空值都将导致从分析中排除这些要素。 如果每个立方图格中的点数均为分析策略的一部分,需要考虑创建单独的立方体,针对计数(不含汇总字段)创建一个,并针对汇总字段创建一个。 如果每个汇总字段的空值集不相同,需要考虑为每个汇总字段创建一个单独的立方体。

填充空条柱(适用于所有立方体)

可用填充类型如下:

  • - 用零填充空立方图格。
  • 空间相邻要素 - 使用空间相邻要素平均值填充空立方图格。
  • 时空相邻要素 - 用时空相邻要素平均值填充空立方图格
  • 时间趋势 - 使用一元样条插值算法填充空立方图格

另外,如果使用通过已定义位置创建时空立方体工具,则对于没有完整时间序列的情况,可以使用另一选项放置位置,而非使用上述选项之一进行填充。

解释结果

消息

除了 netCDF 文件以外,在工具执行过程中汇总了时空立方体维度和内容的消息还将出现在地理处理窗格底部。 可将鼠标悬停在进度条上、单击弹出按钮 弹出 或展开地理处理窗格中的消息部分来访问消息。 您还可以通过地理处理历史访问之前运行工具的消息。

对于格网立方体来说,只有包含至少一个时间步长间隔的数据的位置才会被包括在分析中,但这些位置将在所有时间步长中进行分析。 在格网立方体中计算点计数时,对于任何没有点的立方图格假设计数为零,但关联的位置在至少一个时间步长间隔内具有至少一个点。 如果位置具有至少一个时间步长间隔的数据,则与位置相关的零的百分比信息将被在消息中报告为稀少。

对于已定义位置来说,任何具有完整时间序列的位置,即使其时间序列全由零构成,也将包含在已定义位置立方体中。 如果将点聚合到已定义位置,则这一点尤其重要。

输出消息的末尾具有总体数据趋势信息。 此趋势基于非时空序列分析。 其所回答的问题为:随着时间的推移,输入所表示的事件在总体上有所增加还是有所减少? 要获得答案,可使用 Mann-Kendall 统计将每个时间步长间隔中的所有位置作为时间序列进行分析。

趋势分析

在每个带有数据的位置上,将 Mann-Kendall 趋势测试作为独立的条柱时间序列测试加以执行。 Mann-Kendall 统计是条柱计数或值及其时间序列的等级相关分析。 将第一个时间段的条柱值与第二个时间段的条柱值进行比较。 如果前者小于后者,则结果为 +1。如果前者大于后者,则结果为 -1。如果二者相等,则结果为 0。 对每对时间段的比较结果进行求和。 预期的总和为 0,表示随着时间的推移,值中不存在趋势。 基于立方图格时间序列中值的方差,将关联数、时间段数、观察的总和与预期总和 (0) 进行比较,以确定差异是否具有统计显著性。 每个条柱时间序列的趋势将被记录为 z 得分和 p 值。 小 p 值表示趋势具有统计显著性。 与 z 得分相关联的符号可确定趋势是条柱值增加(正 z 得分)还是条柱值减少(负 z 得分)。 对趋势结果进行可视化的策略将在可视化时空立方体中进行提供。

时空立方体数据结构

可视化

可以使用实用工具工具集中的工具或通过下载时空立方体资源管理器,以 2D 或 3D 模式对空间立方体数据进行可视化。 您可通过“时空立方体资源管理器”快速可视化和探索 3D 时空模式挖掘分析结果。 此加载项将时空立方体作为输入,并创建可通过多种方法进行显示的图层。 多种显示选项可用,并且所有选项都具有预设的符号系统以及范围和时间滑块,使得时空立方体的浏览和结果分析更加直观。 您可以从 www.esriurl.com/SpaceTimeCubeExplorer 下载该加载项。 时空立方体的三维可视化也可显示为 web 场景并在 Story Maps 中共享。

其他资源

时空立方体的创建、可视化和分析将利用由 UCAR/Unidata 开发的 netCDF 软件。 了解有关 Unidata 和网络公用数据格式 (NetCDF) 工程的详细信息

有关直方图条柱宽度优化的信息,请参阅以下内容:

  • Shimazaki H. and S. Shinomoto, "A method for selecting the bin size of a time histogram," Neural Computation Vol. 19(6), (2007): 1503–1527.
  • Terrell, G. and D. Scott, "Oversmoothed Nonparametric Density Estimates," Journal of the American Statistical Association Vol. 80(389), (1985): 209-214.
  • Online Statistics Education: A Multimedia Course of Study (http://onlinestatbook.com/). 项目主管:David M. Lane,莱斯大学(第 2 章,"Graphing Distributions, Histograms")。

有关 Mann-Kendall 趋势测试的信息,请参阅以下内容:

  • Hamed, K. H., "Exact distribution of the Mann-Kendall trend test statistic for persistent data," Journal of Hydrology (2009): 86–94.
  • Kendall, M. G. and J. D. Gibbons, Rank correlation methods, fifth ed., (1990) Griffin, London.
  • Mann, H. B., "Nonparametric tests against trend," Econometrica Vol. 13, (1945): 245–259.