深度学习简介—ArcGIS Pro

数十年来，机器学习工具一直是 GIS 空间分析的核心组件。您已经能够在 ArcGIS 中使用机器学习来执行图像分类、通过聚类来丰富数据或对空间关系进行建模。机器学习是人工智能的一个分支，将在机器学习中使用算法来处理结构化数据以解决问题。传统结构化数据需要用户标记数据，例如猫和狗的图片，以便能够在算法中理解每种动物类型的特定要素，然后在其他图片中识别这些动物。

深度学习是机器学习的子集，它以神经网络的形式使用多层算法。通过不同的网络层来分析输入数据，每一层都定义数据中的特定要素和模式。例如，如果您希望识别诸如建筑物和道路等要素，则可以使用不同建筑物和道路的图像来训练深度学习模型，通过神经网络内的层来处理图像，然后找到对建筑物或道路进行分类所需的标识符。

Esri 开发了工具和工作流，以利用深度学习中的最新创新来回答 GIS 和遥感应用程序中的一些难题。计算机视觉或者计算机从数字图像或视频中获取理解的能力这一领域已经从传统机器学习算法转变为深度学习方法。在 ArcGIS Pro 中将深度学习应用于影像之前，了解深度学习在计算机视觉中的不同应用非常重要。

深度学习在计算机视觉中的应用

可以使用深度学习神经网络完成许多计算机视觉任务。 Esri 开发了一些工具，用于执行图像分类、对象检测、语义分割和实例分割。以下介绍了所有这些计算机视觉任务，每个任务均包含一个遥感示例和一个更通用的计算机视觉示例。

影像分类

图像分类涉及为数字图像分配标注或类。例如，可能会将左下方的无人机图像标记为人群，而将右侧数码照片标记为猫。这种类型的分类也称为对象分类或图像识别，可以在 GIS 中用于对图像中的要素进行分类。

对象检测

对象检测是在图像中定位要素的过程。例如，在以下遥感图像中，神经网络找到了飞机的位置。在更通用的计算机视觉用例中，模型可能能够检测不同动物的位置。此过程通常涉及在感兴趣要素周围绘制一个边界框。可以在 GIS 中使用它来定位卫星、航空或无人机影像中的特定要素并在地图上绘制这些要素。

语义分割

当图像中的每个像素被归为一类时，将会进行语义分割。例如，在左下方图像中，道路像素与非道路像素分别进行了分类。在右侧，照片中构成猫的像素将分类为猫，而图像中的其他像素则属于其他类别。在 GIS 中，这通常被称为像素分类、图像分割或图像分类。它通常用于创建土地利用分类地图。

实例分割

实例分割是一种更加精确的对象检测方法，将在其中绘制每个对象实例的边界。例如，在左下方的影像中，将检测房屋的屋顶，包括屋顶形状的精确轮廓。在右侧，将检测到小型汽车，您可以看到小型汽车的清晰形状。这种类型的深度学习应用程序也称为对象分割。

全景分割

全景分割结合了语义分割和实例分割。例如，下图显示所有像均已素分类，每个唯一的对象，例如每辆车，都是其自身唯一的对象。

影像转换

影像转换是将影像从场景的一种可能表达或样式转换为另一种（例如降噪或超分辨率）的任务。例如，左下方的影像显示的是原始低分辨率影像，而右侧的影像显示使用超分辨率模型的结果。这种类型的深度学习应用程序也称为影像到影像的转换。

变化检测

变化检测深度学习任务可以检测两个日期之间感兴趣要素的变更，并生成变化的逻辑图。例如，左下方的影像显示的是五年前的房产开发，中间的影像显示的是如今同一开发，右图显示的是逻辑变化图，其中新房屋显示为白色。