深度学习简介

获得 Image Analyst 许可后可用。

数十年来,机器学习工具一直是 GIS 空间分析的核心组件。您已经能够在 ArcGIS 中使用机器学习来执行图像分类、通过聚类来丰富数据或对空间关系进行建模。机器学习是人工智能的一个分支,将在机器学习中使用算法来处理结构化数据以解决问题。传统结构化数据需要用户标记数据,例如猫和狗的图片,以便能够在算法中理解每种动物类型的特定要素,然后在其他图片中识别这些动物。

深度学习是机器学习的子集,它以神经网络的形式使用多层算法。通过不同的网络层来分析输入数据,每一层都定义数据中的特定要素和模式。例如,如果您希望识别诸如建筑物和道路等要素,则将使用不同建筑物和道路的图像来训练深度学习模型,通过神经网络内的层来处理图像,然后找到对建筑物或道路进行分类所需的标识符。

Esri 开发了工具和工作流,以利用深度学习中的最新创新来回答 GIS 和遥感应用程序中的一些难题。计算机视觉或者计算机从数字图像或视频中获取理解的能力这一领域已经从传统机器学习算法转变为深度学习方法。在 ArcGIS Pro 中将深度学习应用于影像之前,了解深度学习在计算机视觉中的不同应用非常重要。

深度学习在计算机视觉中的应用

可以使用深度学习神经网络完成许多计算机视觉任务。Esri 开发了一些工具,用于执行图像分类、对象检测、语义分割和实例分割。以下介绍了所有这些计算机视觉任务,每个任务均包含一个遥感示例和一个更通用的计算机视觉示例。

计算机视觉中的图像分类

图像分类涉及为整个数字图像分配标注或类。例如,可能会将左上方的无人机图像标记为人群,而将右侧数码照片标记为猫。这种类型的分类也称为对象分类或图像识别,可以在 GIS 中用于对图像中的要素进行分类。在 ArcGIS Pro 中,可以通过使用深度学习分类对象工具完成此过程。

计算机视觉中的目标检测

对象检测是在图像中定位要素的过程。例如,在以上遥感图像中,神经网络找到了飞机的位置。在更通用的计算机视觉用例中,模型可能能够检测不同动物的位置。此过程通常涉及在感兴趣要素周围绘制一个边界框,然后可以在 GIS 中使用它来定位卫星、航空或无人机影像中的特定要素并在地图上绘制这些要素。在 ArcGIS Pro 中,可以通过使用深度学习检测对象工具来检测图像中的对象。

计算机视觉中的语义分割

当图像中的每个像素被归为一类时,将会进行语义分割。例如,在左上方图像中,道路像素与非道路像素分别进行了分类。在右侧,照片中构成猫的像素将分类为猫,而图像中的其他像素则属于其他类别。在 GIS 中,这通常称为像素分类、图像分割或图像分类,通常用于创建土地利用分类地图。在 ArcGIS Pro 中,可以通过使用深度学习对像素进行分类工具进行语义分割。

计算机视觉中的实例分割

实例分割是一种更加精确的对象检测方法,将在其中绘制每个对象实例的边界。这种类型的深度学习应用程序也称为对象分割。

ArcGIS Pro 中的深度学习

有关如何在 ArcGIS Pro 中执行深度学习的详细信息,请参阅 ArcGIS Pro 中的深度学习

有关可用于深度学习的地理处理工具的列表,请参阅深度学习工具集概览

相关主题