Numerical Python (NumPy) 是用于在 Python 中进行科学计算(包括支持功能强大的多维数组对象)的基础包。NumPy 用于执行复杂的数学运算,并且从 9.2 版本开始已成为 ArcGIS 软件安装的一部分。有关详细信息,请参阅 NumPy 网站。
Python NumPy 数组专用于处理大型数组。很多现有 Python 函数都是为了处理 NumPy 数组而创建的,NumPy 数组是包含在 Python 的 SciPy 科学计算包中的最著名数组。
使用表和要素数据
表和要素类可以使用数据访问 (arcpy.da) 模块中的函数转换为 NumPy 数组,也可以使用同样的函数从这些数组反向转换。
要将 NumPy 数组转换为表和要素类,数组必须为结构化数组。结构化数组包括用来在 ArcGIS 表和要素类中将数据映射至字段的多个字段(或结构体)。有关结构化数组的详细信息,请参阅结构化数组。
创建结构化 NumPy 数组。
import numpy
arr = numpy.array([(471316.383, 5000448.782), (470402.493, 5000049.216)],
numpy.dtype([('X', '>f8'),('Y', '>f8')]))
一经创建,结构化 NumPy 数组即可转换为要素类或表。
将 NumPy 数组转换为地理数据库要素类。
import arcpy import numpy
out_fc = 'C:/data/texas.gdb/fd/pointlocations'
# Create a numpy array with an id field, and a field with a tuple
# of x,y coordinates arr = numpy.array([(1, (471316.3835861763, 5000448.782036674)), (2, (470402.49348005146, 5000049.216449278))], numpy.dtype([('idfield', numpy.int32),('XY', '<f8', 2)]))
# Define a spatial reference for the output feature class spatial_ref = arcpy.Describe('C:/data/texas.gdb/fd').spatialReference
# Export the numpy array to a feature class using the XY field to
# represent the output point feature arcpy.da.NumPyArrayToFeatureClass(arr, out_fc, ['XY'], spatial_ref)
用于处理表和要素数据的 arcpy.da 函数
函数 | 说明 |
---|---|
ExtendTable | 基于公用属性字段将 NumPy 结构化数组的内容连接到表。 |
FeatureClassToNumPyArray | 将要素类转换为 NumPy 结构化数组。 |
NumPyArrayToFeatureClass | 将 NumPy 结构化数组转换为要素类。 |
NumPyArrayToTable | 将 NumPy 结构化数组转换为表。 |
TableToNumPyArray | 将表转换为 NumPy 结构化数组。 |
NumPy 数组中的整型字段不支持空值。如果使用 FeatureClassToNumPyArray 或 TableToNumPyArray 转换的数据包含空值,系统会完全跳过包含空值的行,或使用替代值将其掩膜。
跳过所有包含空值的记录。
arr = arcpy.da.FeatureClassToNumPyArray(fc, fields, skip_nulls=True)
使用字典掩膜拥有不同值的整型字段中的每个 None。
fields = ['field1', 'field2'] arcpy.da.FeatureClassToNumPyArray(fc, fields, null_value=-9999)
类型转换
创建数组的 dtype 取决于输入表的字段类型或要素类。
字段类型 | NumPy dtype |
---|---|
Single | numpy.float32 |
Double | numpy.float64 |
SmallInteger | numpy.int32 |
Integer | numpy.int32 |
OID | numpy.int32 |
GUID | <U64 |
String | <u1、<u10 等 |
Date | <M8[us] |
注:
字符串字段转换为数组后,宽度保持不变。例如,宽度为 20 的字符串字段转换为数组后,dtype 为 <u20。
不支持以上未列出的其他字段类型,包括栅格和 BLOB 字段。同样不支持几何字段,但可以使用下面列出的特殊令牌将多个几何属性添加到数组中。
令牌 | 说明 |
---|---|
SHAPE@XY | 一组要素的质心 x,y 坐标。 |
SHAPE@XYZ | 一组要素的质心 x,y,z 坐标。 |
SHAPE@TRUECENTROID | 一组要素的质心 x,y 坐标。这会返回与 SHAPE@XY 相同的值。 |
SHAPE@X | 要素的双精度 x 坐标。 |
SHAPE@Y | 要素的双精度 y 坐标。 |
SHAPE@Z | 要素的双精度 z 坐标。 |
SHAPE@M | 要素的双精度 m 值。 |
SHAPE@JSON | 表示几何的 Esri JSON 字符串。 |
SHAPE@WKB | OGC 几何的熟知二进制 (WKB) 制图表达。该存储类型将几何值表示为不间断的字节流形式。 |
SHAPE@WKT | OGC 几何的熟知文本 (WKT) 制图表达。其将几何值表示为文本字符串。 |
SHAPE@AREA | 要素的双精度面积。 |
SHAPE@LENGTH | 要素的双精度长度。 |
OID@ | “对象 ID”字段的值。 |
内存注意事项
如果数组需要的内存大于可用内存,则该数组将因 MemoryError 异常而失败。
要避免 MemoryError 例外,请遵循以下提示:
- 使用后删除数组对象;删除数组会释放内存。
- 仅使用需要的字段,尤其对于文本字段;将文本字段转换为数组后,每个字符宽度将占用 4 个字节。例如,宽度为 100 的字符串字段将在内存中为数组中的每个值占用 400 个字节。
NumPy dtype | 每个值的字节数 |
---|---|
<U1 | 4 |
numpy.int32 | 4 |
numpy.float32 | 4 |
numpy.float64 | 8 |
注:
numpy.nbytes 将返回 dtype 的字典和字节数。
处理栅格
可使用 ArcPy 函数 RasterToNumPyArray 和 NumPyArrayToRaster 在栅格和 NumPy 数组之间进行转换。您可能想要将 ArcGIS 栅格转换为 NumPy 数组以执行以下操作:
- 执行可以应用到 NumPy 数组上的许多现有 Python 函数中的一个(例如,对数据运行过滤器、执行多维分析或使用优化例程)。
- 通过访问 NumPy 数组中的各个像元来开发自定义函数(例如,执行邻域记数法、更改各个像元值或者对整个栅格运行累积运算符)。
用于处理栅格的 arcpy 函数
函数 | 说明 |
---|---|
RasterToNumPyArray | 将栅格转换为 NumPy 数组。 |
NumPyArrayToRaster | 将 NumPy 数组转换为栅格。 |
将栅格数据转换为 NumPy 数组旨在计算整个栅格行中的像元值的百分比。然后,将会创建一个新的栅格数据。
import arcpy
import numpy
my_array = arcpy.RasterToNumPyArray('C:/data/inRaster')
my_array_sum = my_array.sum(1)
my_array_sum.shape = (my_array.shape[0], 1)
my_array_perc = (my_array * 1.0) / my_array_sum
new_raster = arcpy.NumPyArrayToRaster(my_array_perc)
new_raster.save("C:/output/fgdb.gdb/PercentRaster")