使用游标访问数据

游标是一个数据访问对象,用于在表中的各个行上进行迭代或在表中插入新行。 游标有三种形式:搜索、插入和更新。 游标通常用于读取现有几何写入新几何

每种类型的游标均由对应的 ArcPy 函数(SearchCursorInsertCursorUpdateCursor)在表、表格视图、要素类或要素图层上创建而成。 可以使用搜索游标来检索行。 更新游标可用于更新和删除行,而插入游标用于在表或要素类中插入行。

游标说明

arcpy.da.InsertCursor(in_table, field_names)

插入行

arcpy.da.SearchCursor(in_table, field_names, {where_clause}, {spatial_reference}, {explode_to_points}, {sql_clause})

只读访问

arcpy.da.UpdateCursor(in_table, field_names, {where_clause}, {spatial_reference}, {explode_to_points}, {sql_clause})

更新或删除行

数据访问游标函数 (arcpy.da)
旧版本:

ArcGIS 10.1 中添加了一个数据访问模块 (arcpy.da)。 原始游标仍受支持;但是,新的 arcpy.da 游标的性能要快得多。 大多数情况下,帮助文档会对 arcpy.da 游标的使用进行说明。 有关经典游标模型的详细信息,请参阅 InsertCursorSearchCursorUpdateCursor 主题。

注:

游标支持图层和表格视图定义查询和选择。 游标对象仅包含地理处理工具在操作中会使用的行。

游标只能向前导航;不支持备份和检索已进行检索的行。 如果脚本需要多次遍历数据,则可能会调用游标的 reset 方法。

使用 for 循环可迭代搜索或更新游标。 同样,可通过显式使用 next 方法返回下一行以进行访问。 如果要使用游标的 next 方法来检索行数为 N 的表中的所有行,则脚本必须调用 next N 次。 在检索完结果集中的最后一行后调用 next 将返回 StopIteration 异常。

import arcpy

cursor = arcpy.da.SearchCursor(fc, ['fieldA', 'fieldB'])
for row in cursor:
    print(row)

搜索和更新游标同样支持 with 语句。

import arcpy

with arcpy.da.SearchCursor(fc, ['fieldA', 'fieldB']) as cursor:
    for row in cursor:
        print(row)

从表中检索的每一行都以字段值列表的形式返回。 会按照提供给游标的 field_names 参数的相同顺序返回这些值。 游标的 fields 属性也可用于确定字段值的顺序。

游标对象

SearchCursorUpdateCursorInsertCursor 能够创建可用于遍历记录的游标对象。 多个游标函数创建的游标对象方法可能因所创创建的游标类型而有所不同。

下表显示了各个游标类型支持的方法:

游标类型方法

arcpy.da.SearchCursor

reset - 将游标重置到起始位置。

arcpy.da.InsertCursor

insertRow - 向表中插入一行。

arcpy.da.UpdateCursor

updateRow - 更新当前行。

deleteRow - 从表中删除行。

reset - 将游标重置到起始位置。

insertRow

插入游标用于创建行并插入它们。 创建游标后,insertRow 方法用于插入一组值,这些值会组成新行。 表中任何不包含在游标中的字段都将被分配字段的默认值。

import arcpy

# Create insert cursor for table
cursor = arcpy.da.InsertCursor("c:/base/data.gdb/roads_lut", 
                               ["roadID", "distance"])

# Create 25 new rows. Set the initial row ID and distance values
for i in range(0,25):
    cursor.insertRow([i, 100])

updateRow

updateRow 方法用于对更新游标当前所在位置的行进行更新。 从游标对象返回行后,可以根据需要对行进行修改,然后调用 updateRow 传入修改后的行。

import arcpy

# Create update cursor for feature class
with arcpy.da.UpdateCursor("c:/base/data.gdb/roads",
                           ["roadtype", "distance"]) as cursor:
    for row in cursor:
        # Update the values in the distance field by multiplying 
        #   the roadtype by 100. Road type is either 1, 2, 3 or 4.
        row[1] = row[0] * 100
        cursor.updateRow(row)

deleteRow

deleteRow 方法用于对更新游标当前所在位置的行进行删除。 提取行后,可在游标上调用 deleteRow 来删除行。

import arcpy

# Create update cursor for feature class
with arcpy.da.UpdateCursor("c:/base/data.gdb/roads", 
                          ["roadtype"]) as cursor:
    # Delete all rows that have a roads type of 4
    for row in cursor:
        if row[0] == 4:
            cursor.deleteRow()

访问和设置字段值

对于每个游标,所使用的字段值由字段名的列表(或元祖)提供。 当从游标中返回行时,将以对应于索引位置的一组字段值的形式返回该行。

在下方示例中,将按位置访问州名称和人口计数。

import arcpy

fc = "c:/base/data.gdb/USA/States"

# Use SearchCursor to access state name and the population count
with arcpy.da.SearchCursor(fc, ['STATE_NAME', 'POP2000']) as cursor:
    for row in cursor:
        # Access and print the row values by index position.
        #   state name: row[0]
        #   population: row[1]
        print('{} has a population of {}'.format(row[0], row[1]))
提示:

尽管使用星号 (*) 可访问所有字段,但通常不建议这样做。 指定的字段越多,游标的执行速度越慢。 只列出要使用的字段会改善游标整体效率。

令牌也可以替代字段名称以作为快捷键。 所有的表都包括一个对象 ID 字段,该字段可能具有许多名称,具体取决于数据类型。 简单要素类需要一个通常(但不总是)名为 Shape 的几何字段。 OID@ 令牌可用于访问对象 ID 字段,SHAPE@ 令牌(返回几何对象)则可用于访问要素类几何字段,而无需提前了解字段名称。

多点要素类上的 SearchCursor
import arcpy

infc = arcpy.GetParameterAsText(0)

# Enter for loop for each feature
for row in arcpy.da.SearchCursor(infc, ["OID@", "SHAPE@"]):
    # Print the current multipoint's ID
    print("Feature {}:".format(row[0]))

    # For each point in the multipoint feature,
    #  print the x,y coordinates
    for pnt in row[1]:
        print("{}, {}".format(pnt.X, pnt.Y))

可以使用其他几何令牌访问特定几何信息。 访问完整几何往往更加耗时。 如果仅需要几何的特定属性,可以使用令牌以提供访问几何属性的快捷方式。 例如,SHAPE@XY 将返回一组代表要素质心的 x,y 坐标。

关于一些特定字段类型的详细信息如下所示。

全局标识符字段

全局 ID 和 GUID 字段类型可存储注册表样式的字符串,该字符串包含用大括号括起来的 36 个字符。 这些字符串用于唯一识别单个地理数据库中和跨多个地理数据库的要素或表行。

在游标中,GUID 字段可以接受字符串和通用唯一标识符 (UUID) 值。 当读取全局 ID 和 GUID 字段时,将返回字符串。

使用 UUID 值添加包含 GUID 字段的记录。

import arcpy
import uuid

ic = arcpy.da.InsertCursor('a', ['guid_field'])
id = uuid.uuid1()
ic.insertRow([id])

使用字符串添加包含 GUID 字段的记录。

import arcpy

ic = arcpy.da.InsertCursor('a', ['date_field'])
id = '0345e170-2614-11eb-812d-f8b156b0d357'
ic.insertRow([id])

日期字段

日期字段可存储日期、时间或同时存储日期和时间。

在游标中,日期字段可以接受 datetime 对象或字符串值。 当读取日期字段时,返回 datetime 对象。

使用 datetime 对象添加包含日期字段的记录。

import arcpy
from datetime import datetime

ic = arcpy.da.InsertCursor('a', ['date_field'])
date_value = datetime(2020, 7, 1, 12, 30)
ic.insertRow([date_value])

使用字符串值添加包含日期字段的记录。

import arcpy

ic = arcpy.da.InsertCursor('a', ['date_field'])
date_value = "July 1 2020 12:30)
ic.insertRow([date_value])

BLOB 字段

二进制大对象 (BLOB) 是一种存储为长度较长的一系列二进制数的数据。 ArcGIS 会将注记和尺寸存储为 BLOB,图像、多媒体或编码的位等项也可存储在此类型的字段中。 您可以使用游标加载或查看 BLOB 字段的内容。

在游标中,BLOB 字段可以接受字符串、bytes 对象和 memoryview 对象。 当读取 BLOB 字段时,返回 memoryview 对象。

使用 .png 文件添加包含 BLOB 字段的记录。

import arcpy

data = open("c:/images/image1.png", "rb").read()
ic = arcpy.da.InsertCursor("c:/data/fgdb.gdb/fc", ['imageblob'])
ic.insertRow([data])

将 BLOB 字段读取为 memoryview 对象并写入 .png 文件。

import arcpy

sc = arcpy.da.SearchCursor("c:/data/fgdb.gdb/fc", ["imageblob"])
memview = sc.next()[0]
open("c:/images/image1_copy.png", "wb").write(memview.tobytes())

游标和锁定

插入和更新游标支持 ArcGIS 应用程序设置的表格锁。 锁可以防止多个进程同时更改同一个表。 锁两种类型:共享和排他,如下所示:

  • 只要访问表或数据集就会应用共享锁。 同一表中可以存在多个共享锁,但存在共享锁时,将不允许存在排他锁。 显示要素类和预览表是应用共享锁的示例。
  • 对表或要素类进行更改时,将应用排他锁。 在 ArcGIS 中应用排他锁的示例包括:在地图中编辑和保存要素类;更改表的方案;或者在 Python IDE 中在要素类上使用插入游标。

如果数据集上存在排他锁,则无法为表或要素类创建更新和插入游标。 UpdateCursorInsertCursor 函数会因数据集上存在排他锁而失败。 如果这些函数成功地创建了游标,它们将在数据集上应用排他锁,从而使两个脚本无法在同一数据集上创建更新和插入游标。

游标支持 with 语句以重置迭代并帮助移除锁。 但是,为了防止锁定所有内容,应考虑使用 del 语句来删除对象或将游标包含在函数中以使游标对象位于作用范围之外。

编辑会话将在其会话期间对数据应用共享锁。 保存编辑内容时将应用排他锁。 已经存在排他锁时,数据集是不可编辑的。