Сокращение дублирующихся объектов в данных

Базовые данные можно форматировать так, чтобы он содержали дублирующиеся объекты, представляющие одно и то же местоположение, но с различными атрибутами, и, таким образом, создать локатор, поддерживающий альтернативные названия. Это показывается в следующих данных, в которых 12725 Yosemite Blvd, Waterford и 12725 CA-132, Waterford имеют одинаковую геометрию, но разные значения в поле FullStreetName.

Таблица атрибутов PointAddress с дублирующимися объектами с разными названиями для одного местоположения

Для создания локатора, поддерживающего альтернативные названия объектов, рекомендуется добавить альтернативные названия в таблицу и использовать роль таблицы альтернативных названий, соответствующую основной роли локатора. Однако если в базовых данных существуют дублирующиеся объекты, могут быть созданы альтернативные значения, а повторяющиеся геометрические фигуры будут исключены при построении локатора с помощью инструмента Создать локатор. Для удаления дублирующейся геометрии основные базовые данные должны содержать поле с ID, соединяющим дублирующиеся объекты в одном местоположении. Это поле ID должно быть сопоставлено с полем ID объекта из роли локатора, например POINT_ADDRESS_ID. Это сокращает размер локатора и удаляет избыточных связанных кандидатов из результатов геокодирования.

Таблица атрибутов PointAddress с полем POINT_ADDRESS_ID для связи дублирующихся объектов в одном местоположении

Если основные базовые данные содержат дублирующиеся объекты с разными значениями названий улиц и вы хотите указать, какое название улицы является первичным, базовые данные должны иметь поле, содержащее флаг, указывающий, какое имя улицы будет первичным именем, возвращаемым при геокодировании. Это поле должно быть сопоставлено с полем Индикатор названия основной улицы из роли локатора, например PrimaryStreetFlag. Если ID объекта сопоставлен, Индикатор названия основной улицы используется для определения предпочитаемого названия улицы объектов с тем же ID объекта. Если ID объекта не сопоставлен, каждое название улицы из основных базовых данных помечается как Первичное, поскольку дедупликация не работает, и каждое название улицы сохраняется независимо.

Таблица атрибутов класса объектов с ID объекта и Индикатором названия основной улицы

Инструмент Создать локатор использует значения, сопоставленные с полем ID объекта, для пропуска всей дублирующейся геометрии, исключая первую встретившуюся геометрию, которая сохраняется в локаторе. Альтернативные значения атрибутов создаются на основании сопоставленных ID дублирующихся объектов.

Поле POINT_ADDRESS_ID, назначенное полю ID роли локатора идентификатора объекта в инструменте Создать локатор

Примечание:

Если в базовые данные не входит поле ID, его можно добавить при помощи инструмента Найти идентичные. Поле Shape можно использовать для поиска повторений в основных базовых данных, исходя из предположения, что они содержат одинаковую геометрию. Дубликаты могут встречаться в базовых данных, когда два отдельных адреса или места интереса (POI) находятся в одном и том же местоположении, что может быть проблематичным. Эта процедура не работает во всех случаях. Если поле Shape используется в инструменте Найти идентичные, выходная таблица будет содержать идентичные ID для дублирующихся объектов. Затем его можно объединить с основными базовыми данными и использовать для построения локатора, назначив новое поле ID полю Feature ID роли локатора в инструменте Создать локатор.

Если вы хотите использовать в качестве основных базовых данных класс точечных объектов, содержащий 13 миллионов объектов, где 10 миллионов являются уникальными объектами, сопоставление поля ID объекта активирует функциональность удаления дублирующейся геометрии в инструменте Создать локатор. В итоге размер локатора сократится с 253 MB до 200 MB.