Сокращение дублирующихся объектов в данных

Базовые данные можно форматировать так, чтобы он содержали дублирующиеся объекты, представляющие одно и то же местоположение, но с различными атрибутами, и, таким образом, создать локатор, поддерживающий альтернативные названия. Это показывается в следующих данных, в которых 12725 Yosemite Blvd, Waterford и 12725 CA-132, Waterford имеют одинаковую геометрию, но разные значения в поле FullStreetName.

Таблица атрибутов PointAddress с дублирующимися объектами с разными названиями для одного местоположения

Для создания локатора, поддерживающего альтернативные названия объектов, рекомендуется добавить альтернативные названия в таблицу и использовать роль таблицы альтернативных названий, соответствующую основной роли локатора. Однако если в базовых данных существуют дублирующиеся объекты, могут быть созданы альтернативные значения, а повторяющиеся геометрические фигуры будут исключены при построении локатора с помощью инструмента Создать локатор. Для удаления дублирующейся геометрии основные базовые данные должны содержать поле с ID, соединяющим дублирующиеся объекты в одном местоположении. Это поле ID должно быть сопоставлено с полем ID объекта из роли локатора, например POINT_ADDRESS_ID. Это сокращает размер локатора и удаляет избыточных связанных кандидатов из результатов геокодирования.

Таблица атрибутов PointAddress с полем POINT_ADDRESS_ID для связи дублирующихся объектов в одном местоположении

Инструмент Создать локатор использует значения, сопоставленные с полем ID объекта, для пропуска всей дублирующейся геометрии, исключая первую встретившуюся геометрию, которая сохраняется в локаторе. Альтернативные значения атрибутов создаются на основании сопоставленных ID дублирующихся объектов.

Поле POINT_ADDRESS_ID, назначенное полю ID роли локатора идентификатора объекта в инструменте Создать локатор

Примечание:

Если в базовые данные не входит поле ID, его можно добавить при помощи инструмента Найти идентичные. Поле Shape можно использовать для поиска повторений в основных базовых данных, исходя из предположения, что они содержат одинаковую геометрию. Дубликаты могут встречаться в базовых данных, когда два отдельных адреса или места интереса (POI) находятся в одном и том же местоположении, что может быть проблематичным. Эта процедура не работает во всех случаях. Если поле Shape используется в инструменте Найти идентичные, выходная таблица будет содержать идентичные ID для дублирующихся объектов. Затем его можно объединить с основными базовыми данными и использовать для построения локатора, назначив новое поле ID полю Feature ID роли локатора в инструменте Создать локатор.

Если вы хотите использовать в качестве основных базовых данных класс точечных объектов, содержащий 13 миллионов объектов, где 10 миллионов являются уникальными объектами, сопоставление поля ID объекта активирует функциональность удаления дублирующейся геометрии в инструменте Создать локатор. В итоге размер локатора сократится с 253 MB до 200 MB.