Сокращение дублирующихся объектов в данных

Базовые данные можно форматировать так, чтобы он содержали дублирующиеся объекты, представляющие одно и то же местоположение, но с различными атрибутами, и, таким образом, создать локатор, поддерживающий альтернативные названия. Это показывается в следующих данных, где 12725 Yosemite Blvd, Waterford и 12725 CA-132, Waterford имеют одинаковую геометрию, но разные значения в поле FullStreetName.

Таблица атрибутов PointAddress с дублирующимися объектами с разными названиями для одного местоположения

Для создания локатора, поддерживающего альтернативные названия объектов, рекомендуется добавить альтернативные названия в таблицу и использовать роль таблицы альтернативных названий, соответствующую основной роли локатора. Однако если базовые данные уже содержат дублирующиеся объекты, при построении локатора с помощью инструмента Создать локатор альтернативные значения могут быть созданы, а дублирующаяся геометрия будет исключена. Для удаления дублирующейся геометрии основные базовые данные должны содержать поле с ID, соединяющим дублирующиеся объекты в одном местоположении. Это поле идентификатора должно быть сопоставлено с основным полем идентификатора из роли локатора, например POINT_ADDRESS_ID. Это сокращает размер локатора и удаляет избыточных связанных кандидатов из результатов геокодирования.

Таблица атрибутов PointAddress с полем POINT_ADDRESS_ID для связи дублирующихся объектов в одном местоположении

Инструмент Создать локатор использует значения, сопоставленные с полем основного ID, для пропуска всей дублирующейся геометрии, исключая первую встретившуюся геометрию, которая сохраняется в локаторе. Альтернативные значения атрибутов создаются на основании сопоставленных ID дублирующихся объектов.

Примечание:

Если в базовые данные не входит поле ID, его можно добавить при помощи инструмента Найти идентичные. Поле Shape можно использовать для поиска повторений в основных базовых данных, исходя из предположения, что они содержат одинаковую геометрию. Возможно, что дубликаты появляются в базовых данных, когда два отдельных адреса или места интереса (POI) разделяют одно и то же местоположение, что может привести к проблемам. Эта процедура не сработает во всех случаях. Если поле Shape используется в инструменте Найти идентичные, выходная таблица будет содержать идентичные ID для дублирующихся объектов. Затем ее можно будет присоединить к основным базовым данным и использовать для построения локатора.

Если вы хотите использовать в качестве основных базовых данных класс точечных объектов, содержащий 13 миллионов объектов, где 10 миллионов являются уникальными объектами, сопоставление поля основного ID активирует функциональность удаления дублирующейся геометрии в инструменте Создать локатор. В итоге размер локатора сократится с 253 MB до 200 MB.

Поля основного ID для каждой роли

РольОсновной ID

Адрес точки

Адрес - ID соединения

Участок

ID соединения участка

Улица и номер дома

Улица - ID соединения

Точки интереса

Место - ID соединения

Указатель расстояния

Улица - ID соединения

Диапазон расстояний

Улица - ID соединения

Почтовый

Почтовый - ID соединения

Дополнительный почтовый индекс

Дополнительный индекс - ID соединения

Почтовое местоположение

Сочетание Почтового ID соединения и всех сопоставленных ID соединения административных областей используется в качестве основного ID в инструменте Создать локатор, так что все они должны быть сопоставлены.

Зона

Зона - ID соединения

Квартал

Квартал - ID соединения

Сектор

Сектор - ID соединения

Район

Округ - ID соединения

Округ

Район - ID соединения

Город

Город - ID соединения

Городская агломерация

Городская агломерация - ID соединения

Субрегион

Субрегион - ID соединения

Регион

Регион - ID соединения

Территория

Территория - ID соединения

Страна

Страна - ID соединения