Включение пользовательских атрибутов в выходные данные

Доступно с лицензией LocateXT.

При извлечении местоположений из документов или текста выходной класс пространственных объектов содержит точку для каждого местоположения, найденного в документе. Поля в таблице атрибутов хранят текст, извлеченный из документа до и после данных о местоположении, чтобы предоставить контекст и помочь оценить данные. Если вы решили извлечь даты, найденные в документе, даты также сохраняются в атрибутах объектов. Вы также можете извлечь интересующую вас дополнительную информацию и сохранить ее в пользовательских полях выходного класса пространственных объектов.

Например, документы, содержащие рассказы очевидцев об извержении вулкана, могут включать слова, имеющие отношение к пониманию природы извержения, такие как треск, газ, дымка, пепел, взрыв, пар, лава и т. д. Можно определить слова для распознавания и извлечения и поместить их в настраиваемое поле в таблице атрибутов. Пользовательские атрибуты определяются в файле пользовательских атрибутов (.lxtca).

Более подробно об атрибутах по умолчанию для местоположения

Если у вас есть файл пользовательских атрибутов, который вы хотите применить, добавьте его в список Файлы пользовательских атрибутов, активируйте файл и включите переключатель для пользовательских атрибутов. При извлечении местоположений в существующий слой карты новые пользовательские поля атрибутов не добавляются в таблицу атрибутов существующего класса пространственных объектов. При извлечении местоположений в новый слой карты новые пользовательские атрибуты включаются в таблицу атрибутов выходного класса пространственных объектов.

Файл пользовательских атрибутов будет применяться для определения пользовательских полей в таблице атрибутов выходного класса пространственных объектов. Если указанное содержимое найдено при сканировании входных файлов или текста, оно извлекается и сохраняется в пользовательских полях.

Если извлечь местоположения в существующий слой карты и класс объектов, пользовательские поля не добавляются в таблицу атрибутов существующего класса объектов. Однако существующие поля могут использоваться для хранения указанного содержимого, если они имеют правильный тип данных.

Включение или выключение пользовательских атрибутов

Когда переключатель для пользовательских атрибутов включен, и вы извлекаете местоположения в новый слой карты, пользовательские атрибуты, определенные в активном файле пользовательских атрибутов, включаются в таблицу атрибутов выходного класса объектов. Когда переключатель для пользовательских атрибутов выключен, и вы извлекаете местоположения в новый слой карты, таблица атрибутов выходного класса объектов будет содержать только атрибуты по умолчанию.

  1. На панели Извлечь местоположения щелкните вкладку Свойства.
  2. Включите или выключите переключатель для пользовательских атрибутов.
    • Щелкните вкладку Опции Параметры и щелкните переключатель Пользовательские атрибуты.
    • Щелкните вкладку Извлечь атрибуты Извлечь атрибуты, откройте вкладку Пользовательские атрибуты и щелкните переключатель Создать поля из пользовательских атрибутов.

    Нажмите переключатель, который выключен, чтобы включить его Переключатель включен. Нажмите переключатель, который включен, чтобы выключить его Переключатель выключен.

Доступ к вкладке Пользовательские атрибуты

Откройте вкладку Пользовательские атрибуты, чтобы активировать, создавать и управлять файлами пользовательских атрибутов.

  1. На панели Извлечь местоположения щелкните вкладку Свойства.
  2. Выполните одно из следующих действий для доступа к вкладке Пользовательские атрибуты:
    • Щелкните вкладку Опции Параметры и щелкните стрелку Перейти к опции напротив переключателя Пользовательские атрибуты.
    • Щелкните вкладку Извлечь атрибуты Извлечь атрибуты и откройте вкладку Пользовательские атрибуты.

Определение пользовательских атрибутов

При первом появлении диалогового окна Файл пользовательских атрибутов список Атрибуты пуст, но диалоговое окно готово для добавления новых атрибутов в файл. Начните заполнять форму, чтобы определить новый пользовательский атрибут и добавить его в список Атрибуты. Чтобы изменить существующий атрибут, выберите его в списке атрибуты и начните редактирование; обновите атрибут после завершения изменений. Если вы начинаете добавлять или редактировать атрибут и не хотите сохранять изменения, отмените их. Это очистит форму и позволит вам задавать определение новому атрибуту.

Когда атрибут добавлен или существующий атрибут обновлен, имя атрибута отображается курсивом со звездочкой (*), что указывает на то, что оно не было сохранено в файле пользовательских атрибутов.

Четыре компонента пользовательского атрибута:

  • Хранение – эти свойства определяют, как поле определяется в таблице атрибутов при создании выходного класса пространственных объектов.
  • Параметры поиска – эти свойства определяют способ проверки входных документов на наличие информации, которую можно извлечь.
  • Ключевые слова – эти свойства определяют то, что вы ищете во входных документах.
  • Параметры захвата – если ключевое слово найдено, эти свойства определяют, какой текст извлекается из документа и хранится в поле.

Хранение

Свойства, определяющие, как пользовательский атрибут хранится в выходном классе пространственных объектов, задаются под заголовком Информация об атрибуте. Имя, введенное в текстовое поле Имя атрибута, отображается в списке Атрибуты, а также используется в качестве псевдонима поля.

При вводе значения для имени атрибута соответствующее значение добавляется в текстовое поле Имя поля. Имя атрибута настраивается в соответствии с общими требованиями к именованию полей. Например, если вы вводите Event Type в текстовом окне Имя атрибута, вы видите Event_Type в текстовом окне Имя поля. Имя поля можно изменить на любое подходящее.

Для всех пользовательских атрибутов назначается тип данных Текст, когда они включаются в таблицу атрибутов класса пространственных объектов. По умолчанию размер поля задается для хранения строк длиной 254 символа. При необходимости измените значение в текстовом поле Длина поля на большее или меньшее.

Если вы всегда создаете классы объектов базы геоданных в качестве выходных данных, укажите имена полей и размеры, подходящие для этого типа данных. Если позже вы будете применять тот же файл пользовательских атрибутов и создадите шейп-файл в качестве выходного, имена полей и размеры будут усечены до допустимого предела этого типа данных.

Параметры поиска

Свойства, определяющие, как проверяются входные документы и как обрабатываются ключевые слова, если они найдены, указаны в разделе Параметры поиска. Тип поиска определяет, как документы и текст рассматриваются для поиска ключевых слов. Ниспадающий список Тип содержит следующие два варианта:

  • Весь документ – весь документ сканируется на наличие указанных ключевых слов. Это установка по умолчанию.
  • Рядом с местоположениями – когда местоположение найдено в документе, текст до и после местоположения сканируется для указанных ключевых слов. Объем текста, отсканированного перед местоположением, определяется значением в текстовом поле Символы перед. Объем текста, отсканированного после местоположения, определяется значением в текстовом поле Символы после. Текстовые поля Символы до и Символы после по умолчанию имеют значение 60 символов, что составляет в общей совокупности 120 символов.

Когда ключевое слово найдено, способ его обработки определяется значением в ниспадающем списке Совпадения, который имеет следующие опции:

  • Сохранять только первый – обрабатывается только первое ключевое слово, найденное в документе или в указанном диапазоне. Используется по умолчанию.
  • Сохранять все – обрабатываются все ключевые слова, найденные в документе или в указанном диапазоне.

Рассмотрим входной документ, описывающий школы в Redlands, CA, который включает следующие строки:

Дата: 7 февраля 2019 г.

Источник: http://www.ed-data.org/district/San-Bernardino/Redlands-Unified

School: Redlands Senior High, Type: High School, Charter: N, Grades: 9-12, Location: 117.1717550°W 34.0552456°N, students: 2325, enrollDate: 2017/08/09, Established: 1891, address: 840 East Citrus Ave. Redlands CA 92374-5399

School: Redlands Senior High, Type: High School, Charter: N, Grades: 9-12, Location: 117.1922398°W 34.0816164°N, students: 2168, enrollDate: 2017/08/09, Established: 2008, address: 800 West Pioneer Ave. Redlands CA 92374-1509

Этот документ содержит много местоположений и разные варианты слов Redlands и school. Если для извлечения этих слов определены два ключевых слова, то следующая комбинация параметров даст следующие результаты:

  • Весь документ + Сохранять только первый – каждое местоположение будет иметь одинаковое значение. Первое ключевое слово, найденное в документе, будет извлечено и записано в пользовательском атрибуте. Значением пользовательского атрибута будет Redlands.
  • Весь документ + Сохранять все – каждое местоположение будет иметь одинаковое значение. Все найденные в документе экземпляры ключевых слов Redlands и school будут извлечены и записаны в пользовательском атрибуте. Каждый фрагмент извлеченного текста разделяется символом черты (|) в значении атрибута. Значением пользовательского атрибута будет Redlands | School | Redlands | School | Redlands | School | School | Redlands
  • Рядом с местоположениями + Сохранять только первые, при проверке диапазона символов в 60 символов до местоположения и 0 символов после местоположения – для каждого местоположения запишется ключевое слово, найденное в указанном диапазоне символов. Для обоих местоположений будет записано значение пользовательского атрибута School.
  • Рядом с местоположениями + Сохранять только первые, при проверке диапазона символов в 100 символов до местоположения и 0 символов после местоположения – для каждого местоположения запишутся все ключевые слова, найденные в указанном диапазоне символов. Для первого местоположения будет записано значение пользовательского атрибута School | Redlands | School. Для второго местоположения будет записано значение пользовательского атрибута School | School.

Ключевые слова

Вы можете сразу добавлять ключевые слова в виде списка в специальный раздел формы для определения пользовательских атрибутов. Начните вводить в форме, чтобы определить новое ключевое слово и добавить его в список Ключевые слова. Чтобы изменить существующее ключевое слово, выберите его в списке ключевых слов и начните редактирование; обновите ключевое слово после завершения изменений. Если вы начинаете добавлять или редактировать ключевое слово и не хотите сохранять изменения, отмените их – это очистит форму и позволит вам начать определять новое ключевое слово.

При добавлении нового или обновлении существующего ключевого слова имя ключевого слова отображается в списке Ключевые слова курсивом со звездочкой (*), что указывает на то, что оно не было сохранено в файле пользовательских атрибутов.

Введите текст, который вы ищете в текстовом поле Ключевое слово. Если последний символ в ключевом слове является пробелом, он будет проигнорирован при оценке ключевого слова.

При необходимости, отметьте Чувствительность к регистру. Если текст, извлеченный из документа, должен включать текст, указанный в текстовом поле Ключевое слово, установите отметку Включить в захват.

Опции захвата

Свойства, определяющие, какой текст извлекается из документа и хранится в поле в таблице атрибутов выходного класса пространственных объектов, определяются под заголовком Опции захвата. Если размер поля, заданный для пользовательского атрибута, меньше, чем извлеченный текст, значение, хранящееся в поле, будет усечено. Текст извлекается так же, как и из документа, начиная с последнего символа ключевого слова без пробелов до точки остановки, указанной выбранной опцией захвата. Извлеченный текст будет содержать пробелы.

Следующие шесть параметров определяют, какой текст будет извлечен. Учитывая тот же входной документ, описанный выше, приведены примеры текста, извлеченного для каждого варианта.

  • Захват только ключевого слова – будет извлечен только текст, указанный в текстовом поле Ключевое слово. Нет необходимости устанавливать отметку Включить в захват для ключевого слова, чтобы извлечь указанное ключевое слово. Например, если ключевое слово redlands-unified, будет извлечен текст redlands-unified, и он будет сохранен в пользовательском поле. Используется по умолчанию.
  • Взять число символов – при выборе этой опции включается текстовое окно Число. Извлекается указанное количество символов. По умолчанию извлекается один символ. Например, если ключевое слово established:, извлеките пять символов, чтобы сохранить значение, включающее все четыре символа года, такое как 1891; первым символом, сохраненным в поле, будет пробел, следующий за двоеточием (:). Если в строке документа отсутствует пробел после двоеточия, эта строка может иметь значение 1957.
  • Взять число слов – при выборе этой опции включается текстовое окно Число. Извлекается текст до последнего символа в последнем указанном слове. По умолчанию извлекается одно слово. Для этих целей слово – это текст, который встречается между двумя не буквенно-цифровыми символами. Например, если ключевое слово grades, и вы извлекаете два слова, то будет извлечен текст : 9-12. Первое слово 9, а второе 12.
  • Взять число строк – при выборе этой опции включается текстовое окно Число. Извлекается указанное количество строк. По умолчанию извлекается одна строка. Для этих целей одна строка-это позиция, следующая за последним символом ключевого слова до конца текущей строки. Если извлекается более одной строки, извлекаются также все символы на следующем числе указанных строк.
  • Захват до пустой строки – извлекается текст до следующей пустой строки или конца документа. Например, если ключевое слово dates, и в документе нет пустой строки, весь текст будет извлечен до конца документа. Если после исходного URL-адреса в файле есть пустая строка, извлекается весь текст до пустой строки.
  • Поиск до строки остановки – если выбран этот параметр, включается текстовое поле Строка остановки. Будет извлечен весь текст, пока не будет извлечена указанная строка остановки. Например, если ключевое слово type:, а строка остановки запятая (,), будет извлечен текст между запятыми, такой как High School. Для этой опции становятся активными настройки Чувствительность к регистру и Включать в захват для строки остановки, их можно выбрать, если требуется. Если ключевое слово address:, а строка остановки 92374, будет извлечен текст до конца, включая строку остановки: 840 East Citrus Ave. Redlands CA 92374. Если другие адреса имеют другой почтовый индекс, будет извлечен весь текст до следующего появления указанного почтового индекса или конца файла.

Добавление атрибута

При первом открытии диалогового окна Файл пользовательских атрибутов вы сразу же можете добавить новые атрибуты в файл пользовательских атрибутов. Начните заполнять форму, чтобы определить новый пользовательский атрибут и добавить его в список Атрибуты. Когда атрибут добавлен, имя атрибута отображается курсивом со звездочкой (*), что указывает на то, что оно не было сохранено в файле пользовательских атрибутов.

Если диалоговое окно было открыто ранее и вы начали редактировать существующий атрибут, имя этого атрибута появится в текстовом поле Имя атрибута. Нажмите кнопку Отмена в нижней части формы, чтобы остановить редактирование атрибута. Форма очищается и позволяет начать определение нового атрибута.

  1. Создайте файл пользовательских атрибутов или отредактируйте файл пользовательских атрибутов.

    Откроется диалоговое окно Файл пользовательских атрибутов. В текстовом поле Имя атрибута отображается подсказка Новый атрибут, указывающая, что форма готова для определения нового атрибута.

  2. Задайте параметры хранения, определяющие способ хранения поля в выходном классе пространственных объектов.
    1. Введите имя атрибута в текстовом поле Имя атрибута.
    2. В текстовом поле Имя поля настройте имя поля, которое будет сохранено в классе пространственных объектов, если это необходимо.
    3. Если требуется, измените значение в текстовом поле Длина поля на большее или меньшее.
  3. Задайте параметры поиска, которые определяют, как будет проверяться входной документ для информации, которую вы хотите найти.
    1. Щелкните ниспадающий список Тип и задайте область текста для поиска ключевого слова. Задайте границы диапазона текста в текстовых окнах Символы до и Символы после, если требуется.
    2. Щелкните ниспадающий список Совпадения и выберите опцию, указывающую, хотите ли вы найти первое вхождение ключевого слова во входном файле или все вхождения.
  4. Добавьте ключевые слова в пользовательский атрибут.
    1. Введите текст, который вы ищете в документе в текстовом окне Ключевое слово.
    2. Если для текста, идентифицирующего ключевое слово, учитывается регистр, выберите Чувствительность к регистру.
    3. Если ключевое слово должно быть включено в текст, поставьте отметку Включить в захват.
  5. Укажите параметры захвата, которые определяют, какое содержимое извлекается из документа и хранится в поле.
    1. Щелкните ниспадающий список Тип захвата и выберите соответствующую опцию, определяющую способ извлечения текста.
    2. Введите значение в текстовое поле Число или в поле Текст строки остановки, если одна из этих опций включится после выбора типа захвата.
    3. Если включено текстовое окно Текст строки остановки, установите отметку Чувствительность к регистру и Включить в захват, если необходимо.
  6. Щелкните Добавить ключевое слово.

    Это ключевое слово добавляется в список Ключевые слова.

  7. Щелкните Добавить атрибут, чтобы добавить это определение пользовательского атрибута в список Атрибуты.
  8. Нажмите кнопку Сохранить, чтобы сохранить пользовательский атрибут в файл пользовательских атрибутов.

Редактирование атрибута

Чтобы изменить существующий атрибут в диалоговом окне Файл пользовательских атрибутов, выберите его в списке атрибутов и начните редактирование. Обновите атрибут, когда все ваши правки будут завершены. Если вы начинаете редактировать атрибут и не хотите сохранять изменения, отмените их. Это очистит форму и позволит вам задавать новое определение или редактировать атрибут.

Когда существующий атрибут обновлен, имя атрибута отображается курсивом со звездочкой (*), что указывает на то, что оно не было сохранено в файле пользовательских атрибутов.

  1. Создайте файл пользовательских атрибутов или отредактируйте файл пользовательских атрибутов.

    Откроется диалоговое окно Файл пользовательских атрибутов. Список Атрибуты включает все пользовательские атрибуты, которые ранее были сохранены в файл. Диалоговое окно сразу готово для добавления нового атрибута – текстовое поле Имя атрибута очищается.

  2. Наведите курсор на атрибут, который требуется изменить в списке Атрибуты, и нажмите кнопку Редактировать Редактировать.

    Свойства атрибутов отображаются в форме справа.

  3. Измените способ хранения поля в выходном классе пространственных объектов, настроив значения под заголовком Информация об атрибуте, если это необходимо.
  4. Измените способ просмотра входного документа для поиска информации, задав значения в разделе Опции поиска, если требуется.
  5. Наведите курсор на ключевое слово, которое вы хотите изменить в списке Ключевые слова, и нажмите кнопку Редактировать Редактировать.

    На форме появляются свойства ключевых слов.

  6. Измените текст, который вы ищете в документе, отредактировав значения под заголовком Ключевое слово, если необходимо.
  7. Измените способ извлечения текста из документа при поиске ключевого слова выбрав необходимое значение под заголовком Опции захвата, если требуется.
  8. Щелкните Обновить ключевое слов, чтобы сохранить изменения этого ключевого слова, или нажмите Отмена, чтобы прервать редактирование ключевого слова.

    После обновления текст ключевого слова в списке Ключевые слова изменяется, и отражаются внесенные изменения, если они были. Это ключевое слово отображается курсивом, и к нему добавляется звездочка ( * ), чтобы указать, что изменения не были сохранены.

  9. Удалите все ключевые слова, которые не эффективны при извлечении нужной информации. Наведите курсор на ключевое слово, которое вы хотите удалить, в списке Ключевые слова и нажмите кнопку Удалить Удалить.
  10. Щелкните Обновить атрибут, чтобы сохранить изменения этого атрибута, или нажмите Отмена, чтобы прервать редактирование атрибута.

    После обновления текст атрибута в списке Атрибуты изменяется, и отражаются внесенные изменения, если они были. Имя этого атрибута отображается курсивом, и к нему добавляется звездочка ( * ), чтобы указать, что изменения не были сохранены. К имени файла, которое отображается в верхней части диалогового окна, добавляется звездочка (*), чтобы указать, что изменения не сохранены.

  11. Нажмите кнопку Сохранить, чтобы обновить определения пользовательских атрибутов в файле пользовательских атрибутов.
  12. Нажмите кнопку Закрыть, чтобы остановить редактирование файла пользовательских атрибутов.
Подсказка:

Можно дважды щелкнуть атрибут в списке Атрибуты, чтобы изменить его. Аналогично, вы можете дважды щелкнуть слово в списке Ключевые слова, чтобы изменить его.

Удаление атрибутов

Чтобы удалить атрибут из файла пользовательских атрибутов, сначала откройте файл на редактирование. Наведите курсор на атрибут, который вы хотите удалить, в списке Атрибуты и нажмите кнопку Удалить Удалить или нажмите клавишу Delete. Вы также можете удалить несколько местоположений из файла пользовательских местоположений сразу, выполнив следующие действия.

  1. Создайте файл пользовательских атрибутов или отредактируйте файл пользовательских атрибутов.

    Откроется диалоговое окно Файл пользовательских атрибутов.

  2. Щелкните первый атрибут, который вы хотите удалить.

    Это атрибут выбирается.

  3. Нажмите Ctrl или Shift.
  4. Повторите шаг 2, чтобы выбрать другие атрибуты, которые вы хотите удалить.
  5. Нажмите кнопку Удалить Удалить в верхней части таблицы Атрибуты или нажмите Delete.

    Все выбранные атрибуты удаляются.

  6. Нажмите кнопку Сохранить, чтобы обновить определения пользовательских атрибутов в файле пользовательских атрибутов.
  7. Нажмите кнопку Закрыть, чтобы остановить редактирование файла пользовательских атрибутов.

Связанные разделы