Подключения к многофайловым объектам

Подключение к многофайловым объектам (MFC) позволяют быстро подключаться к источникам данных для визуализации и анализа больших наборов данных. MFC предоставляют гибкие возможности для работы и форматирования данных.

MFC ссылается на папку с одним или несколькими наборами данных. Наборы данных в MFC используются как входные данные объектов (точек, полилиний, полигонов и табличных данных) для инструментов геообработки. Когда вы создаете MFC, создается файл .mfc. Этот файл задает директорию наборов данных, которые определяет наборы данных и их схему в MFC, включая геометрию и информацию о времени. Вы можете перейти к наборам данных MFC в инструменте геообработки и просмотреть наборы MFC на карте. Ниже приведены примеры использования MFC:

  • У вас есть множество шейп-файлов, представляющих большую область. Каждый шейп-файл представляет часть области, и вы хотите использовать все файлы вместе.
  • Вы каждый день получаете новый файл .csv с измерениями температур. Вы хотите включить новый файл .csv в набор данных вместе с имеющимися файлами .csv.
  • Вы используете данные, которые содержат множество полей со временем события. Вы хотите использовать все поля для представления времени.
  • Вам необходимо использовать файлы Parquet.

Использовать MFC в качестве входных данных для инструментов геообработки удобно по следующим причинам:

  • Вы можете представить несколько наборов данных с одинаковой схемой и типом файла как один набор данных.
  • MFC позволяет работать с данными во время выполнения анализа, поэтому вы можете продолжать добавлять данные в набор, находящийся в MFC без необходимости перерегистрации или публикации данных.
  • Вы можете изменить MFC, чтобы удалить, добавить или обновить отображение наборов данных.
  • MFC отличается гибкостью с точки зрения определения геометрии и времени и допускает несколько форматов времени в отдельном наборе данных.

Поддерживаемые форматы данных

Подключения к многофайловым объектам поддерживают следующие наборы данных:

  • Файлы с разделителями (такие как .csv, .tsv и .txt)
  • Шейп-файлы (.shp)
  • Файлы Parquet (.parquet)
    Примечание:

    Поддерживаются только зашифрованные файлы Parquet. Файлы GeoParquet не поддерживаются.

  • Файлы ORC (.orc)

Если вы используете MFC в инструментах GeoAnalytics Desktop, поддерживаются все входные форматы. Если вы используете наборы данных MFC в любых других инструментах геообработки, поддерживаются файлы с разделителями, шейп-файлы и файлы parquet.

Подробнее об анализе с файлами MFC

Терминология подключений к многофайловым объектам

В следующей таблице приведены общие термины, встречающиеся при работе с MFC:

ТерминОписание

Подключение к многофайловым объектам

Этот термин означает файл MFC. Этот файл MFC можно развернуть, чтобы увидеть наборы данных, или раскрыть для использования в инструментах геообработки. Этот файл подключения является интерфейсом ArcGIS Pro к файлу MFC.

Файл подключения к многофайловым объектам

Файл (.mfc), которые создается и сохраняется при создании MFC с помощью инструмента Создать подключение к многофайловым объектам. Файл содержит информацию о наборах данных и схемах, а также о параметрах геометрии и времени. Когда вы просматриваете этот файл в ArcGIS Pro, это элемент MFC.

Более подробно о файлах подключений к многофайловым объектам

Набор данных подключения к многофайловым объектам

Набор данных в MFC. Вы можете добавить этот набор данных к карте или использовать как входные данные для инструмента геообработки.

Местоположение источника

Расположение папки, зарегистрированной как MFC. Это местоположение содержит одну или две папки, представляющие наборы данных MFC. Инструменты подключения к многофайловым объектам не меняют эту папку.

Данные источника

Наборы данных, зарегистрированные в MFC. Когда вы используете MFC, данные источника не меняются. Инструменты подключения к многофайловым объектам не меняют эти данные.

Структура входных данных

Чтобы использовать наборы данных как входные в MFC, данные должны быть правильно структурированы. Чтобы подготовить данные для MFC, отформатируйте наборы данных как подпапки в одной папке-источнике, которую вы будете регистрировать. В этой папке имена вложенных папок соответствуют именам наборов данных.

Показана папка-источник с тремя подпапками с наборами данных
Показана папка-источник, содержащая три подпапки, которые представляют наборы данных.

На рисунке выше показана правильная структура MFC. Регистрируется папка-источник, каждая подпапка в ней соответствует набору данных. В этом примере вы регистрируете папку-источник, а три набора данных, Dataset-1, Dataset-2 и Dataset-3, будут включены в MFC.

В подпапках наборов данных, данные можно структурировать. Если эти вложенные папки будут содержать несколько подпапок или файлов, то все содержимое этих подпапок будет считаться отдельным набором данных, они должны использовать одну схему и тип файла.

Примечание:

Все файлы в папке набора данных должны иметь одинаковую схему. Если схема файла отличается, в визуализации и анализе он может быть использован некорректно.

На следующем изображении показаны три набора данных с разными структурами и содержанием файлов:

Пример исходной папки и ее содержания
Показаны примеры регистрации папки-источника, трех папок наборов данных и их содержания.

В этом примере, эти три папки наборов данных имеют разное содержимое. Каждый набор данных описан ниже:

  • Dataset-1 - набор данных состоит из одного файла, D1-1. Когда Dataset-1 применяется для визуализации или анализа, используется один шейп-файл.
  • Dataset-2 - набор данных состоит из двух текстовых файлов: D2-1 и D2-2. Когда Dataset-2 применяется для визуализации или анализа, используются оба текстовых файла.
  • Dataset-3 - набор данных состоит из трех папок: D3-Folder-1 и D3-Folder-2, каждая содержит один набор, D3-1 и D3-2. Когда Dataset-3 применяется для визуализации или анализа, используются оба файла D3-1 и D3-2.

Примечание:

Если набор данных находится в папке с именем, начинающимся с символа подчеркивания (_), набор данных будет рассматриваться как скрытый и не будет доступен для обнаружения как набор данных. Это не относится к вложенным папкам или файлам. Имена вложенных папок и файлов могут начинаться со знака подчеркивания, данные могут быть использованы.

Это примеры структурирования данных. Количество файлов и папок не влияет на использование данных в визуализации и анализе. Добавление или удаление подпапок из папки набора данных не дает никаких преимуществ; структура папок на этом уровне является свободной.

Чтобы начать использовать подключения к многофайловым объектам, см. раздел Использование подключений к многофайловым объектам.

Связанные разделы