Osmi
Загрузчики документов

CSV Files

Загружает данные из CSV-файлов.

CSV (Comma-Separated Values) — это простой формат файла, широко используемый для хранения табличных данных, таких как таблицы или базы данных. Этот модуль предоставляет возможность загружать и обрабатывать CSV-файлы в рамках вашего рабочего процесса.

Этот модуль обеспечивает универсальный загрузчик CSV документов, который способен:

  • Загружать один или несколько CSV-файлов
  • Поддерживать загрузку файлов как в кодированном формате base64, так и из хранилища
  • Извлекать конкретные столбцы или полное содержимое файла
  • Обрабатывать большие наборы данных эффективно
  • Управлять пользовательскими метаданными

Входные параметры

  • CSV File: CSV-файл(ы) для обработки (.csv обязательное расширение)
  • Text Splitter (опционально): разделитель текста для обработки извлеченного содержимого
  • Single Column Extraction (опционально): название конкретного столбца для извлечения
  • Additional Metadata (опционально): JSON-объект с дополнительными метаданными для добавления к документам
  • Omit Metadata Keys (опционально): список ключей метаданных, которые нужно исключить из стандартных метаданных (через запятую)

Выходные данные

  • Document: массив объектов документов, содержащих метаданные и содержимое страницы (pageContent)
  • Text: объединенная строка из содержимого pageContent всех документов

Особенности

  • Поддержка обработки нескольких файлов одновременно
  • Возможность извлечения одного конкретного столбца
  • Эффективная обработка больших объемов данных
  • Настраиваемое управление метаданными
  • Встроенная интеграция с хранилищами данных
  • Поддержка обработки файлов в форматах base64 и blob