Osmi
Загрузчики документов

Confluence

Загрузчик документов Confluence

Confluence

Загрузчик документов Confluence

Confluence — это корпоративная вики и платформа для совместной работы от Atlassian. Этот модуль обеспечивает возможность загрузки и обработки содержимого из пространств и страниц Confluence. Модуль предоставляет продвинутый загрузчик документов Confluence, который может:

  • Загружать содержимое из конкретных пространств Confluence
  • Поддерживать как облачные, так и серверные/Data Center развертывания
  • Обеспечивать аутентификацию несколькими методами
  • Ограничивать количество извлекаемых страниц
  • Обрабатывать содержимое с помощью разделителей текста (text splitters)
  • Настраивать извлечение метаданных

Входные параметры

Обязательные параметры:

  • Base URL: URL-адрес экземпляра Confluence
  • Space Key: Уникальный идентификатор пространства Confluence
  • Connect Credential: Выбор метода аутентификации:
    • API-данные для Confluence Cloud (имя пользователя + токен доступа)
    • API-данные для Confluence Server/Data Center (личный токен доступа)

Дополнительные параметры:

  • Text Splitter: разделитель текста для обработки извлеченного содержимого
  • Limit: Максимальное количество страниц для загрузки (0 — неограниченно)
  • Additional Metadata: JSON-объект с дополнительными метаданными
  • Omit Metadata Keys: список ключей метаданных для исключения (через запятую)

Выходные данные

  • Document: массив объектов документов, содержащих метаданные и содержимое страниц (pageContent)
  • Text: объединенная строка из содержимого страниц всех документов

Особенности

  • Поддержка развертываний как в облаке, так и на сервере (Cloud/Server/DC)
  • Гибкие опции аутентификации
  • Контроль количества страниц
  • Возможности обработки содержимого
  • Настройка метаданных
  • Обработка ошибок
  • Поддержка разделения текста

Методы аутентификации

Confluence Cloud

  • Требует имя пользователя и токен доступа
  • Токен генерируется в настройках аккаунта Atlassian
  • Поддержка API-токенов

Confluence Server/Data Center

  • Использует личный токен доступа
  • Токен создается на экземпляре Confluence
  • Поддержка прямого доступа к серверу

Примечания

  • Space Key можно найти в настройках пространства Confluence
  • Для Cloud и Server используются разные методы аутентификации
  • Может применяться ограничение скорости (rate limiting) в зависимости от экземпляра
  • Контент включает текст страниц и метаданные
  • Поддержка полного и частичного извлечения содержимого
  • Обработка ошибок при неправильных учетных данных или URL

Как найти Space Key

Чтобы найти ваш ключ пространства Confluence:

  1. Перейдите в нужное пространство
  2. Откройте Настройки пространства
  3. Найдите раздел "Space Key" в обзорной информации
  4. Пример формата: ~EXAMPLE362906de5d343d49dcdbae5dEXAMPLE