Osmi
Учебные пособия

RAG

Модели крупного языка (LLM) открыли возможность создания продвинутых чат-ботов с вопросами и ответами, которые способны давать точные ответы на основе конкретных данных. Эти системы используют метод под названием Retrieval-Augmented Generation (RAG), который улучшает их ответы, опираясь на релевантные исходные материалы.

Модели крупного языка (LLM) открыли возможность создания продвинутых чат-ботов с вопросами и ответами, которые способны давать точные ответы на основе конкретных данных. Эти системы используют метод под названием Retrieval-Augmented Generation (RAG), который улучшает их ответы, опираясь на релевантные исходные материалы.

В этом руководстве вы научитесь создавать базовое приложение QA, которое сможет извлекать информацию и отвечать на вопросы по предоставленным документам.

Процесс можно разбить на два под-процесса:

  • Индексирование
  • Поиск

Индексирование

Модуль База документов предназначен для помощи во всей цепочке индексирования — от сбора данных из разных источников, разбиения на части (чанки), апдейта в векторной базе данных и синхронизации с обновляемыми данными. Мы поддерживаем широкий спектр загрузчиков документов, включая файлы PDF, Word, Google Drive, а также веб-скраеры, такие как Playwright, Firecrawl, Apify и другие. Также можно создать собственный загрузчик документов.

Поиск

На основе входных данных пользователя ищутся релевантные части документов в векторной базе данных. После этого LLM использует полученный контекст для генерации ответа.

  1. Добавьте узел Агент, перетащив его и настроив модель для использования.
  2. Создайте новую базу документов и определите содержание, чтобы помочь LLM понять, когда и как извлекать релевантную информацию. Также можно использовать кнопку автоматического генератора, чтобы упростить этот процесс.

Можно использовать только те базы документов, которые были предварительно добавлены (upserted).

  1. (Дополнительно) Если данные уже были сохранены в векторной базе без использования процесса индексирования документа, можно подключиться прямо к базе данных и модели векторизации.
  2. Добавьте системный промпт или используйте кнопку генерировать для помощи. Мы советуем использовать её, так как это способствует созданию более эффективного и оптимизированного промпта.
  3. Ваш агент RAG теперь готов к использованию