Skip to Content
Каталог паттерновРабота с знаниямиRetrieval Augmented Generation

Retrieval Augmented Generation

Описание

Паттерн Retrieval Augmented Generation (RAG) расширяет возможность обновления знаний агентов при сохранении приватности данных в реализациях агентов/систем на основе foundation models, развернутых локально.

Контекст

Foundation models имеют ограниченные знания на момент обучения и могут не иметь доступа к актуальной или специфичной информации. Для корпоративных применений важна приватность данных.

Проблема

  • Ограниченные знания моделей на момент обучения
  • Необходимость доступа к актуальной информации
  • Требования к приватности данных в корпоративных средах

Решение

Паттерн RAG объединяет:

  • Retrieval: Поиск релевантной информации из внешних источников
  • Augmentation: Обогащение промпта найденной информацией
  • Generation: Генерация ответа на основе обогащенного контекста

Преимущества

  • Обновляемость знаний: Возможность использования актуальной информации
  • Приватность данных: Локальное хранение и обработка данных
  • Специфичность: Доступ к доменно-специфичной информации
  • Гибкость: Легкое обновление базы знаний без переобучения модели

Компромиссы

  • Необходимость в системе поиска и хранения документов
  • Зависимость от качества поиска релевантной информации
  • Дополнительные вычислительные ресурсы для поиска

Известные применения

  • Корпоративные чат-боты с доступом к внутренней документации
  • Системы вопросов-ответов на основе документов
  • Ассистенты с доступом к актуальной информации

Связанные паттерны

Last updated on