Retrieval Augmented Generation
Описание
Паттерн Retrieval Augmented Generation (RAG) расширяет возможность обновления знаний агентов при сохранении приватности данных в реализациях агентов/систем на основе foundation models, развернутых локально.
Контекст
Foundation models имеют ограниченные знания на момент обучения и могут не иметь доступа к актуальной или специфичной информации. Для корпоративных применений важна приватность данных.
Проблема
- Ограниченные знания моделей на момент обучения
- Необходимость доступа к актуальной информации
- Требования к приватности данных в корпоративных средах
Решение
Паттерн RAG объединяет:
- Retrieval: Поиск релевантной информации из внешних источников
- Augmentation: Обогащение промпта найденной информацией
- Generation: Генерация ответа на основе обогащенного контекста
Преимущества
- Обновляемость знаний: Возможность использования актуальной информации
- Приватность данных: Локальное хранение и обработка данных
- Специфичность: Доступ к доменно-специфичной информации
- Гибкость: Легкое обновление базы знаний без переобучения модели
Компромиссы
- Необходимость в системе поиска и хранения документов
- Зависимость от качества поиска релевантной информации
- Дополнительные вычислительные ресурсы для поиска
Известные применения
- Корпоративные чат-боты с доступом к внутренней документации
- Системы вопросов-ответов на основе документов
- Ассистенты с доступом к актуальной информации
Связанные паттерны
- Incremental Model Querying - Пошаговое обогащение контекста
- Tool/Agent Registry - Реестр источников данных
Last updated on