Переходим к RAG — Retrieval-Augmented Generation. Объясняем, как с его помощью модель может опираться на документы и давать точные ответы. Простыми словами разбираем, что такое эмбеддинги, векторный поиск и как модель «находит смысл» в тексте.
LLM — мощный инструмент: она умеет писать код, резюмировать документы, вести диалоги. Но она не знает, где правда — всё, что делает модель, это продолжает текст на основе вероятностей. Поэтому она может с уверенностью сказать неправду, например: «Шекспир издал книгу в 1923 году». Это и есть галлюцинация. А если такая ошибка случается в клиентском чате, где нужно точно знать возвратную политику? Это уже риск для бизнеса.
RAG решает эту проблему. Он добавляет в промпт LLM актуальный контекст — извлечённый из вашей базы знаний. Сам процесс включает три шага:
Таким образом, мы не учим модель заново, а на лету дополняем её знания.
В RAG мы ищем по смыслу, а не по ключевым словам. Для этого каждый текст преобразуется в вектор в многомерном пространстве — это называется эмбеддинг. Похожие по смыслу тексты имеют близкие векторы. Например, «селёдка» и «что плавает в море?» окажутся рядом, а «жираф» — далеко.
Чтобы получить такие векторы, мы сначала извлекаем текст из исходных файлов: PDF, аудио, документов CRM. Это можно делать вручную, через парсеры, или даже с помощью LLM. Главное — получить чистый, пригодный для анализа текст. Потому что, как говорится в RAG: trash in — trash out.
Мы реализуем RAG-подсистему на Directual, не пиша код:
Мы используем готовые плагины: для эмбеддингов, распознавания речи, парсинга PDF и интеграции с ChatGPT. Всё настраивается визуально, шаг за шагом. Под капотом: сценарии, сокеты, и продуманная структура данных.
В результате — полноценная RAG-система, где:
Во втором уроке мы освоили:
В следующем — третьем уроке — мы углубимся в продвинутые темы:
Если вы хотите делать ИИ-решения уровня продакшн — обязательно переходите к третьей части!
Заходите в наше комьюнити: помощь по проектам, знакомства с потенциальными сооснователями, общение с разработчиками платформы и не только.