Базовый RAG за 15 минут
1. Введение
RAG - это метод, который позволяет LLM использовать релевантную информацию из внешних источнков в своих ответах. В этом гайде мы создадим полный RAG пайплайн, используя актуальную информацию о недавно вышедших фильмах/сериалах.
Наш гайд будет включать следующие шаги:
- Загрузка статей и нарезка на chunks
- Создание embeddings и загрузка в векторную БД
- Реализация базового семантического поиска
- Подключение LLM модели
- Проверка отсутствия информации у LLM
- Общение с LLM по информации из внешних источников
2. Подготовка окружения
Установим и импортируем необходимые библиотеки:
#!pip install langchain
#!pip install langchain-openai
#!pip install langchain_community
#!pip install requests
#!pip install beautifulsoup4
#!pip install faiss-cpu - если вы запускаете на CPU
#!pip install faiss-gpu - если вы запускаете на GPU с поддержкой CUDA
import os
import requests
from bs4 import BeautifulSoup
from langchain_openai import OpenAIEmbeddings, ChatOpenAI
from langchain_core.documents import Document
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_core.prompts import ChatPromptTemplate
from langchain.chains import create_retrieval_chain
from langchain_community.vectorstores import FAISS
from langchain.chains.combine_documents import create_stuff_documents_chain
os.environ["COMPRESSA_API_KEY"] = "ваш ключ"