данGPT
Попробуйте это на https://dangpt.vercel.app/.
В этом проекте показано, как создавать сервисы искусственного интеллекта и реализовывать RAG (извлекательную дополненную генерацию) с помощью генеративного искусственного интеллекта.
Вот описание того, как это работает:
- За пределами этого репозитория мы собрали огромное количество данных. В данном случае сообщения Дэна.
- Затем мы преобразуем весь текст, который хотим найти, в векторы (списки чисел), используя модель машинного обучения, которая отображает смысл текста в многомерном числовом пространстве. «Вложение» текста в векторное пространство с использованием «модели встраивания». В этом случае
text-embedding-3-small
от OpenAI. - Затем мы сохраняем эти векторы в базе данных векторов. Наше любимое оружие — AstraDB от DataStax.
Затем, когда пользователь отправляет запрос, мы:
- Превратите запрос в вектор, используя ту же модель внедрения.
- Найдите в базе данных векторов векторы, наиболее похожие на вектор запроса, или векторы, «рядом» с вектором запроса в многомерном пространстве.
- Получите множество оригинальных текстов из наиболее похожих векторов.
- Возьмите эти оригинальные тексты и вставьте их в качестве контекста в генеративную модель ИИ. В данном случае
gpt-3.5-turbo
от OpenAI. Та же модель, что и бесплатный уровень ChatGPT. - Затем генеративная модель ИИ генерирует ответ на основе заданного контекста, притворяясь Дэном.
Стоит отметить, что это всего лишь глупая демонстрация побочного проекта, и она, скорее всего, ошибочна. Это больше для образования, чем для чего-либо еще.