Создайте бессерверную коллекцию Amazon OpenSearch (введите «Векторный поиск» и выберите параметр «Простое создание» ) — документация.
Создайте индекс с приведенной ниже конфигурацией:
Загрузите письмо Amazon 2022 акционерам и поместите его в тот же каталог.
Создайте файл .env
и укажите следующую информацию о настройке Amazon OpenSearch:
opensearch_index_name= ' '
opensearch_url= ' '
engine= ' faiss '
vector_field= ' vector_field '
text_field= ' text '
metadata_field= ' metadata '
Убедитесь, что вы настроили Amazon Bedrock для доступа с вашего локального компьютера. Кроме того, вам понадобится доступ к модели внедрения amazon.titan-embed-text-v1
и модели anthropic.claude-v2
в Amazon Bedrock — для получения подробной информации следуйте этим инструкциям.
Загрузить данные PDF:
python3 -m venv myenv
source myenv/bin/activate
pip3 install -r requirements.txt
python3 load.py
Проверка данных в коллекции OpenSearch
streamlit run app_semantic_search.py --server.port 8080
Вы можете задавать вопросы, например:
What is Amazon ' s doing in the field of generative AI?
What were the key challenges Amazon faced in 2022?
What were some of the important investments and initiatives mentioned in the letter?
В другом терминале:
source myenv/bin/activate
streamlit run app_rag.py --server.port 8081
Вы можете задавать вопросы, например:
What is Amazon ' s doing in the field of generative AI?
What were the key challenges Amazon faced in 2022?
What were some of the important investments and initiatives mentioned in the letter?