Crie uma coleção Amazon OpenSearch Serverless (digite Vector search e escolha a opção Easy create ) – documentação.
Crie um índice com a configuração abaixo:
Baixe a Carta aos Acionistas Amazon 2022 e coloque-a no mesmo diretório.
Crie um arquivo .env
e forneça as seguintes informações sobre a configuração do Amazon OpenSearch:
opensearch_index_name= ' '
opensearch_url= ' '
engine= ' faiss '
vector_field= ' vector_field '
text_field= ' text '
metadata_field= ' metadata '
Certifique-se de ter configurado o Amazon Bedrock para acesso em sua máquina local. Além disso, você precisa de acesso ao modelo de incorporação amazon.titan-embed-text-v1
e ao modelo anthropic.claude-v2
no Amazon Bedrock - siga estas instruções para obter detalhes.
Carregar dados PDF:
python3 -m venv myenv
source myenv/bin/activate
pip3 install -r requirements.txt
python3 load.py
Verifique os dados na coleção OpenSearch
streamlit run app_semantic_search.py --server.port 8080
Você pode fazer perguntas, como:
What is Amazon ' s doing in the field of generative AI?
What were the key challenges Amazon faced in 2022?
What were some of the important investments and initiatives mentioned in the letter?
Em um terminal diferente:
source myenv/bin/activate
streamlit run app_rag.py --server.port 8081
Você pode fazer perguntas, como:
What is Amazon ' s doing in the field of generative AI?
What were the key challenges Amazon faced in 2022?
What were some of the important investments and initiatives mentioned in the letter?