Cria um resumo de uma empresa baseado em LLM a partir de seu site.
perspectv
é uma ferramenta de linha de comando que coleta um site comercial e cria um relatório. O conteúdo do relatório é atualmente:
Os LLMs são utilizados para extrair conteúdo das páginas do site da empresa e gerar o relatório. Dois modelos diferentes podem ser usados (por exemplo, um modelo de extração de baixo custo e um modelo de relatório de grande contexto – uma vez que se espera que o último modelo considere todo o conteúdo do site como contexto).
Embora perspectv
esteja na versão beta, ele deve ser executado no diretório repo usando poetry
:
poetry run perspectv example.com
É necessária uma única variável de ambiente, OPENROUTER_API_KEY
. Atualmente, (OpenRouter)[https://openrouter.ai/] é usado para fornecer uma forte seleção de modelos. No futuro, seria benéfico apoiar diretamente outros fornecedores de LLM.
--dbfile
: nome do arquivo para um banco de dados SQLite usado para armazenar dados incrementais para web scrape e uso do LLM. Por padrão, perspectv
evitará refazer o mesmo trabalho. Excluir o banco de dados ou usar um novo arquivo será reiniciado.
--model-extract
: Substitui o nome do modelo OpenRouter usado para extrações de páginas da web. Este deve ser um modelo de baixo custo com desempenho de extração razoável (muitos modelos podem fazer isso de forma aceitável).
--model-report
: Substitui o nome do modelo OpenRouter usado para geração de relatório. Este deve ser um modelo de grande contexto. O padrão, anthropic/claude-3-opus
, é relativamente caro, mas tem um bom desempenho e possui uma janela de contexto de 1 milhão de tokens.