Crea un resumen de una empresa basado en LLM desde su sitio web.
perspectv
es una herramienta de línea de comandos que extrae un sitio web empresarial y crea un informe. El contenido del informe es actualmente:
Los LLM se utilizan para extraer contenido de las páginas del sitio web de la empresa y generar el informe. Se pueden utilizar dos modelos diferentes (por ejemplo, un modelo de extracción de bajo costo y un modelo de informes de contexto amplio, ya que se espera que el último modelo tome todo el contenido del sitio web como contexto).
Mientras perspectv
esté en versión beta, debe ejecutarse desde el directorio del repositorio usando poetry
:
poetry run perspectv example.com
Se requiere una única variable de entorno, OPENROUTER_API_KEY
. Actualmente, (OpenRouter)[https://openrouter.ai/] se utiliza para proporcionar una sólida selección de modelos. En el futuro, sería beneficioso apoyar directamente a otros proveedores de LLM.
--dbfile
: nombre de archivo para una base de datos SQLite utilizada para almacenar datos incrementales para el web scrape y el uso de LLM. perspectv
evitará de forma predeterminada rehacer el mismo trabajo. Eliminar la base de datos o usar un archivo nuevo comenzará de nuevo.
--model-extract
: anula el nombre del modelo OpenRouter utilizado para las extracciones de páginas web. Este debería ser un modelo de bajo costo con un rendimiento de extracción razonable (muchos modelos pueden hacer esto de manera aceptable).
--model-report
: anula el nombre del modelo OpenRouter utilizado para la generación de informes. Este debería ser un modelo de contexto amplio. El valor predeterminado, anthropic/claude-3-opus
, es relativamente caro pero funciona bien y tiene una ventana de contexto de 1 millón de tokens.