Crée un résumé d'une entreprise, alimenté par LLM, à partir de son site Web.
perspectv
est un outil en ligne de commande qui récupère un site Web d'entreprise et crée un rapport. Le contenu du rapport est actuellement :
Les LLM sont utilisés pour extraire le contenu des pages du site Web de l'entreprise et pour générer le rapport. Deux modèles différents peuvent être utilisés (par exemple un modèle d'extraction à faible coût et un modèle de reporting à grand contexte -- puisque ce dernier modèle est censé prendre l'intégralité du contenu du site Web comme contexte).
Bien que perspectv
soit en version bêta, il doit être exécuté depuis le répertoire repo en utilisant poetry
:
poetry run perspectv example.com
Une seule variable d'environnement est requise, OPENROUTER_API_KEY
. Actuellement, (OpenRouter)[https://openrouter.ai/] est utilisé pour fournir une sélection de modèles solide. À l’avenir, il serait avantageux de prendre en charge directement d’autres fournisseurs de LLM.
--dbfile
: Nom de fichier d'une base de données SQLite utilisée pour stocker des données incrémentielles pour le web scrape et l'utilisation de LLM. perspectv
évitera par défaut de refaire le même travail. La suppression de la base de données ou l'utilisation d'un nouveau fichier recommencera.
--model-extract
: remplace le nom du modèle OpenRouter utilisé pour les extraits de pages Web. Il doit s'agir d'un modèle peu coûteux avec des performances d'extraction raisonnables (de nombreux modèles peuvent le faire de manière acceptable).
--model-report
: remplace le nom du modèle OpenRouter utilisé pour la génération du rapport. Cela devrait être un modèle à grand contexte. La valeur par défaut, anthropic/claude-3-opus
, est relativement chère mais fonctionne bien et possède une fenêtre contextuelle de 1 million de jetons.