웹사이트에서 LLM 기반 비즈니스 요약을 생성합니다.
perspectv
는 비즈니스 웹사이트를 스크랩하고 보고서를 생성하는 명령줄 도구입니다. 현재 보고서 내용은 다음과 같습니다.
LLM은 회사 웹사이트의 페이지에서 콘텐츠를 추출하고 보고서를 생성하는 데 사용됩니다. 두 가지 다른 모델이 사용될 수 있습니다(예: 저비용 추출 모델과 대규모 컨텍스트 보고 모델 - 후자 모델은 전체 웹사이트 콘텐츠를 컨텍스트로 취할 것으로 예상되기 때문입니다).
perspectv
베타 버전이지만 poetry
사용하여 repo 디렉터리에서 실행해야 합니다.
poetry run perspectv example.com
단일 환경 변수 OPENROUTER_API_KEY
필요합니다. 현재 (OpenRouter)[https://openrouter.ai/]를 사용하여 강력한 모델 선택을 제공합니다. 앞으로는 다른 LLM 공급업체를 직접 지원하는 것이 도움이 될 것입니다.
--dbfile
: 웹 스크랩 및 LLM 사용에 대한 증분 데이터를 저장하는 데 사용되는 SQLite 데이터베이스의 파일 이름입니다. perspectv
기본적으로 동일한 작업을 다시 수행하지 않습니다. 데이터베이스를 삭제하거나 새 파일을 사용하면 다시 시작됩니다.
--model-extract
: 웹 페이지 추출에 사용되는 OpenRouter 모델 이름을 재정의합니다. 이는 합리적인 추출 성능을 갖춘 저비용 모델이어야 합니다(많은 모델이 이를 허용할 수 있음).
--model-report
: 보고서 생성에 사용되는 OpenRouter 모델 이름을 재정의합니다. 이는 대규모 컨텍스트 모델이어야 합니다. 기본값인 anthropic/claude-3-opus
상대적으로 비싸지만 성능이 좋고 100만 개의 토큰 컨텍스트 창이 있습니다.