Browsertrix é um serviço de rastreamento nativo da nuvem, de alta fidelidade e baseado em navegador, projetado para tornar o arquivamento da web mais fácil e acessível para todos.
O serviço fornece uma API e UI para agendar rastreamentos e visualizar resultados, além de gerenciar todos os aspectos do processo de rastreamento. Este sistema fornece orquestração e gerenciamento em torno do rastreamento, enquanto o rastreamento real é executado usando contêineres Browsertrix Crawler, que são iniciados para cada rastreamento.
Consulte webrecorder.net/browsertrix para obter uma visão geral dos recursos e informações sobre como se inscrever no serviço Browsertrix hospedado do Webrecorder.
A documentação completa para usar, implantar e desenvolver o Browsertrix está disponível em docs.browsertrix.com.
Nossos documentos são criados com Material for MKDocs.
A documentação de implantação mais recente está disponível em docs.browsertrix.com/deploy.
Os documentos cobrem a implantação do Browsertrix em diferentes ambientes usando Kubernetes, desde uma configuração de nó único até clusters escalonáveis na nuvem.
No início, o Browsertrix também suportava Docker Compose e implantação baseada em podman. Isso foi descontinuado devido à complexidade de manter a paridade de recursos em diferentes configurações e com várias opções de implantação do Kubernetes disponíveis e fáceis de implantar, mesmo em uma única máquina.
Tornar a implantação do Browsertrix o mais fácil possível continua sendo um objetivo importante e agradecemos sugestões sobre como podemos melhorar ainda mais nossas opções de implantação do Kubernetes.
Se você deseja apenas tentar executar um único rastreamento, experimente primeiro o Browsertrix Crawler para testar os recursos de rastreamento.
Embora o sistema e a API de back-end sejam bastante estáveis, estamos trabalhando em muitos recursos adicionais. Consulte os problemas do GitHub e este projeto GitHub para nosso plano e tarefas de projeto atuais.
Guias para começar com o desenvolvimento local estão disponíveis em docs.browsertrix.com/develop.
Usamos o Weblate para gerenciar contribuições de tradução.
Browsertrix é disponibilizado sob a licença AGPLv3.
A documentação é disponibilizada sob a Licença Creative Commons Atribuição 4.0 Internacional