Browsertrix — это облачная, высокоточная служба сканирования на основе браузера, призванная сделать веб-архивирование проще и доступнее для всех.
Служба предоставляет API и пользовательский интерфейс для планирования сканирования и просмотра результатов, а также управления всеми аспектами процесса сканирования. Эта система обеспечивает оркестрацию и управление сканированием, при этом фактическое сканирование выполняется с помощью контейнеров Browsertrix Crawler, которые запускаются при каждом сканировании.
См. webrecorder.net/browsertrix для обзора функций и информации о том, как подписаться на службу Browsertrix, размещенную на Webrecorder.
Полная документация по использованию, развертыванию и разработке Browsertrix доступна на docs.browsertrix.com.
Наши документы созданы с помощью Material for MKDocs.
Последняя версия документации по развертыванию доступна по адресу docs.browsertrix.com/deploy.
Документы охватывают развертывание Browsertrix в различных средах с использованием Kubernetes: от установки с одним узлом до масштабируемых кластеров в облаке.
Вначале Browsertrix также поддерживал Docker Compose и развертывание на основе podman. Это было устаревшим из-за сложности поддержания паритета функций в различных конфигурациях, а также из-за того, что различные варианты развертывания Kubernetes доступны и просты в развертывании даже на одной машине.
Ключевой целью остается максимально простое развертывание Browsertrix, и мы приветствуем предложения по дальнейшему улучшению наших вариантов развертывания Kubernetes.
Если вы хотите просто попробовать запустить одно сканирование, вы можете сначала попробовать Browsertrix Crawler, чтобы проверить возможности сканирования.
Хотя система и серверный API достаточно стабильны, мы работаем над многими дополнительными функциями. Пожалуйста, ознакомьтесь с проблемами GitHub и этим проектом GitHub, чтобы узнать о нашем текущем плане проекта и задачах.
Руководства по началу локальной разработки доступны по адресу docs.browsertrix.com/develop.
Мы используем Weblate для управления переводами.
Browsertrix доступен по лицензии AGPLv3.
Документация доступна по международной лицензии Creative Commons Attribution 4.0.