Blue Sky Collector é um software rastreador gratuito de coleta e publicação de dados. Ele é desenvolvido usando php + mysql. Ele pode ser implantado em um servidor em nuvem. Ele pode coletar quase todos os tipos de páginas da web, conectar-se perfeitamente a vários programas de construção de sites CMS. publique dados em tempo real sem fazer login. Automaticamente, sem intervenção manual! É um sistema rastreador de nuvem totalmente multiplataforma em software de coleta de big data da web.
Recursos do coletor de céu azul:
SkyCaiji, um sistema web crawler, é desenvolvido usando PHP + Mysql. Ele pode ser implantado em servidores em nuvem e hosts virtuais, e os dados podem ser coletados usando um navegador. O software é gratuito para uso ilimitado e regras e plug-ins podem ser personalizados.
Coleta de dados:
Ele suporta coleta de vários níveis, várias páginas e paginação e regras de coleta personalizadas (suporta expressões regulares, XPATH, JSON, etc.) para corresponder com precisão a qualquer fluxo de informações. Ele pode coletar quase todos os tipos de páginas da web e o conteúdo. da maioria dos tipos de artigos podem ser identificados de forma inteligente.
Liberação de conteúdo:
Conecta-se perfeitamente a vários programas de construção de sites CMS para importar dados sem fazer login. Ele suporta plug-ins de publicação de dados personalizados. Também pode ser importado diretamente para o banco de dados, armazenado como arquivos Excel, publicação remota de API, etc.
Implantação e automação em nuvem:
Este software é semelhante a um programa CMS, totalmente multiplataforma, pode ser instalado em qualquer sistema e também pode funcionar bem em um host virtual. Realize a coleta e liberação cronometrada e quantitativa totalmente automática, e a operação simples pode alcançar a coleta contínua!