A versão geral do sistema de coleta de dados do site Yide é um sistema que coleta dados de sites selecionados escrevendo ou baixando regras. Ele pode coletar dados da maioria dos sites e salvar arquivos de imagem. É uma ferramenta de coleta de dados indispensável para a construção de sites. Além disso, o coletor é um código-fonte aberto com anotações em chinês, facilitando a modificação e o aprendizado. O sistema de coleta possui as seguintes características: Linguagem Mainstream - escrita em php+mysql, basta instalar o servidor correspondente. Código totalmente aberto - código-fonte aberto, e o código possui comentários em chinês para facilitar o gerenciamento, o aprendizado e a comunicação. Personalização de regras - as regras de coleta podem ser personalizadas e a maior parte do conteúdo do site pode ser coletada. Modificação de dados - Personalize regras de modificação e otimize o conteúdo dos dados. Economia de dados - Em formato de array, os dados serializados são salvos em arquivos ou bancos de dados para facilitar o upload e a chamada. Leitura de imagens - pode ler imagens de conteúdo e salvá-las localmente. Controle de codificação - Converta a codificação, você pode salvar gb2312, gbk e outras codificações em utf-8. Limpeza de tags - você pode personalizar as tags retidas e limpar tags desnecessárias. Desempenho de segurança - A leitura é controlada por senha e a leitura remota também é segura. Operação simples - operação de leitura com um clique, você pode ler em grupos de acordo com as regras ou ler especificando um ID de regra e ler com um único ID. Agrupamento de regras - Leia os dados de acordo com os grupos de regras e atualize os dados coletados em tempo hábil. Leitura personalizada - leitura de dados de acordo com IDs de regras personalizadas, o que é mais eficaz e oportuno. Leitura JS - Use js para controlar o tempo de leitura e reduzir a carga do servidor. Controle de tempo limite - O tempo de execução da página pode ser definido para reduzir erros de tempo limite. Leituras múltiplas - Você pode definir vários controles de leitura para páginas da web para ler dados com mais eficiência. Controle de erros - Se ocorrerem erros várias vezes, a leitura poderá ser interrompida para reduzir o uso de recursos do servidor. Controle de carga - Salve dados em várias pastas, o que pode resolver efetivamente a carga do servidor em vários arquivos. Modificação de dados - você não só pode navegar pelos dados, mas também modificar os dados principais. Análise de regras - Você pode compartilhar suas regras com outras pessoas para que mais pessoas possam usá-las. Download de regras - Baixe regras de compartilhamento e obtenha rapidamente o conteúdo que você precisa.
Expandir