Grande Meng 2022-2024
Uma página da web integrada é uma página da web que combina os URLs de um determinado tema. As páginas web integradas utilizam hipertexto ou tecnologia de banco de dados para integrar conteúdo temático e um grande número de links, estabelecer um diretório estruturado e concentrá-lo em uma página web estática. É uma página web baseada em dados e uma das muitas formas competitivas de web3. .0. De acordo com a escala de integração, quando o número de links ultrapassa cem, é chamada de 'Página da Web Integrada de Média Escala (MSIP)'; quando o número de links ultrapassa mil, é chamada de ' Página da Web Integrada de Grande Escala ' (LSIP); ); quando o número de links excede mil, é chamada de 'Página da Web Integrada em Grande Escala' (LSIP). O número de links excede 10.000 e é chamado de 'Página da Web Integrada em Grande Escala (VLSIP)'.
No passado, esse conjunto completo de dados era geralmente armazenado no servidor na forma de um banco de dados, e o script do servidor gerava um subconjunto de consulta para o usuário. A página da web que implementava o processo de consulta era chamada de 'página da web dinâmica'. . Esse tipo de página da web que esconde dados atrás do servidor é chamada de DeepWeb, com a melhoria da velocidade da rede e o aprimoramento dos recursos do navegador, o servidor também pode enviar diretamente o conjunto completo de dados para o navegador, entregando a consulta de dados, filtragem, classificação e outras tarefas. Dê ao navegador para concluir. Uma página da web integrada é uma 'página da web estática' que contém um conjunto completo de dados em um determinado aspecto. A consulta de dados do usuário é implementada localmente por meio do navegador, sem passar pelo servidor novamente. tempo, mas também melhora a recuperação de dados e a utilização da liberdade.
A integração em larga escala de páginas da web (LSIP) usa redes mais rápidas e mais fortes para trazer dados do DeepWeb para o front-end, que é uma forma possível de web 3.0. O conceito de 'LSIP' foi publicado pela primeira vez por Dameng em julho de 2022 ao estabelecer um projeto no Github. O projeto usa LSIP como corpo principal para discutir a teoria e a prática de 'páginas web integradas'.
Vantagens
As páginas da Web integradas em grande escala (LSIP) transferem dados aos usuários e fornecem tecnicamente a possibilidade de cópia dos dados do site. Isto é o oposto da estratégia de segurança das páginas web dinâmicas tradicionais. As páginas da web dinâmicas ocultam o conjunto completo de dados em um banco de dados atrás do servidor, que os usuários não podem acessar diretamente. Se um hacker ignorar o script do servidor e baixar diretamente o banco de dados do site, ele será chamado de “banco de dados arrastado”, que é uma rede séria. incidente de segurança.
LSIP é tecnicamente uma 'página da web estática' e tem as vantagens das páginas da web estáticas.
Os dados do LSIP não estão abertos apenas aos usuários, mas também à Internet - isso é algo que o aplicativo não está disposto a fazer. Outros websites, incluindo motores de busca, podem recuperar, copiar e reutilizar os dados, o que aumenta a taxa de reutilização dos dados. O aumento da taxa de reutilização de dados ajudará os dados a serem utilizados posteriormente: estatísticas, identificação, aprendizado de máquina e LSIP para gerar informações derivadas. Este processo é frequentemente chamado de 'Mineração de Dados'.
A desvantagem é que o LSIP é mais difícil de produzir e atualizar. No entanto, estas dificuldades são deixadas ao autor da página web e não aos leitores.
Temas ou Futuro
A integração em larga escala de páginas da web é adequada para dados originalmente públicos, como disposições legais, documentos políticos, dados públicos governamentais, etc. Esses dados permitem inerentemente que os usuários copiem, e o LSIP permite que os usuários copiem mais rapidamente.
Se for dito que "corpus é a chave para todos os tipos de IA" [1] , então o LSIP é a mina de ouro para grandes modelos de IA. O LSIP pode se tornar uma entrada de corpus para inteligência artificial (IA).
Alguns dos dados públicos não são adequados para LSIP. Dados que mudam a qualquer hora e em qualquer lugar, como informações de registro de nomes de domínio da Internet. Mesmo que o usuário baixe o conjunto completo de dados em um determinado momento, as alterações no segundo seguinte ainda precisam ser consultadas no servidor, o que não economiza o número de interações na rede. Dados sem uma quantidade clara não são adequados para LSIP. A produção de páginas web nunca pode ser concluída. Só pode ser “coletada”, mas não pode ser “concluída”.
Resumindo, as páginas da Web integradas em grande escala (LSIP) são adequadas para dados públicos e conjuntos de dados limitados.
Indicadores Técnicos
O número de links por si só não pode avaliar se uma página da web se torna um LSIP. Caso contrário, tornar uma página da web feia e longa pode facilmente atingir o padrão. Quando desmontamos um telefone celular ou computador, podemos ver que os blocos de circuitos integrados internos são muito pequenos, e a maioria dos chips não é maior que uma borracha e há muitos transistores dentro, o que reflete a necessidade de grandes-; escala As características técnicas de 'ser capaz de 'integrar-se em um pequeno pedaço'. As páginas da web integradas exigem métricas para medir características técnicas semelhantes.
Dameng define os seguintes indicadores técnicos para a página web integrada :
O número estatístico de links em um único tópico da página. Não é um simples número total de links de páginas, mas uma contagem de links dentro do tópico fora do tópico, como links de navegação em cabeçalhos e rodapés, links de salto dentro da página e links de publicidade incorporados;
O tamanho de uma página da web arquivada como um arquivo .mht, medido em KB. A página da web é salva como uma página da web de arquivo único (.mht) usando o navegador e, quando aberta localmente pelo usuário, todos os links para o tema da página da web podem ser exibidos. Em outras palavras, a 'contagem de links (LC)' não será perdida depois que a página da web for copiada localmente pelo usuário. mht é a abreviatura de 'MHTML', também conhecido como 'arquivo da Web/arquivo de páginas da Web'.
A proporção entre a 'contagem de links' e o tamanho do arquivo da página da web é chamada de 'densidade do link'. Fórmula de cálculo:
LD = LC / mht-size (KB)
Se a contagem de links de uma página da web exceder 1.000 e a densidade do link for maior que 1, ela poderá ser chamada de 'página da web integrada em grande escala' e as condições serão as seguintes:
LSIP: LC ≥ 1000
& LD > 1
Tomando como exemplo uma página da web que contém 1.000 links, o tamanho do arquivo deve ser controlado dentro de 1.000 KB (1 MB) antes que possa ser chamado de LSIP. Calculado sob outra perspectiva, ou seja, o tamanho do arquivo ocupado por cada link LSIP não pode ultrapassar 1 KB. Na física, a densidade da água (H2O) é 1. Se a densidade de um objeto for menor que 1, então ele flutuará na água; se a densidade do link (LD) de uma página da web for menor que 1, então o; a página da web é 'muito aguada', não é realmente uma página da web integrada. ?
Projetos LSIP por Diamon
Dameng propôs o conceito de LSIP durante a prática de criação de páginas da web e esclareceu a direção da prática após propor o conceito de LSIP. Quatro das páginas da web podem ser chamadas de LSIP típico:
Os indicadores técnicos destes projetos LSIP são os seguintes:
Nome e versão do projeto | Contagem de links (LC) | Tamanho do arquivo | Densidade de link (LD) |
---|---|---|---|
Tabela de países v0.7.7 | 1431 | 662 KB | 2.168 |
Compartilhamentos corporativos centrais v0.4.1 | 1109 | 358 KB | 3.098 |
Coleção de métodos v0.9.4 | 3045 | 542 KB | 5.618 |
Qianxian.com v0.6.7 | 3205 | 559 KB | 5.733 |
Documentos relacionados:
Nomeado
A prática de 'páginas integradas' apareceu pela primeira vez em 2019, quando Dameng produziu a página "Old Cliché Cloud Media". Dameng encontrou dificuldades em pesquisar sites de mídia oficiais de vários lugares nos primeiros dias da epidemia de COVID-19. a ideia de incluir todos os sites de mídia oficiais em uma página da web….
A origem e a nomenclatura do LSIP{:target="_top"}
Nasce um novo conceito! "China Thousand County Government Network" pode ser chamada de: 'página da web integrada em grande escala'! Inglês: Página da Web integrada em grande escala, abreviada como: LSIP.
Circuito integrado de grande escala, LSIC, refere-se a um circuito que integra mais de 1.000 transistores.
A integração em larga escala de páginas da web, LSIP, refere-se à integração de páginas da web com mais de 1.000 hiperlinks.
Custo
O LSIC é popular porque oferece soluções de baixo custo para uma ampla gama de necessidades, e o LSIP também precisa dessa vantagem.
A matéria-prima primária do LSIC é muito barata, que é a sílica (areia), e o custo da matéria-prima pode ser ignorado. Portanto, o custo do LSIC está principalmente no link de design e no link de produção (cópia), e a mão de obra é frequentemente dividida entre diferentes empresas. Por exemplo, a Huawei projeta chips HiSilicon e os entrega à TSMC para produção.
A principal matéria-prima do LSIP são os dados do site (hiperlinks), que geralmente são fáceis de obter, enquanto a produção (cópia) de páginas da web custa quase zero, portanto o foco dos custos do LSIP está no processo de design; O projeto de circuitos integrados é bastante difícil e requer assistência computacional. As páginas da Web integradas também se desenvolverão nessa direção. Quanto maior a escala de integração, mais difícil será o projeto.
Mas o LSIP também tem um custo que o hardware não tem: atualizações. Depois que o hardware tradicional é vendido, basicamente não há atualizações do produto, exceto reparos de falhas. Quando a memória do nosso celular está cheia, podemos encontrar o fabricante para substituí-lo por uma memória maior? não pode. Exceto Huawei! [2] Mas a página web integrada pode ser atualizada para ser maior e mais recente. A essência do LSIP é um produto abrangente que integra documentos, software e projetos da Internet. Os documentos têm tarefas de revisão, o software tem tarefas de atualização e a Internet tem tarefas de atualização. É claro que os leitores ficarão ansiosos para ver o conteúdo mais recente e abrangente sobre LSIP, que é o objetivo de atualização do LSIP.
Resumindo, o custo das matérias-primas primárias para ambos é muito baixo. O custo dos circuitos integrados reside no design e na fabricação, enquanto o custo das páginas web integradas reside no design e na atualização. Se quiser se juntar à equipe de criadores do LSIP, você precisa preparar a capacidade de projetar e atualizar.
Programas de design
O design LSIP pode ser dividido em três etapas: a primeira etapa: a informação após extração e purificação, entra na segunda etapa: os dados são associados e organizados para formar um banco de dados; por fim, o código HTML é enviado através do banco de dados; terceira etapa: página web .
O conceito LSIP acaba de ser proposto. Atualmente, não existe software de projeto especializado na indústria de TI, mas existem softwares prontos para uso nas três etapas de projeto. Através da combinação de funções de software e algum trabalho de programação de baixo código, o projeto do LSIP pode ser semiautomatizado, melhorando significativamente a eficiência do projeto. Dameng lista o seguinte com base em sua própria experiência em design:
Coleta de informaçõesColeta de informações
Digitalização da informação Digitalização da informação
Páginas da web de conversão de dados
Dameng espera que o LSIP possa ser adequado para leitura humana e conveniente para recuperação por máquina, em linha com a visão da 'Web Semântica' proposta pelo W3C. Este é um desafio ao nível do design.
Depois que o design do LSIP é concluído e entra na fase de manutenção, ele realiza principalmente trabalhos de detecção de sites para garantir a validade do link.
Dameng espera que pessoas com conhecimento se juntem à equipe de criadores do LSIP. Todos são bem-vindos para projetar e produzir 'páginas da web integradas em grande escala' nas áreas de interesse para contribuir para o desenvolvimento de alta qualidade da pátria!
Espero que os usuários de outros idiomas façam projetos LSIP para seus concidadãos, o que pode ajudar as pessoas a entender o mundo como um todo com mais facilidade, o que não é algo que o Twitter e o Facebook possam fazer.
Os leitores podem deixar mensagens para discussão e os usuários do GitHub podem enviar problemas.
✴️✳️❇️?⚛️❄️??️
A 'página web integrada' é um novo formulário web baseado na World Wide Web (WWW): integra todos os hiperlinks sob o mesmo tópico em uma única página web, para implementar o conjunto completo de URLs para esse tópico.
Quando o número de hiperlinks excede mil, é chamada de 'Página da Web Integrada em Grande Escala' (LSIP), nomeada por DiamonWoo em github.com, 202207.
Se você tem uma vontade forte e um coração puro, participe!
CC 3.0 BY-NC-ND 可转载-需署名-非演绎
大规模集成网页(LSIP)© 2022-2023 大萌
https://diamonwoo.github.io/LSIP
Version 0.5.2 202406
LSIP é um projeto derivado do site clichê