Gran Meng 2022-2024
Una página web integrada es una página web que combina las URL de un tema determinado. Las páginas web integradas utilizan tecnología de hipertexto o base de datos para integrar contenido temático y una gran cantidad de enlaces, establecer un directorio estructurado y concentrarlo en una página web estática. Es una página web basada en datos y una de las muchas formas competitivas de web3. .0. Según la escala de integración, cuando el número de enlaces supera los cien, se denomina 'Página Web Integrada de Mediana Escala (MSIP)'; cuando el número de enlaces supera los mil, se denomina ' Página Web Integrada de Gran Escala ' (LSIP); ); cuando el número de enlaces supera los mil, se denomina 'Página web integrada a gran escala' (LSIP). El número de enlaces supera los 10.000 y se denomina 'Página web integrada a muy gran escala (VLSIP)';
En el pasado, este conjunto completo de datos generalmente se almacenaba en el servidor en forma de base de datos y el script del servidor enviaba un subconjunto de consultas al usuario. La página web que implementaba el proceso de consulta se denominaba "página web dinámica". . Este tipo de página web que oculta datos detrás del servidor se llama DeepWeb; con la mejora de la velocidad de la red y la mejora de las capacidades del navegador, el servidor también puede enviar directamente el conjunto completo de datos al navegador, entregando consultas y filtrado de datos. clasificación y otras tareas. Entréguelo al navegador para que lo complete. Una página web integrada es una 'página web estática' que contiene un conjunto completo de datos en un determinado aspecto. La consulta de datos del usuario se implementa localmente a través del navegador sin pasar por el servidor nuevamente. Esto no solo ahorra la cantidad de interacciones de la red. tiempo, pero también mejora la recuperación de datos y la utilización de la libertad.
La integración a gran escala de páginas web (LSIP) utiliza redes más rápidas y potentes para llevar los datos de DeepWeb al front-end, que es una posible forma de web 3.0. Dameng publicó por primera vez el concepto de 'LSIP' en julio de 2022 mediante el establecimiento de un proyecto en Github. El proyecto utiliza LSIP como cuerpo principal para discutir la teoría y la práctica de las 'páginas web integradas'.
Ventajas
Las páginas web integradas a gran escala (LSIP) transfieren datos a los usuarios y técnicamente ofrecen la posibilidad de copiar datos del sitio web. Esto es lo opuesto a la estrategia de seguridad de las páginas web dinámicas tradicionales. Las páginas web dinámicas ocultan el conjunto completo de datos en una base de datos detrás del servidor, a la que los usuarios no pueden acceder directamente. Si un pirata informático omite el script del servidor y descarga directamente la base de datos del sitio web, se denomina "base de datos arrastrada", que es una red seria. incidente de seguridad.
LSIP es técnicamente una "página web estática" y tiene las ventajas de las páginas web estáticas.
Los datos de LSIP no sólo están abiertos a los usuarios, sino también a Internet; esto es algo que la aplicación no está dispuesta a hacer. Otros sitios web, incluidos los motores de búsqueda, pueden recuperar, copiar y reutilizar los datos, lo que aumenta la tasa de reutilización de los datos. La mayor tasa de reutilización de datos ayudará a que los datos se utilicen más: estadísticas, identificación, aprendizaje automático y LSIP para generar información derivada. Este proceso a menudo se denomina "minería de datos".
La desventaja es que LSIP es más difícil de producir y actualizar. Sin embargo, estas dificultades quedan en manos del autor de la página web y no de los lectores.
Temas o futuro
La integración a gran escala de páginas web es adecuada para datos originalmente públicos, como disposiciones legales, documentos de políticas, datos públicos gubernamentales, etc. Estos datos inherentemente permiten a los usuarios copiar, y LSIP les permite copiar más rápido.
Si se dice que "el corpus es la clave para todo tipo de IA" [1] , entonces LSIP es la mina de oro para los grandes modelos de IA. LSIP puede convertirse en una entrada de corpus para la inteligencia artificial (IA).
Algunos de los datos públicos no son adecuados para LSIP. Datos que cambian en cualquier momento y lugar, como la información de registro de nombres de dominio de Internet. Incluso si el usuario descarga el conjunto completo de datos en un momento determinado, los cambios en el segundo siguiente aún deben consultarse en el servidor, lo que no guarda la cantidad de interacciones de la red. Los datos sin una cantidad clara no son adecuados para LSIP. La producción de páginas web nunca se puede completar. Sólo se puede "recopilar" pero no se puede "completar".
En resumen, las páginas web integradas a gran escala (LSIP) son adecuadas para datos públicos y datos de conjuntos limitados.
Indicadores Técnicos
La cantidad de enlaces por sí sola no puede evaluar si una página web se convierte en un LSIP. De lo contrario, hacer que una página web sea fea y larga puede alcanzar fácilmente el estándar. Cuando desmontamos un teléfono móvil o una computadora, podemos ver que los bloques de circuitos integrados en su interior son muy pequeños, y la mayoría de los chips no son más grandes que un borrador y hay muchos transistores en su interior, lo que refleja la necesidad de grandes cantidades; escala Las características técnicas de "poder integrarse en una pieza pequeña". Las páginas web integradas requieren métricas para medir características técnicas similares.
Dameng establece los siguientes indicadores técnicos para la página web integrada :
El número estadístico de enlaces bajo un solo tema en la página. No se trata de un simple número total de enlaces a la página, sino de un recuento de enlaces dentro del tema; se deben excluir los enlaces fuera del tema, como los enlaces de navegación en encabezados y pies de página, los enlaces de salto dentro de la página y los enlaces publicitarios integrados.
El tamaño de una página web archivada como archivo .mht, medido en KB. La página web se guarda como una página web de un solo archivo (.mht) utilizando el navegador y, cuando el usuario la abre localmente, se pueden mostrar todos los enlaces al tema de la página web. En otras palabras, el 'recuento de enlaces (LC)' no se perderá después de que el usuario copie localmente la página web. mht es la abreviatura de 'MHTML', también conocido como 'archivo web/archivo de página web'.
La relación entre el "recuento de enlaces" y el tamaño del archivo de la página web se denomina "densidad de enlaces". Fórmula de cálculo:
LD = LC / mht-size (KB)
Si el número de enlaces de una página web supera los 1000 y la densidad de enlaces es superior a 1, se la puede denominar "página web integrada a gran escala" y las condiciones son las siguientes:
LSIP: LC ≥ 1000
& LD > 1
Tomando como ejemplo una página web que contiene 1000 enlaces, el tamaño del archivo debe controlarse dentro de 1000 KB (1 MB) antes de que pueda denominarse LSIP. Calculado desde otra perspectiva, es decir, el tamaño del archivo ocupado por cada enlace LSIP no puede exceder 1 KB. En física, la densidad del agua (H2O) es 1. Si la densidad de un objeto es menor que 1, entonces flotará en el agua; si la densidad de enlaces (LD) de una página web es menor que 1, entonces; La página web es "demasiado acuosa", no es realmente una página web integrada. ?
Proyectos LSIP de Diamon
Dameng propuso el concepto de LSIP durante la práctica de creación de páginas web y aclaró la dirección de la práctica después de proponer el concepto de LSIP. Cuatro de las páginas web pueden denominarse LSIP típico:
Los indicadores técnicos de estos proyectos LSIP son los siguientes:
Nombre y versión del proyecto | Recuento de enlaces (LC) | Tamaño del archivo | Densidad de enlace (LD) |
---|---|---|---|
Tabla de países v0.7.7 | 1431 | 662KB | 2.168 |
Acciones empresariales centrales v0.4.1 | 1109 | 358KB | 3.098 |
Colección de métodos v0.9.4 | 3045 | 542KB | 5.618 |
Qianxian.com v0.6.7 | 3205 | 559KB | 5.733 |
Documentos relacionados:
Nombrado
La práctica de las 'páginas web integradas' apareció por primera vez en 2019 cuando Dameng produjo la página web "Old Cliché Cloud Media" Dameng encontró dificultades para buscar sitios web de medios oficiales desde varios lugares en los primeros días de la epidemia de COVID-19, por lo que se le ocurrió. la idea de incluir todos los sitios web oficiales de los medios Ideas en una página web…
El origen y denominación de LSIP{:target="_top"}
¡Nace un nuevo concepto! La "Red de Gobierno de los Mil Condados de China" se puede llamar: ¡'página web integrada a gran escala'! Inglés: Página web integrada a gran escala, abreviada como: LSIP.
Circuito integrado a gran escala, LSIC, se refiere a un circuito que integra más de 1.000 transistores.
La integración a gran escala de páginas web, LSIP, se refiere a la integración de páginas web con más de 1000 hipervínculos.
Costo
LSIC es popular porque proporciona soluciones de bajo costo para una amplia gama de necesidades y LSIP también necesita esta ventaja.
La materia prima principal de LSIC es muy barata, que es la sílice (arena), y el costo de la materia prima puede ignorarse. Por lo tanto, el costo de LSIC se encuentra principalmente en el eslabón de diseño y el eslabón de producción (copia), y la mano de obra a menudo se divide entre diferentes empresas. Por ejemplo, Huawei diseña chips HiSilicon y los entrega a TSMC para su producción.
La materia prima principal de LSIP son los datos del sitio web (hipervínculos), que generalmente son fáciles de obtener, mientras que la producción (copia) de páginas web cuesta casi cero, por lo que el foco de los costos de LSIP reside en el proceso de diseño; El diseño de circuitos integrados es bastante difícil y requiere asistencia informática. Las páginas web integradas también se desarrollarán en esta dirección. Cuanto mayor sea la escala de integración, más difícil será el diseño.
Pero LSIP también tiene un coste que el hardware no tiene: las actualizaciones. Después de vender el hardware tradicional, básicamente no hay actualizaciones de productos excepto para reparar fallas. Cuando la memoria de nuestro teléfono móvil está llena, ¿podemos encontrar un fabricante que la reemplace con una memoria más grande? no puedo. ¡Excepto Huawei! [2] Pero la página web integrada se puede actualizar para que sea más grande y más nueva. La esencia de LSIP es un producto integral que integra documentos, software y proyectos de Internet. Los documentos tienen tareas de revisión, el software tiene tareas de actualización e Internet tiene tareas de actualización. Diferentes campos tienen opiniones diferentes sobre el mantenimiento posterior del producto. Por supuesto, los lectores esperarán ver el contenido más reciente y completo sobre LSIP, que es el objetivo de actualización de LSIP.
En resumen, el costo de las materias primas primarias para ambos es muy bajo. El costo de los circuitos integrados radica en el diseño y la fabricación, mientras que el costo de las páginas web integradas radica en el diseño y la actualización. Si desea unirse al equipo creador de LSIP, debe preparar la capacidad de diseñar y actualizar.
Software de diseño
El diseño de LSIP se puede dividir en tres etapas: la primera etapa: información ; después de la extracción y purificación, ingresa a la segunda etapa: los datos se asocian y organizan para formar una base de datos, finalmente, el código HTML se envía a la base de datos; Tercera etapa: página web .
El concepto LSIP acaba de ser propuesto. Actualmente, no existe ningún software de diseño especializado en la industria de TI, pero sí hay software listo para usar para las tres etapas de diseño. Mediante la combinación de funciones de software y algunos trabajos de programación de código bajo, el diseño de LSIP puede ser semiautomatizado, lo que mejora en gran medida la eficiencia del diseño. Dameng enumera lo siguiente basándose en su propia experiencia en diseño:
Recopilación de informaciónRecopilación de información
Digitalización de la información Digitalización de la información
Páginas web de conversión de datos.
Dameng espera que LSIP pueda ser adecuado para la lectura humana y conveniente para la recuperación por máquinas, en línea con la visión de la 'Web Semántica' propuesta por el W3C. Este es un desafío al nivel de diseño.
Una vez que se completa el diseño de LSIP y entra en la fase de mantenimiento, realiza principalmente trabajos de detección de sitios web para garantizar la validez del enlace.
Dameng espera que personas con conocimientos se unan al equipo de creadores de LSIP. ¡Todos son bienvenidos a diseñar y producir "páginas web integradas a gran escala" en los campos de interés para contribuir al desarrollo de alta calidad de la patria!
Espero que los usuarios de otros idiomas creen proyectos LSIP para sus conciudadanos, que puedan ayudar a las personas a comprender el mundo en su conjunto más fácilmente, algo que Twitter y Facebook no pueden hacer.
Los lectores pueden dejar mensajes para debatir y los usuarios de github pueden enviar problemas.
✴️✳️❇️?⚛️❄️??️
La 'página web integrada' es un nuevo formulario web basado en la World Wide Web (WWW): integra todos los hipervínculos bajo el mismo tema en una sola página web, para implementar el conjunto completo de URL para ese tema.
Cuando el número de hipervínculos supera los mil, se denomina 'Página web integrada a gran escala' (LSIP), nombrada por DiamonWoo en github.com, 202207.
Si tienes una voluntad fuerte y un corazón puro, ¡únete!
CC 3.0 BY-NC-ND 可转载-需署名-非演绎
大规模集成网页(LSIP)© 2022-2023 大萌
https://diamonwoo.github.io/LSIP
Version 0.5.2 202406
LSIP es un proyecto derivado del sitio web cliché