Большой Мэн 2022-2024 гг.
Интегрированная веб-страница — это веб-страница , объединяющая URL-адреса определенной темы. Интегрированные веб-страницы используют гипертекст или технологию баз данных для интеграции тематического контента и большого количества ссылок, создания структурированного каталога и концентрации его на статической веб-странице. Это веб-страница, основанная на данных, и одна из многих конкурентоспособных форм веб3. .0. В соответствии с масштабом интеграции, когда количество ссылок превышает сто, это называется «Интегрированная веб-страница среднего масштаба (MSIP)», когда количество ссылок превышает одну тысячу, это называется « Интегрированная веб-страница большого размера » (LSIP); ); когда количество ссылок превышает одну тысячу, это называется «Крупномасштабной интегрированной веб-страницей» (LSIP). Число ссылок превышает 10 000 и называется «Очень крупномасштабной интегрированной веб-страницей (VLSIP)».
Раньше этот полный набор данных обычно хранился на сервере в виде базы данных, и серверный сценарий выдавал пользователю подмножество запроса. Веб-страница, реализующая процесс запроса, называлась «динамической веб-страницей». . Этот тип веб-страницы, которая скрывает данные за сервером, называется DeepWeb. С улучшением скорости сети и расширением возможностей браузера сервер также может напрямую отправлять полный набор данных в браузер, передавая запрос данных, фильтруя и сортировка и другие задачи. Отдайте его браузеру для выполнения. Интегрированная веб-страница — это «статическая веб-страница», которая содержит полный набор данных в определенном аспекте. Запрос данных пользователя осуществляется локально через браузер без повторного прохождения через сервер. время, но также улучшает поиск данных и использование свободы.
Крупномасштабная интеграция веб-страниц (LSIP) использует более быстрые и надежные сети для передачи данных DeepWeb на внешний интерфейс, что является возможной формой Интернета 3.0. Концепция «LSIP» была впервые опубликована Dameng в июле 2022 года при создании проекта на Github. Проект использует LSIP в качестве основного органа для обсуждения теории и практики «интегрированных веб-страниц».
Преимущества
Крупномасштабные интегрированные веб-страницы (LSIP) передают данные пользователям и технически обеспечивают возможность копирования данных веб-сайта. Это противоположность стратегии безопасности традиционных динамических веб-страниц. Динамические веб-страницы скрывают полный набор данных в базе данных за сервером, к которой пользователи не могут получить прямой доступ. Если хакер обходит серверный скрипт и напрямую загружает базу данных веб-сайта, это называется «перетаскиваемой базой данных», что представляет собой серьезную сеть. инцидент безопасности.
LSIP технически является «статической веб-страницей» и обладает преимуществами статических веб-страниц.
Данные LSIP открыты не только для пользователей, но и для Интернета — приложение не желает этого делать. Другие веб-сайты, включая поисковые системы, могут извлекать, копировать и повторно использовать данные, что увеличивает частоту повторного использования данных. Повышенная частота повторного использования данных поможет их дальнейшему использованию: в статистике, идентификации, машинном обучении и LSIP для генерации производной информации. Этот процесс часто называют «Интеллектуальным анализом данных».
Недостаток заключается в том, что LSIP сложнее создавать и обновлять. Однако эти трудности остаются на усмотрение автора веб-страницы, а не читателей.
Темы или будущее
Крупномасштабная интеграция веб-страниц подходит для первоначально общедоступных данных, таких как законодательные положения, политические документы, государственные публичные данные и т. д. Эти данные по своей сути позволяют пользователям копировать, а LSIP позволяет пользователям копировать быстрее.
Если говорят, что «корпус — это ключ ко всем видам ИИ» [1] , то LSIP — это золотая жила для больших моделей ИИ. LSIP может стать записью в корпусе искусственного интеллекта (ИИ).
Некоторые общедоступные данные не подходят для LSIP. Данные, которые изменяются в любое время и в любом месте, например информация о регистрации доменного имени в Интернете. Даже если пользователь загрузит полный набор данных в определенный момент, изменения в следующую секунду все равно придется запрашивать на сервере, что не экономит количество сетевых взаимодействий. Данные без четкого количества не подходят для LSIP. Создание веб-страниц никогда не может быть завершено. Их можно только «собрать», но нельзя «завершить».
Подводя итог, можно сказать, что крупномасштабные интегрированные веб-страницы (LSIP) подходят для общедоступных данных и данных с ограниченным набором данных.
Технические индикаторы
Количество ссылок само по себе не может оценить, станет ли веб-страница LSIP. В противном случае, если сделать веб-страницу некрасивой и длинной, можно легко достичь стандарта. Когда мы разбираем мобильный телефон или компьютер, мы видим, что блоки интегральных схем внутри очень малы, а большинство микросхем размером не больше ластика, а внутри много транзисторов, что отражает необходимость в больших размерах; масштаб Технические характеристики «возможности интегрировать в небольшую деталь». Интегрированные веб-страницы требуют показателей для измерения аналогичных технических характеристик.
Dameng устанавливает следующие технические индикаторы для интегрированной веб-страницы :
Статистическое количество ссылок по одной теме на странице. Это не просто общее количество ссылок на страницы, а количество ссылок внутри темы; ссылки вне темы, такие как навигационные ссылки в верхних и нижних колонтитулах, ссылки перехода внутри страницы и встроенные рекламные ссылки, должны быть исключены.
Размер веб-страницы, заархивированной в виде файла .mht, измеряется в КБ. Веб-страница сохраняется в виде веб-страницы в виде одного файла (.mht) с помощью браузера, и при ее локальном открытии пользователем могут отображаться все ссылки на тему веб-страницы. Другими словами, «счетчик ссылок (LC)» не будет потерян после локального копирования веб-страницы пользователем. mht — это аббревиатура MHTML, также известная как «Веб-архив/архив веб-страниц».
Отношение количества ссылок к размеру архива веб-страницы называется «плотностью ссылок». Формула расчета:
LD = LC / mht-size (KB)
Если количество ссылок на веб-странице превышает 1000, а плотность ссылок превышает 1, ее можно назвать «крупномасштабной интегрированной веб-страницей», и условия следующие:
LSIP: LC ≥ 1000
& LD > 1
Если взять в качестве примера веб-страницу, содержащую 1000 ссылок, размер архива должен контролироваться в пределах 1000 КБ (1 МБ), прежде чем его можно будет назвать LSIP. Если подсчитать с другой точки зрения, то есть размер архива, занимаемый каждым каналом LSIP, не может превышать 1 КБ. В физике плотность воды (H2O) равна 1. Если плотность объекта меньше 1, то он будет плавать на воде; если плотность ссылок (LD) веб-страницы меньше 1, то веб-страница «слишком водянистая» и не является интегрированной веб-страницей. ?
Проекты LSIP от Diamon
Даменг предложил концепцию LSIP во время практики создания веб-страниц и уточнил направление практики после предложения концепции LSIP. Четыре веб-страницы можно назвать типичными LSIP:
Технические показатели этих проектов LSIP следующие:
Название и версия проекта | Количество ссылок (LC) | Размер архива | Плотность каналов (LD) |
---|---|---|---|
Таблица стран v0.7.7 | 1431 | 662 КБ | 2.168 |
Акции центрального предприятия v0.4.1 | 1109 | 358 КБ | 3.098 |
Коллекция методов v0.9.4 | 3045 | 542 КБ | 5,618 |
Qianxian.com v0.6.7 | 3205 | 559 КБ | 5.733 |
Сопутствующие документы:
Именованный
Практика «интегрированных веб-страниц» впервые появилась в 2019 году, когда Даменг создал веб-страницу «Старое клише Cloud Media». Даменг столкнулся с трудностями при поиске на официальных сайтах СМИ из разных мест в первые дни эпидемии COVID-19, поэтому он придумал. идея включения всех официальных медиа-сайтов на веб-странице…
Происхождение и название LSIP{:target="_top"}
Рождается новая концепция! «Правительственную сеть тысяч округов Китая» можно назвать «крупномасштабной интегрированной веб-страницей»! Русский: Крупномасштабная интегрированная веб-страница, сокращенно: LSIP.
Крупномасштабная интегральная схема, LSIC, представляет собой схему, объединяющую более 1000 транзисторов.
Крупномасштабная интеграция веб-страниц, LSIP, означает интеграцию веб-страниц с более чем 1000 гиперссылками.
Расходы
LSIC популярен, поскольку предоставляет недорогие решения для широкого спектра потребностей, и LSIP также нуждается в этом преимуществе.
Первичное сырье для LSIC очень дешевое, это кремнезем (песок), и стоимость сырья можно игнорировать. Таким образом, стоимость LSIC в основном приходится на звено проектирования и производство (копирование), а труд часто делится между разными компаниями. Например, Huawei разрабатывает чипы HiSilicon и передает их TSMC для производства.
Основным сырьем для LSIP являются данные веб-сайта (гиперссылки), которые обычно легко получить, тогда как производство (копирование) веб-страниц обходится практически нулевыми затратами, поэтому основное внимание в затратах на LSIP уделяется процессу проектирования. Проектирование интегральных схем довольно сложно и требует помощи компьютера. Интегрированные веб-страницы также будут развиваться в этом направлении. Чем больше масштаб интеграции, тем сложнее будет проектирование.
Но у LSIP также есть стоимость, которой нет у аппаратного обеспечения — обновления. После продажи традиционного оборудования обновления продукта практически не производятся, за исключением устранения неисправностей. Когда память нашего мобильного телефона заполнена, можем ли мы найти производителя, который заменит ее памятью большего размера? не могу. Кроме Хуавей! [2] Но интегрированную веб-страницу можно обновить, сделав ее больше и новее. Суть LSIP — комплексный продукт, объединяющий документы, программное обеспечение и интернет-проекты. У документов есть задачи проверки, у программного обеспечения — задачи обновления, а у Интернета — задачи обновления. В разных областях существуют разные мнения по поводу последующего обслуживания продукта. Читатели, конечно, будут с нетерпением ждать возможности увидеть новейшую и наиболее полную информацию о LSIP, что и является целью обновления LSIP.
Подводя итог, можно сказать, что стоимость первичного сырья для обоих очень низка. Стоимость интегральных схем заключается в проектировании и производстве, а стоимость интегрированных веб-страниц — в проектировании и обновлении. Если вы хотите присоединиться к команде создателей LSIP, вам необходимо подготовить умение проектировать и обновлять.
Программное обеспечение для проектирования
Проектирование LSIP можно разделить на три этапа: первый этап: информация ; после извлечения и очистки он поступает на второй этап: данные связываются и организуются для формирования базы данных, наконец, HTML-код выводится через базу данных в базу данных; третий этап: веб-страница .
Концепция LSIP только что была предложена. В настоящее время в ИТ-индустрии не существует специализированного программного обеспечения для проектирования, но имеется готовое программное обеспечение для трех этапов проектирования. Благодаря сочетанию функций программного обеспечения и небольшого количества кода проектирование LSIP может быть полуавтоматическим, что значительно повышает эффективность проектирования. Даменг перечисляет следующее, основываясь на своем собственном опыте проектирования:
Сбор информацииСбор информации
Оцифровка информации Оцифровка информации
Веб-страницы преобразования данных
Даменг надеется, что LSIP может быть одновременно подходящим для чтения человеком и удобным для машинного поиска, что соответствует концепции «Семантической сети», предложенной W3C. Это вызов уровню дизайна.
После завершения разработки LSIP и перехода на этап обслуживания он в основном выполняет работу по обнаружению веб-сайтов, чтобы гарантировать достоверность ссылки.
Даменг надеется, что к команде создателей LSIP присоединятся проницательные люди . Приглашаем всех разрабатывать и создавать «масштабные интегрированные веб-страницы» в интересующих областях, чтобы внести свой вклад в качественное развитие Родины!
Я надеюсь, что пользователи других языков создадут проекты LSIP для своих сограждан, которые помогут людям легче понять мир в целом, чего не могут сделать Twitter и Facebook.
Читатели могут оставлять сообщения для обсуждения, а пользователи github могут сообщать о проблемах.
✴️✳️❇️?⚛️❄️??️
«Интегрированная веб-страница» — это новая веб-форма, основанная на Всемирной паутине (WWW): объедините все гиперссылки по одной и той же теме на одной веб-странице, чтобы реализовать полный набор URL-адресов для этой темы.
Когда количество гиперссылок превышает тысячу, это называется «крупномасштабной интегрированной веб-страницей» (LSIP), названной DiamonWoo на github.com, 202207.
Если у вас сильная воля и чистое сердце, присоединяйтесь!
CC 3.0 BY-NC-ND 可转载-需署名-非演绎
大规模集成网页(LSIP)© 2022-2023 大萌
https://diamonwoo.github.io/LSIP
Version 0.5.2 202406
LSIP — это производный проект клише-сайта.