빅 멩 2022-2024
통합 웹페이지는 특정 테마의 URL을 조합한 웹 페이지입니다. 통합 웹 페이지는 하이퍼텍스트나 데이터베이스 기술을 사용하여 주제 콘텐츠와 다수의 링크를 통합하고 구조화된 디렉토리를 구축하여 이를 정적 웹 페이지에 집중시키는 데이터 기반 웹 페이지이며 web3의 많은 경쟁 형태 중 하나입니다. .0. 통합 규모에 따라 링크 수가 100개를 초과하면 '중규모 통합 웹페이지(MSIP)'라고 하고, 링크 수가 1000개를 초과하면 ' 대규모 통합 웹페이지 (LSIP)'라고 합니다. ), 링크 수가 1,000개를 초과하면 '대규모 통합 웹페이지'(LSIP)라고 하며, 링크 수가 10,000개를 초과하면 'VLSIP(초대규모 통합 웹페이지)'라고 합니다.
과거에는 이러한 완전한 데이터 세트가 일반적으로 데이터베이스 형태로 서버에 저장되었으며, 서버 스크립트는 쿼리 프로세스를 구현한 웹 페이지를 '동적 웹 페이지'라고 불렀습니다. . 서버 뒤에 데이터를 숨기는 이런 종류의 웹 페이지를 DeepWeb이라고 합니다. 네트워크 속도가 향상되고 브라우저 기능이 향상되어 서버는 전체 데이터 세트를 브라우저에 직접 보내고 데이터 쿼리, 필터링, 정렬 및 기타 작업을 완료하려면 브라우저 에 제공하세요. 통합 웹 페이지는 특정 측면의 완전한 데이터 세트를 포함하는 '정적 웹 페이지'입니다. 사용자의 데이터 쿼리는 서버를 다시 거치지 않고 브라우저를 통해 로컬로 구현됩니다. 시간을 단축할 뿐만 아니라 데이터 검색 및 자유 활용도도 향상됩니다.
웹 페이지의 대규모 통합(LSIP)은 더 빠르고 강력한 네트워크를 사용하여 DeepWeb 데이터를 프런트 엔드로 가져오는 웹 3.0의 가능한 형태입니다. 'LSIP'의 개념은 Dameng이 Github에 프로젝트를 수립하여 2022년 7월 처음 발표했습니다. 이 프로젝트는 LSIP를 주체로 '통합 웹 페이지'에 대한 이론과 실제를 논의합니다.
장점
LSIP(대규모 통합 웹 페이지)는 사용자에게 데이터를 전달하고 기술적으로 웹 사이트 데이터를 복사할 수 있는 가능성을 제공합니다. 이는 기존 동적 웹 페이지의 보안 전략과 정반대입니다. 동적 웹 페이지는 사용자가 직접 접근할 수 없는 서버 뒤의 데이터베이스에 전체 데이터 세트를 숨깁니다. 해커가 서버 스크립트를 우회하여 웹 사이트의 데이터베이스를 직접 다운로드하는 경우 이를 '끌어온 데이터베이스'라고 하는데, 이는 심각한 네트워크입니다. 보안사고.
LSIP는 기술적으로는 '정적 웹페이지'로, 정적 웹페이지의 장점을 갖고 있습니다.
LSIP의 데이터는 사용자에게만 공개되는 것이 아니라 인터넷에도 공개됩니다. 이는 앱에서 수행할 수 없는 작업입니다. 검색 엔진을 포함한 다른 웹사이트에서는 데이터를 검색, 복사 및 재사용할 수 있으므로 데이터 재사용률이 높아집니다. 데이터 재사용률이 높아지면 통계, 식별, 기계 학습, LSIP 등 데이터를 더욱 활용하여 파생 정보를 생성하는 데 도움이 됩니다. 이 프로세스를 흔히 '데이터 마이닝'이라고 합니다.
단점은 LSIP를 생산하고 업데이트하기가 더 어렵다는 것입니다. 그러나 이러한 어려움은 독자가 아닌 웹페이지 작성자에게 맡겨져 있습니다.
테마 또는 미래
웹 페이지의 대규모 통합은 법률 조항, 정책 문서, 정부 공공 데이터 등과 같은 원래 공공 데이터에 적합합니다. 이 데이터를 사용하면 본질적으로 사용자가 복사할 수 있으며 LSIP를 사용하면 사용자가 더 빠르게 복사할 수 있습니다.
"코퍼스가 모든 종류의 AI의 핵심"이라고 한다면 [1] LSIP는 대형 AI 모델의 금광입니다. LSIP는 인공지능(AI)의 코퍼스 항목이 될 수 있습니다.
일부 공개 데이터는 LSIP에 적합하지 않습니다. 인터넷 도메인 이름 등록 정보 등 언제 어디서나 변경되는 데이터입니다. 사용자가 특정 순간에 전체 데이터 세트를 다운로드하더라도 다음 순간의 변경 사항은 여전히 서버에서 쿼리되어야 하므로 네트워크 상호 작용 횟수가 절약되지 않습니다. 명확한 양이 없는 데이터는 LSIP에 적합하지 않습니다. 웹페이지 제작은 결코 '수집'될 수는 없지만 '완성'될 수는 없습니다.
요약하자면, LSIP(Large Scale Integrated Web Pages)는 공공 데이터 및 제한된 세트 데이터에 적합합니다.
기술 지표
링크 수만으로는 웹페이지가 LSIP인지 평가할 수 없습니다. 그렇지 않으면 웹페이지를 보기 흉하고 길게 만드는 것이 쉽게 표준에 도달할 수 있습니다. 휴대폰이나 컴퓨터를 분해하면 내부의 집적 회로 블록이 매우 작고 대부분의 칩이 지우개보다 크지 않으며 내부에 많은 트랜지스터가 있다는 것을 알 수 있습니다. scale '작은 조각으로 통합할 수 있다'는 기술적 특징. 통합된 웹페이지에는 유사한 기술적 특성을 측정하기 위한 지표가 필요합니다.
Dameng은 통합 웹 페이지 에 대해 다음과 같은 기술 지표를 설정합니다.
페이지의 단일 주제 아래에 있는 링크의 통계적 수입니다. 이는 단순한 페이지 링크의 총 개수가 아니라, 머리글과 바닥글의 탐색 링크, 페이지 내 점프 링크, 삽입된 광고 링크 등 주제 외부의 링크 수를 제외해야 합니다.
.mht 파일로 보관된 웹 페이지의 크기(KB 단위)입니다. 웹 페이지는 브라우저를 사용하여 단일 파일 웹 페이지(.mht)로 저장되며, 사용자가 로컬로 열면 웹 페이지 테마에 대한 모든 링크가 표시될 수 있습니다. 즉, 사용자가 웹페이지를 로컬로 복사한 후에도 '링크 개수(LC)'가 손실되지 않습니다. mht는 'MHTML'의 약어로 '웹 아카이브/웹 페이지 아카이브'라고도 합니다.
웹페이지 아카이브 크기에 대한 '링크 수'의 비율을 '링크 밀도'라고 합니다. 계산 공식:
LD = LC / mht-size (KB)
웹페이지의 링크수가 1,000개를 초과하고 링크밀도가 1보다 큰 경우 '대규모 통합 웹페이지'라고 할 수 있으며, 조건은 다음과 같습니다.
LSIP: LC ≥ 1000
& LD > 1
1,000개의 링크가 포함된 웹페이지를 예로 들면, 아카이브 크기를 1,000KB(1MB) 이내로 제어해야 LSIP라고 할 수 있습니다. 다른 관점에서 계산하면, 즉 각 LSIP 링크가 차지하는 아카이브 크기는 1KB를 초과할 수 없습니다. 물리학에서 물의 밀도(H2O)는 1입니다. 물체의 밀도가 1보다 작으면 웹페이지의 링크 밀도(LD)가 1보다 작으면 물 위에 뜨게 됩니다. 웹페이지가 '너무 물에 젖어' 있습니다. 실제로는 통합된 웹페이지가 아닙니다. ?
Diamon의 LSIP 프로젝트
Dameng은 웹페이지 제작 실습 과정에서 LSIP의 개념을 제안하였고, LSIP의 개념을 제안한 후 실천 방향을 명확히 하였다. 웹 페이지 중 4개는 일반적인 LSIP라고 할 수 있습니다.
이러한 LSIP 프로젝트의 기술 지표는 다음과 같습니다.
프로젝트 이름 및 버전 | 링크 수(LC) | 아카이브 크기 | 링크 밀도(LD) |
---|---|---|---|
국가 테이블 v0.7.7 | 1431 | 662KB | 2.168 |
중앙 기업 공유 v0.4.1 | 1109 | 358KB | 3.098 |
메소드 컬렉션 v0.9.4 | 3045 | 542KB | 5.618 |
Qianxian.com v0.6.7 | 3205 | 559KB | 5.733 |
관련 문서:
명명됨
'통합 웹페이지'라는 관행은 Dameng이 'Old Cliché Cloud Media' 웹페이지를 제작한 2019년에 처음 등장했습니다. Dameng은 코로나19 전염병 초기에 여러 곳에서 공식 미디어 웹사이트를 검색하는 데 어려움을 겪었고 이에 대해 생각해냈습니다. 모든 공식 미디어 웹사이트를 웹페이지에 포함한다는 아이디어…
LSIP{:target="_top"}의 유래와 이름
새로운 컨셉의 탄생! "중국 천현 정부 네트워크"는 '대규모 통합 웹 페이지'라고 할 수 있습니다! 영어: 대규모 통합 웹페이지, 약칭: LSIP.
대규모 집적회로(LSIC)는 1,000개 이상의 트랜지스터를 집적한 회로를 말한다.
웹페이지 대규모 통합(LSIP)은 1,000개 이상의 하이퍼링크로 웹페이지를 통합하는 것을 의미합니다.
비용
LSIC는 다양한 요구에 맞는 저렴한 솔루션을 제공하기 때문에 인기가 있으며, LSIP에도 이러한 이점이 필요합니다.
LSIC의 주원료는 실리카(모래)로 가격이 매우 저렴해 원재료비를 무시할 수 있다. 따라서 LSIC의 비용은 주로 설계 링크와 생산(복제) 링크에 있으며, 인력은 여러 회사에 나누어지는 경우가 많습니다. 예를 들어 화웨이는 HiSilicon 칩을 설계하고 생산을 위해 TSMC에 넘겨줍니다.
LSIP의 주요 원재료는 일반적으로 쉽게 얻을 수 있는 웹사이트 데이터(하이퍼링크)입니다. 반면 웹페이지 제작(복사) 비용은 거의 0이므로 LSIP 비용의 초점은 디자인 프로세스에 있습니다. 집적 회로 설계는 매우 어렵고 컴퓨터 지원이 필요합니다. 통합 웹 페이지도 이러한 방향으로 개발될 것이며 설계는 더욱 어려워질 것입니다.
그러나 LSIP에는 하드웨어에 없는 업데이트 비용도 발생합니다. 기존 하드웨어를 판매한 후에는 기본적으로 결함 수리 외에는 제품 업데이트가 없습니다. 휴대폰 메모리가 가득 차면 제조업체를 찾아 더 큰 메모리로 교체할 수 있나요? 할 수 없습니다. 화웨이는 제외! [2] 그러나 통합 웹페이지는 더 크고 새로운 것으로 업그레이드될 수 있습니다. LSIP의 본질은 문서, 소프트웨어, 인터넷 프로젝트를 통합한 종합 제품입니다. 문서에는 검토 작업이 있고, 소프트웨어에는 업그레이드 작업이 있으며, 인터넷에는 후속 제품 유지 관리에 대해 분야마다 의견이 다릅니다. 독자들은 물론 LSIP의 업데이트 목표인 LSIP에 관한 가장 포괄적이고 최신의 콘텐츠를 기대하게 될 것입니다.
요약하자면, 두 가지 모두 기본 원자재 비용이 매우 낮습니다. 집적 회로의 비용은 설계 및 제조에 있는 반면, 통합 웹 페이지의 비용은 설계 및 업데이트에 있습니다. LSIP 크리에이터팀에 합류하려면 디자인과 업데이트 능력을 준비해야 합니다.
디자인 소프트웨어
LSIP 설계는 세 단계로 나눌 수 있습니다. 첫 번째 단계: 정보 추출 및 정제 후 두 번째 단계로 들어갑니다. 데이터 는 연관되고 구성되어 최종적으로 데이터베이스를 통해 출력됩니다. 세 번째 단계: 웹페이지 .
LSIP 개념은 이제 막 제안되었습니다. 현재 IT 업계에는 전문적인 설계 소프트웨어가 없지만 세 가지 설계 단계에 사용할 수 있는 기성 소프트웨어가 있습니다. 소프트웨어 기능과 일부 로우 코드 프로그래밍 작업의 조합을 통해 LSIP 설계를 반자동화하여 설계 효율성을 크게 향상시킬 수 있습니다. Dameng은 자신의 디자인 경험을 바탕으로 다음을 나열합니다.
정보 수집Information Collection
정보의 디지털화 정보의 디지털화
데이터 변환 웹페이지
Dameng은 LSIP가 W3C가 제안한 'Semantic Web'의 비전에 맞춰 사람이 읽는 데 적합하고 기계 검색에 편리할 수 있기를 바라고 있습니다. 이는 디자인 수준에 대한 도전입니다.
LSIP 설계가 완료되고 유지 관리 단계에 들어간 후에는 링크의 유효성을 확인하기 위해 주로 웹사이트 탐지 작업을 수행합니다.
Dameng은 통찰력 있는 사람들이 LSIP 창작팀에 합류하기를 희망합니다. 누구나 관심 분야의 '대규모 통합 웹페이지'를 디자인하고 제작하여 조국의 고품질 발전에 기여할 수 있기를 바랍니다!
트위터나 페이스북이 할 수 없는, 다른 언어 사용자들이 동료 시민들을 위한 LSIP 프로젝트를 만들어 세상을 더 쉽게 전체적으로 이해할 수 있게 되기를 바랍니다.
독자들은 토론을 위해 메시지를 남길 수 있으며, github 사용자는 이슈를 제출할 수 있습니다.
✴️✳️❇️?⚛️❄️??️
'통합 웹 페이지'는 월드 와이드 웹(WWW)을 기반으로 하는 새로운 웹 형식입니다. 동일한 주제 아래의 모든 하이퍼링크를 단일 웹 페이지에 통합하여 해당 주제에 대한 전체 URL 세트를 구현합니다.
하이퍼링크 수가 1,000개를 초과하면 'Large Scale Integrated Web Page'(LSIP)라고 하며, 이름은 DiamonWoo on github.com , 202207입니다.
강한 의지와 순수한 마음을 갖고 계신다면 참여해보세요!
CC 3.0 BY-NC-ND 可转载-需署名-非演绎
大规模集成网页(LSIP)© 2022-2023 大萌
https://diamonwoo.github.io/LSIP
Version 0.5.2 202406
LSIP는 진부한 웹사이트의 파생 프로젝트입니다.