ビッグ・メン 2022-2024
統合 Web ページとは、特定のテーマの URLを組み合わせたWebページです。統合 Web ページは、ハイパーテキストまたはデータベース技術を使用して、主題のコンテンツと多数のリンクを統合し、構造化されたディレクトリを確立し、それを静的な Web ページに集中させます。これは、データベースの Web ページであり、Web3 の多くの競合形式の 1 つです。 .0。 統合規模に応じて、リンク数が100を超える場合は「中規模統合Webページ(MSIP)」と呼ばれ、リンク数が1000を超える場合は「大規模統合Webページ(LSIP)」と呼ばれます。 ); リンク数が 1,000 を超える場合は「大規模統合 Web ページ (LSIP)」と呼ばれます; リンク数が 10,000 を超える場合は「超大規模統合 Web ページ (VLSIP)」と呼ばれます。
以前は、この完全なデータ セットは通常、データベースの形式でサーバーに保存され、サーバー スクリプトはクエリ プロセスを実装した Web ページをユーザーに出力しました。 。データをサーバーの背後に隠すこの種の Web ページは DeepWeb と呼ばれます。ネットワーク速度の向上とブラウザーの機能の強化により、サーバーはデータのクエリ、フィルタリング、データの引き継ぎ、データの完全なセットをブラウザーに直接送信することもできます。並べ替えやその他のタスクをブラウザに渡して完了させます。統合 Web ページは、特定の面で完全なデータ セットを含む「静的 Web ページ」です。ユーザーのデータ クエリは、サーバーを再度経由せずにローカルで実装されます。これにより、ネットワーク インタラクションの回数が節約されるだけでなく、時間は短縮されますが、データの検索と自由度の利用も向上します。
Web ページの大規模統合 (LSIP) は、より高速で強力なネットワークを使用して DeepWeb データをフロントエンドに取り込みます。これは、Web 3.0 の可能な形式です。 「LSIP」の概念は、2022年7月にDamengによってGithub上にプロジェクトを設立し、「統合Webページ」の理論と実践を議論する主体として初めて公開されました。
利点
大規模統合 Web ページ (LSIP) はデータをユーザーに渡し、Web サイトのデータがコピーされる可能性を技術的に提供します。 これは、従来の動的 Web ページのセキュリティ戦略とは逆です。動的 Web ページでは、サーバーの背後にあるデータベースにデータの完全なセットが隠蔽されており、ハッカーがサーバー スクリプトを回避して Web サイトのデータベースを直接ダウンロードすると、これは深刻なネットワークになります。セキュリティ事件。
LSIP は技術的には「静的 Web ページ」であり、静的 Web ページの利点を備えています。
LSIP のデータはユーザーだけでなくインターネットにも公開されていますが、これはアプリが望んでいないことです。検索エンジンなどの他の Web サイトはデータを取得、コピー、再利用できるため、データの再利用率が向上します。 データの再利用率が向上すると、統計、識別、機械学習、派生情報を生成するための LSIP など、データのさらなる利用が促進されます。このプロセスは、「データ マイニング」と呼ばれることがよくあります。
欠点は、LSIP の作成と更新がより難しいことです。ただし、これらの問題は Web ページの作成者に委ねられており、読者には委ねられません。
テーマとか未来とか
Web ページの大規模な統合は、法律条項、政策文書、政府の公開データなど、元々公開されていたデータに適しています。このデータは本質的にユーザーによるコピーを可能にしており、LSIP によりユーザーはより速くコピーできるようになります。
「コーパスはあらゆる種類の AI の鍵である」 [1]と言われるなら、LSIP は大規模な AI モデルの宝庫です。 LSIP は、人工知能 (AI) のコーパス エントリになる可能性があります。
公開データの中には LSIP に適さないものもあります。インターネットのドメイン名の登録情報など、いつでもどこでも変更されるデータ。ユーザーがある瞬間にデータの完全なセットをダウンロードしたとしても、次の秒の変更は依然としてサーバー上でクエリされる必要があるため、ネットワーク インタラクションの回数は節約されません。 明確な量のないデータは LSIP には適していません。Web ページの制作は「集める」だけで「完了」することはできません。
要約すると、大規模統合 Web ページ (LSIP) は、公開データおよび限定されたセット データに適しています。
テクニカル指標
リンクの数だけでは、Web ページが LSIP になるかどうかを評価できません。そうでない場合、Web ページが醜く長くなり、簡単に基準に達してしまいます。携帯電話やコンピュータを分解すると、内部の集積回路ブロックは非常に小さく、ほとんどのチップは消しゴムほどの大きさではなく、内部に多数のトランジスタが含まれていることがわかります。スケール 「小さな部分に統合できる」という技術的特徴。 統合された Web ページには、同様の技術的特性を測定するためのメトリクスが必要です。
Dameng は、統合 Web ページに対して次のテクニカル指標を設定します。
ページ上の単一トピックの下にあるリンクの統計的な数。 これは単純なページ リンクの総数ではなく、トピック内のリンクの数です。ヘッダーとフッターのナビゲーション リンク、ページ内のジャンプ リンク、埋め込み広告リンクなど、トピック外のリンクは除外する必要があります。
.mht ファイルとしてアーカイブされた Web ページのサイズ (KB 単位で測定)。 Web ページはブラウザを使用して単一ファイルの Web ページ (.mht) として保存され、ユーザーがローカルで開くと、Web ページのテーマへのすべてのリンクが表示されます。言い換えれば、ユーザーが Web ページをローカルにコピーした後でも、「リンク数 (LC)」は失われません。 mht は「MHTML」の略称で、「Web アーカイブ/Web ページ アーカイブ」とも呼ばれます。
Web ページのアーカイブ サイズに対する「リンク数」の比率は「リンク密度」と呼ばれます。計算式:
LD = LC / mht-size (KB)
Web ページのリンク数が 1,000 を超え、リンク密度が 1 より大きい場合、その Web ページは「大規模統合 Web ページ」と呼ばれます。その条件は次のとおりです。
LSIP: LC ≥ 1000
& LD > 1
1,000 個のリンクを含む Web ページを例にとると、LSIP と呼ばれるには、アーカイブ サイズを 1,000KB (1MB) 以内に制御する必要があります。別の観点から計算すると、各 LSIP リンクが占めるアーカイブ サイズは 1KB を超えることはできません。 物理学では、水の密度 (H2O) は 1 です。オブジェクトの密度が 1 未満の場合、Web ページのリンク密度 (LD) が 1 未満の場合、オブジェクトは水に浮きます。 Web ページは「水っぽく」、実際には統合された Web ページではありません。 ?
ダイアモンによるLSIPプロジェクト
Dameng は Web ページ作成の実践中に LSIP の概念を提案し、LSIP の概念を提案した後の実践の方向性を明確にしました。 Web ページのうち 4 つは、典型的な LSIP と呼ぶことができます。
これらのLSIPプロジェクトのテクニカル指標は次のとおりです。
プロジェクト名とバージョン | リンク数 (LC) | アーカイブのサイズ | リンク密度 (LD) |
---|---|---|---|
国別テーブル v0.7.7 | 1431 | 662KB | 2.168 |
中央エンタープライズ共有 v0.4.1 | 1109 | 358KB | 3.098 |
メソッドコレクション v0.9.4 | 3045 | 542KB | 5.618 |
Qianxian.com v0.6.7 | 3205 | 559KB | 5.733 |
関連文書:
名前付き
「統合ウェブページ」の実践は、Dameng 氏が「Old Cliché Cloud Media」ウェブページを作成した 2019 年に初めて登場しました。Dameng 氏は、新型コロナウイルス感染症の流行の初期に、さまざまな場所から公式メディア Web サイトを検索することが困難であったため、この方法を思いつきました。すべての公式メディア Web サイトを Web ページに含めるというアイデア。
LSIPの起源と命名{:target="_top"}
新しいコンセプトが誕生! 「中国千県政府ネットワーク」は「大規模な統合ウェブページ」と呼ぶことができます。英語: Large Scale Integrated Web Page、略称: LSIP。
大規模集積回路(LSIC)とは、1,000個以上のトランジスタを集積した回路のことを指します。
Web ページの大規模統合 (LSIP) は、1,000 を超えるハイパーリンクを持つ Web ページの統合を指します。
料金
LSIC は、幅広いニーズに対応する低コストのソリューションを提供するため人気があり、LSIP にもこの利点が必要です。
LSIC の主原料であるシリカ(砂)は非常に安価であり、原料コストは無視できます。したがって、LSIC のコストは主に設計リンクと製造 (コピー) リンクにあり、分業することが多くの場合、異なる企業間で行われます。たとえば、ファーウェイは HiSilicon チップを設計し、生産のために TSMC に引き渡します。
LSIP の主な原材料は Web サイト データ (ハイパーリンク) であり、通常は簡単に入手できますが、Web ページの作成 (コピー) のコストはほぼゼロであるため、LSIP コストの焦点は設計プロセスにあります。 集積回路の設計は非常に難しく、コンピュータの支援が必要です。統合された Web ページも、集積規模が大きくなるほど、設計が難しくなります。
ただし、LSIP にはハードウェアにはない更新コストもかかります。従来のハードウェアが販売された後は、故障修理を除いて基本的に製品のアップデートはありません。携帯電話のメモリがいっぱいになった場合、より大きなメモリに交換してくれるメーカーを見つけることはできますか?できません。ファーウェイ以外! [2]ただし、統合された Web ページは、より大きく新しいものにアップグレードできます。 LSIP の本質は、ドキュメント、ソフトウェア、インターネット プロジェクトを統合する包括的な製品です。ドキュメントにはレビュー作業があり、ソフトウェアにはアップグレード作業があり、その後の製品のメンテナンスについては分野によって意見が異なります。読者はもちろん、LSIP の更新目標である LSIP に関する最新かつ最も包括的なコンテンツを楽しみにしているでしょう。
要約すると、どちらの主要原材料のコストも非常に低く、集積回路のコストは設計と製造にかかりますが、統合 Web ページのコストは設計と更新にかかります。 LSIPクリエイターチームに参加したい場合は、設計と更新の能力を準備する必要があります。
設計ソフトウェア
LSIP の設計は 3 つの段階に分けることができます: 第 1 段階:情報、抽出および精製後、第 2 段階:データが関連付けられ、データベースを形成します。第 3 段階: Web ページ。
LSIP コンセプトは提案されたばかりですが、現在、IT 業界には専用の設計ソフトウェアはありませんが、3 つの設計段階で利用できる既製のソフトウェアがあります。ソフトウェア機能といくつかのローコード プログラミング作業を組み合わせることで、LSIP の設計を半自動化でき、設計効率が大幅に向上します。 Dameng 氏は、自身のデザイン経験に基づいて次のように挙げています。
情報収集情報収集
情報のデジタル化情報のデジタル化
データ変換Web ページ
Dameng 氏は、W3C が提案した「セマンティック Web」のビジョンに沿って、LSIP が人間の読み取りに適しており、機械による検索にも便利であることを期待しています。これはデザインレベルへの挑戦です。
LSIP の設計が完了し、保守フェーズに入ると、主に Web サイトの検出作業を実行して、リンクの有効性を確認します。
Dameng は、洞察力のある人々がLSIP クリエイターのチームに参加し、祖国の質の高い発展に貢献するために、興味のある分野で「大規模な統合 Web ページ」をデザインおよび制作することを歓迎します。
私は、他の言語のユーザーが同胞のために LSIP プロジェクトを作成して、人々が世界全体をより簡単に理解できるようにすることを願っていますが、これは Twitter や Facebook にはできないことです。
読者はディスカッションのためにメッセージを残すことができ、github ユーザーは問題を送信できます。
✴️✳️❇️?⚛️❄️??️
「統合 Web ページ」は、World Wide Web (WWW) に基づいた新しい Web フォームです。単一の Web ページ上の同じトピックの下にあるすべてのハイパーリンクを統合し、そのトピックの URL の完全なセットを実装します。
ハイパーリンクの数が 1,000 を超える場合、それは「大規模統合 Web ページ」(LSIP) と呼ばれます。これは、DiamonWoo によって github.com 、202207 で命名されました。
強い意志と純粋な心を持った方、ぜひご参加ください!
CC 3.0 BY-NC-ND 可转载-需署名-非演绎
大规模集成网页(LSIP)© 2022-2023 大萌
https://diamonwoo.github.io/LSIP
Version 0.5.2 202406
LSIP は、決まり文句の Web サイトの派生プロジェクトです。