Meng Besar 2022-2024
Halaman web terintegrasi adalah halaman web yang menggabungkan URL tema tertentu. Halaman web terintegrasi menggunakan teknologi hypertext atau database untuk mengintegrasikan konten subjek dan sejumlah besar tautan, membuat direktori terstruktur, dan memusatkannya pada halaman web statis. Ini adalah halaman web berbasis data dan salah satu dari banyak bentuk kompetitif web3 .0. Menurut skala integrasi, bila jumlah link melebihi seratus, disebut 'Halaman Web Terintegrasi Skala Menengah (MSIP)'; bila jumlah link melebihi seribu, disebut ' Halaman Web Terintegrasi Skala Besar ' (LSIP ); bila jumlah link melebihi seribu, disebut 'Halaman Web Terintegrasi Skala Besar' (LSIP); Jumlah link melebihi 10.000 dan disebut 'Halaman Web Terintegrasi Skala Sangat Besar (VLSIP)'.
Di masa lalu, kumpulan data lengkap ini umumnya disimpan di server dalam bentuk database, dan skrip server mengeluarkan subset kueri ke pengguna. Halaman web yang mengimplementasikan proses kueri disebut 'halaman web dinamis'. . Halaman web semacam ini yang menyembunyikan data di belakang server disebut DeepWeb; dengan peningkatan kecepatan jaringan dan peningkatan kemampuan browser, server juga dapat langsung mengirimkan kumpulan data lengkap ke browser, menyerahkan permintaan data, memfilter, penyortiran dan tugas lainnya. Berikan ke browser untuk diselesaikan. Halaman web terintegrasi adalah 'halaman web statis' yang berisi kumpulan data lengkap dalam aspek tertentu. Permintaan data pengguna diimplementasikan secara lokal melalui browser tanpa melalui server lagi waktu, tetapi juga meningkatkan pengambilan data dan Pemanfaatan kebebasan.
Integrasi halaman web skala besar (LSIP) menggunakan jaringan yang lebih cepat dan kuat untuk membawa data DeepWeb ke ujung depan, yang merupakan kemungkinan bentuk web 3.0. Konsep 'LSIP' pertama kali diterbitkan oleh Dameng pada Juli 2022 dengan mendirikan proyek di Github. Proyek ini menggunakan LSIP sebagai badan utama untuk membahas teori dan praktik 'halaman web terintegrasi'.
Keuntungan
Halaman Web Terintegrasi Skala Besar (LSIP) menyerahkan data kepada pengguna dan secara teknis memberikan kemungkinan penyalinan data situs web. Ini adalah kebalikan dari strategi keamanan halaman web dinamis tradisional. Halaman web dinamis menyembunyikan kumpulan data lengkap dalam database di belakang server, yang tidak dapat diakses langsung oleh pengguna. Jika peretas melewati skrip server dan langsung mengunduh database situs web, hal ini disebut 'database terseret', yang merupakan jaringan serius. insiden keamanan.
LSIP secara teknis adalah 'halaman web statis', dan memiliki kelebihan dari halaman web statis.
Data LSIP tidak hanya terbuka untuk pengguna, tetapi juga untuk Internet - ini adalah sesuatu yang tidak ingin dilakukan oleh Aplikasi. Situs web lain, termasuk mesin pencari, dapat mengambil, menyalin, dan menggunakan kembali data tersebut, sehingga meningkatkan tingkat penggunaan kembali data tersebut. Peningkatan tingkat penggunaan kembali data akan membantu data untuk dimanfaatkan lebih lanjut: statistik, identifikasi, pembelajaran mesin, dan LSIP untuk menghasilkan informasi turunan. Proses ini sering disebut 'Data Mining'.
Kerugiannya adalah LSIP lebih sulit diproduksi dan diperbarui. Namun, kesulitan-kesulitan ini diserahkan kepada penulis halaman web dan bukan kepada pembaca.
Tema atau Masa Depan
Integrasi halaman web dalam skala besar cocok untuk data publik, seperti ketentuan hukum, dokumen kebijakan, data publik pemerintah, dll. Data ini secara inheren memungkinkan pengguna untuk menyalin, dan LSIP memungkinkan pengguna untuk menyalin lebih cepat.
Jika dikatakan “corpus adalah kunci dari semua jenis AI” [1] , maka LSIP adalah tambang emas untuk model AI besar. LSIP dapat menjadi pintu masuk korpus kecerdasan buatan (AI).
Beberapa data publik tidak sesuai untuk LSIP. Data yang berubah kapan saja dan dimana saja, seperti informasi pendaftaran nama domain Internet. Bahkan jika pengguna mengunduh kumpulan data lengkap pada saat tertentu, perubahan pada detik berikutnya masih perlu ditanyakan di server, sehingga tidak menghemat jumlah interaksi jaringan. Data tanpa kuantitas yang jelas tidak cocok untuk LSIP. Produksi halaman web tidak akan pernah bisa diselesaikan.
Singkatnya, Halaman Web Terintegrasi Skala Besar (LSIP) cocok untuk data publik dan data kumpulan terbatas.
Indikator Teknis
Jumlah link saja tidak dapat menilai apakah suatu halaman web menjadi LSIP. Jika tidak, membuat halaman web jelek dan panjang dapat dengan mudah mencapai standar. Saat kita membongkar ponsel atau komputer, kita dapat melihat bahwa blok sirkuit terpadu di dalamnya sangat kecil, dan sebagian besar chip tidak lebih besar dari penghapus; dan terdapat banyak transistor di dalamnya, yang mencerminkan kebutuhan akan chip yang besar. skala Fitur teknis 'mampu 'berintegrasi ke dalam bagian kecil'. Halaman web yang terintegrasi memerlukan metrik untuk mengukur karakteristik teknis yang serupa.
Dameng menetapkan indikator teknis berikut untuk halaman web terintegrasi :
Jumlah statistik link dalam satu topik pada halaman. Ini bukan jumlah total tautan laman, namun jumlah tautan di dalam topik; tautan di luar topik, seperti tautan navigasi di header dan footer, tautan lompat di dalam laman, dan tautan iklan tertanam, harus dikecualikan.
Ukuran halaman web yang diarsipkan sebagai file .mht, diukur dalam KB. Halaman web disimpan sebagai halaman web file tunggal (.mht) menggunakan browser, dan ketika dibuka secara lokal oleh pengguna, semua link ke tema halaman web dapat ditampilkan. Dengan kata lain, 'link count (LC)' tidak akan hilang setelah halaman web disalin secara lokal oleh pengguna. mht adalah singkatan dari 'MHTML', juga dikenal sebagai 'Arsip Web/arsip halaman web'.
Rasio 'jumlah link' terhadap ukuran arsip halaman web disebut 'kepadatan link'. Rumus perhitungan:
LD = LC / mht-size (KB)
Jika jumlah link suatu halaman web melebihi 1.000 dan kepadatan link lebih besar dari 1, maka dapat disebut 'halaman web terintegrasi berskala besar', dan ketentuannya adalah sebagai berikut:
LSIP: LC ≥ 1000
& LD > 1
Mengambil halaman web yang berisi 1.000 link sebagai contoh, ukuran arsip harus dikontrol dalam 1.000KB (1MB) sebelum dapat disebut LSIP. Dihitung dari sudut pandang lain, artinya ukuran arsip yang ditempati oleh setiap link LSIP tidak boleh melebihi 1KB. Dalam ilmu fisika, massa jenis air (H2O) adalah 1. Jika massa jenis suatu benda kurang dari 1, maka benda tersebut akan terapung di atas air; jika kepadatan tautan (LD) suatu halaman web kurang dari 1, maka massa jenis air tersebut adalah halaman web 'terlalu berair', bukan halaman web yang terintegrasi. ?
Proyek LSIP oleh Diamon
Dameng mengemukakan konsep LSIP pada saat praktik pembuatan halaman web, dan memperjelas arah praktik setelah mengajukan konsep LSIP. Empat halaman web dapat disebut tipikal LSIP:
Indikator teknis proyek LSIP tersebut adalah sebagai berikut:
Nama dan versi proyek | Jumlah Tautan (LC) | Ukuran arsip | Kepadatan Tautan (LD) |
---|---|---|---|
Tabel negara v0.7.7 | 1431 | 662 KB | 2.168 |
Saham perusahaan pusat v0.4.1 | 1109 | 358 KB | 3.098 |
Pengumpulan Metode v0.9.4 | 3045 | 542 KB | 5.618 |
Qianxian.com v0.6.7 | 3205 | 559 KB | 5.733 |
Dokumen terkait:
Bernama
Praktik 'halaman web terintegrasi' pertama kali muncul pada tahun 2019 ketika Dameng memproduksi halaman web "Media Cloud Klise Lama". Dameng mengalami kesulitan dalam mencari situs media resmi dari berbagai tempat pada masa awal epidemi COVID-19, sehingga ia menemukan idenya. ide untuk memasukkan semua situs media resmi. Ide di halaman web…
Asal dan Penamaan LSIP{:target="_top"}
Sebuah konsep baru lahir! "Jaringan Pemerintah Kabupaten Seribu Tiongkok" dapat disebut: 'halaman web terintegrasi berskala besar'! Bahasa Indonesia: Halaman Web Terintegrasi Skala Besar, disingkat: LSIP.
Sirkuit terpadu skala besar, LSIC, mengacu pada sirkuit yang mengintegrasikan lebih dari 1.000 transistor.
Integrasi halaman web skala besar, LSIP, mengacu pada integrasi halaman web dengan lebih dari 1.000 hyperlink.
Biaya
LSIC populer karena menyediakan solusi berbiaya rendah untuk berbagai kebutuhan, dan LSIP juga membutuhkan keunggulan ini.
Bahan baku utama LSIC sangat murah yaitu silika (pasir), dan biaya bahan bakunya dapat diabaikan. Oleh karena itu, biaya LSIC terutama pada tautan desain dan tautan produksi (penyalinan), dan tenaga kerja sering kali dibagi ke berbagai perusahaan. Misalnya, Huawei merancang chip HiSilicon dan menyerahkannya ke TSMC untuk produksi.
Bahan baku utama LSIP adalah data website (hyperlink), yang biasanya mudah diperoleh; sedangkan biaya produksi (penyalinan) halaman web hampir nol, sehingga fokus biaya LSIP terletak pada proses desain. Perancangan sirkuit terpadu cukup sulit dan memerlukan bantuan komputer. Halaman web terintegrasi juga akan berkembang ke arah ini.
Tapi LSIP juga memiliki biaya yang tidak dimiliki perangkat keras - pembaruan. Setelah perangkat keras tradisional dijual, pada dasarnya tidak ada pembaruan produk kecuali perbaikan kesalahan. Ketika memori ponsel kita penuh, dapatkah kita mencari produsen untuk menggantinya dengan memori yang lebih besar? tidak bisa. Kecuali Huawei! [2] Namun halaman web yang terintegrasi dapat ditingkatkan menjadi lebih besar dan lebih baru. Inti dari LSIP adalah produk komprehensif yang mengintegrasikan dokumen, perangkat lunak, dan proyek Internet. Dokumen memiliki tugas peninjauan, perangkat lunak memiliki tugas peningkatan, dan Internet memiliki tugas pembaruan. Pembaca tentunya akan menantikan konten-konten terbaru dan terlengkap di LSIP yang menjadi tujuan update LSIP.
Singkatnya, biaya bahan baku utama untuk keduanya sangat rendah. Biaya sirkuit terpadu terletak pada desain dan manufaktur, sedangkan biaya halaman web terintegrasi terletak pada desain dan pembaruan. Jika Anda ingin bergabung dengan tim pembuat LSIP, Anda perlu mempersiapkan kemampuan mendesain dan memperbarui.
Perangkat Lunak Desain
Desain LSIP dapat dibagi menjadi tiga tahap: tahap pertama: informasi ; setelah ekstraksi dan pemurnian, memasuki tahap kedua: data ; dikaitkan dan diorganisasikan untuk membentuk database; akhirnya, kode HTML dikeluarkan melalui database ke tahap ketiga: halaman web .
Konsep LSIP baru saja diusulkan. Saat ini, belum ada perangkat lunak desain khusus di industri TI, namun tersedia perangkat lunak siap pakai untuk tiga tahap desain. Melalui kombinasi fungsi perangkat lunak dan beberapa pekerjaan pemrograman kode rendah, desain LSIP dapat bersifat semi-otomatis, sehingga sangat meningkatkan efisiensi desain. Dameng mencantumkan hal berikut berdasarkan pengalaman desainnya sendiri:
Pengumpulan Informasi Pengumpulan Informasi
Digitalisasi informasi Digitalisasi informasi
Halaman web konversi data
Dameng berharap LSIP cocok untuk dibaca manusia dan mudah diambil oleh mesin, sejalan dengan visi 'Web Semantik' yang diusulkan oleh W3C. Ini merupakan tantangan pada tingkat desain.
Setelah desain LSIP selesai dan memasuki tahap pemeliharaan, LSIP terutama melakukan pekerjaan deteksi situs web untuk memastikan validitas tautan.
Dameng berharap orang-orang yang berwawasan luas dapat bergabung dengan tim pencipta LSIP. Semua orang dipersilakan merancang dan memproduksi 'halaman web terintegrasi berskala besar' di bidang yang diminati untuk berkontribusi pada pembangunan ibu pertiwi yang berkualitas!
Saya berharap pengguna bahasa lain membuat proyek LSIP untuk sesama warganya, yang dapat membantu orang memahami dunia secara keseluruhan dengan lebih mudah, sesuatu yang tidak dapat dilakukan oleh Twitter dan Facebook.
Pembaca dipersilakan meninggalkan pesan untuk berdiskusi, dan pengguna github dapat mengirimkan masalah.
✴️✳️❇️?⚛️❄️??️
'Halaman web terintegrasi' adalah formulir web baru berdasarkan World Wide Web (WWW): Integrasikan semua hyperlink dalam topik yang sama pada satu halaman web, untuk menerapkan kumpulan URL lengkap untuk topik tersebut.
Ketika jumlah hyperlink melebihi seribu, itu disebut 'Halaman Web Terintegrasi Skala Besar' (LSIP), dinamai DiamonWoo di github.com, 202207.
Jika Anda memiliki kemauan yang kuat dan hati yang murni, bergabunglah!
CC 3.0 BY-NC-ND 可转载-需署名-非演绎
大规模集成网页(LSIP)© 2022-2023 大萌
https://diamonwoo.github.io/LSIP
Version 0.5.2 202406
LSIP merupakan proyek turunan dari website klise