บิ๊กเม้ง 2022-2024
หน้าเว็บแบบรวมคือหน้าเว็บ ที่ รวม URL ของธีมบางธีม หน้าเว็บแบบรวมใช้เทคโนโลยีไฮเปอร์เท็กซ์หรือฐานข้อมูลเพื่อรวมเนื้อหาหัวเรื่องและลิงก์จำนวนมาก สร้างไดเร็กทอรีที่มีโครงสร้างและเน้นที่หน้าเว็บแบบคงที่ เป็นหน้าเว็บที่ใช้ข้อมูลและเป็นหนึ่งในรูปแบบการแข่งขันของเว็บ .0. ตามขนาดการรวม เมื่อจำนวนลิงก์เกินหนึ่งร้อยลิงก์ จะเรียกว่า 'Medium Scale Integrated Web Page (MSIP)' เมื่อจำนวนลิงก์เกินหนึ่งพันลิงก์ จะเรียกว่า ' Large Scale Integrated Web Page ' (LSIP) ) เมื่อจำนวนลิงก์เกินหนึ่งพันลิงก์ จะเรียกว่า 'Large Scale Integrated Web Page' (LSIP) จำนวนลิงก์เกิน 10,000 ลิงก์ และเรียกว่า 'Very Large Scale Integrated Web Page (VLSIP)'
ในอดีต ชุดข้อมูลที่สมบูรณ์นี้โดยทั่วไปจะถูกจัดเก็บไว้ในเซิร์ฟเวอร์ในรูปแบบของฐานข้อมูล และสคริปต์ของเซิร์ฟเวอร์จะส่งออกชุดย่อยการสืบค้นไปยังผู้ใช้ หน้าเว็บที่ใช้กระบวนการสืบค้นเรียกว่า 'หน้าเว็บแบบไดนามิก' . หน้าเว็บประเภทนี้ที่ซ่อนข้อมูลไว้ด้านหลังเซิร์ฟเวอร์เรียกว่า DeepWeb ด้วยการปรับปรุงความเร็วเครือข่ายและการปรับปรุงความสามารถของเบราว์เซอร์ เซิร์ฟเวอร์ยังสามารถส่งข้อมูลชุดสมบูรณ์ไปยังเบราว์เซอร์โดยตรง ส่งมอบการสืบค้นข้อมูล การกรอง การเรียงลำดับและงานอื่นๆ ให้ เบราว์เซอร์ ดำเนินการให้เสร็จสิ้น หน้าเว็บแบบรวมคือ 'หน้าเว็บแบบคงที่' ที่มีชุดข้อมูลที่สมบูรณ์ในบางแง่มุม การสืบค้นข้อมูลของผู้ใช้จะถูกนำไปใช้ในเครื่องผ่านเบราว์เซอร์โดยไม่ต้องผ่านเซิร์ฟเวอร์อีกครั้ง ซึ่งไม่เพียงแต่ช่วยบันทึกจำนวนการโต้ตอบของเครือข่ายและ แต่ยังปรับปรุงการดึงข้อมูลและการใช้เสรีภาพอีกด้วย
การบูรณาการหน้าเว็บขนาดใหญ่ (LSIP) ใช้เครือข่ายที่รวดเร็วและแข็งแกร่งยิ่งขึ้นเพื่อนำข้อมูล DeepWeb ไปยังส่วนหน้า ซึ่งเป็นรูปแบบที่เป็นไปได้ของเว็บ 3.0 แนวคิดของ 'LSIP' ได้รับการเผยแพร่ครั้งแรกโดย Dameng ในเดือนกรกฎาคม 2022 โดยการสร้างโครงการบน Github โปรเจ็กต์นี้ใช้ LSIP เป็นเนื้อหาหลักเพื่อหารือเกี่ยวกับทฤษฎีและการปฏิบัติของ 'หน้าเว็บแบบรวม'
ข้อดี
Large-Scale Integrated Web Pages (LSIP) ส่งข้อมูลให้กับผู้ใช้และให้ความเป็นไปได้ทางเทคนิคในการคัดลอกข้อมูลเว็บไซต์ นี่เป็นสิ่งที่ตรงกันข้ามกับกลยุทธ์การรักษาความปลอดภัยของหน้าเว็บไดนามิกแบบเดิม หน้าเว็บแบบไดนามิกซ่อนชุดข้อมูลทั้งหมดในฐานข้อมูลด้านหลังเซิร์ฟเวอร์ ซึ่งผู้ใช้ไม่สามารถเข้าถึงได้โดยตรง หากแฮกเกอร์ข้ามสคริปต์เซิร์ฟเวอร์และดาวน์โหลดฐานข้อมูลของเว็บไซต์โดยตรง จะเรียกว่า 'ฐานข้อมูลแบบลาก' ซึ่งเป็นเครือข่ายที่ร้ายแรง เหตุการณ์ด้านความปลอดภัย
LSIP นั้นเป็น 'หน้าเว็บแบบคงที่' ในทางเทคนิค และมีข้อดีของหน้าเว็บแบบคงที่
ข้อมูลของ LSIP ไม่เพียงแต่เปิดให้กับผู้ใช้เท่านั้น แต่ยังรวมถึงอินเทอร์เน็ตด้วย นี่เป็นสิ่งที่แอปไม่เต็มใจที่จะทำ เว็บไซต์อื่นๆ รวมถึงเครื่องมือค้นหา สามารถดึงข้อมูล คัดลอก และนำข้อมูลกลับมาใช้ใหม่ได้ ซึ่งจะเพิ่มอัตราการนำข้อมูลกลับมาใช้ใหม่ อัตราการใช้ข้อมูลซ้ำที่เพิ่มขึ้นจะช่วยให้ข้อมูลนำไปใช้ต่อไปได้ เช่น สถิติ การระบุตัวตน การเรียนรู้ของเครื่อง และ LSIP เพื่อสร้างข้อมูลที่ได้รับ กระบวนการนี้มักเรียกว่า 'การขุดข้อมูล'
ข้อเสียคือ LSIP ผลิตและอัปเดตได้ยากกว่า อย่างไรก็ตาม ปัญหาเหล่านี้ตกเป็นหน้าที่ของผู้เขียนหน้าเว็บ ไม่ใช่หน้าที่ของผู้อ่าน
ธีมหรืออนาคต
การบูรณาการหน้าเว็บขนาดใหญ่เหมาะสำหรับข้อมูลสาธารณะตั้งแต่แรกเริ่ม เช่น บทบัญญัติทางกฎหมาย เอกสารนโยบาย ข้อมูลสาธารณะของรัฐบาล เป็นต้น ข้อมูลนี้อนุญาตให้ผู้ใช้คัดลอกโดยธรรมชาติ และ LSIP ช่วยให้ผู้ใช้สามารถคัดลอกได้เร็วขึ้น
หากว่ากันว่า "คลังข้อมูลเป็นกุญแจสำคัญของ AI ทุกประเภท" [1] LSIP ก็คือขุมทองสำหรับโมเดล AI ขนาดใหญ่ LSIP สามารถกลายเป็นรายการคลังข้อมูลสำหรับปัญญาประดิษฐ์ (AI)
ข้อมูลสาธารณะบางส่วนไม่เหมาะสำหรับ LSIP ข้อมูลที่เปลี่ยนแปลงได้ทุกที่ทุกเวลา เช่น ข้อมูลการจดทะเบียนชื่อโดเมนอินเทอร์เน็ต แม้ว่าผู้ใช้จะดาวน์โหลดชุดข้อมูลทั้งหมดในช่วงเวลาหนึ่ง แต่การเปลี่ยนแปลงในวินาทีถัดไปยังคงต้องมีการสอบถามบนเซิร์ฟเวอร์ ซึ่งไม่ได้บันทึกจำนวนการโต้ตอบของเครือข่าย ข้อมูลที่ไม่มีปริมาณชัดเจนไม่เหมาะสำหรับ LSIP การสร้างหน้าเว็บไม่สามารถดำเนินการให้เสร็จสิ้นได้
โดยสรุป Large Scale Integrated Web Pages (LSIP) เหมาะสำหรับข้อมูลสาธารณะและข้อมูลชุดที่จำกัด
ตัวชี้วัดทางเทคนิค
จำนวนลิงก์เพียงอย่างเดียวไม่สามารถประเมินได้ว่าหน้าเว็บกลายเป็น LSIP หรือไม่ มิฉะนั้น การทำให้หน้าเว็บน่าเกลียดและยาวอาจถึงมาตรฐานได้อย่างง่ายดาย เมื่อเราถอดชิ้นส่วนโทรศัพท์มือถือหรือคอมพิวเตอร์ เราจะเห็นว่าบล็อกวงจรรวมภายในมีขนาดเล็กมากและชิปส่วนใหญ่มีขนาดไม่ใหญ่ไปกว่ายางลบ และมีทรานซิสเตอร์จำนวนมากอยู่ข้างใน ซึ่งสะท้อนถึงความต้องการขนาดใหญ่ สเกล คุณสมบัติทางเทคนิคของ 'สามารถ' บูรณาการเป็นชิ้นเล็ก ๆ ' หน้าเว็บแบบรวมต้องใช้หน่วยเมตริกเพื่อวัดคุณลักษณะทางเทคนิคที่คล้ายคลึงกัน
Dameng ตั้งค่าตัวบ่งชี้ทางเทคนิคต่อไปนี้สำหรับ หน้าเว็บแบบรวม :
จำนวนลิงก์ทางสถิติภายใต้หัวข้อเดียวบนเพจ ไม่ใช่จำนวนลิงก์หน้าทั้งหมดธรรมดา แต่ต้องไม่รวมจำนวนลิงก์ภายในหัวข้อ เช่น ลิงก์การนำทางในส่วนหัวและส่วนท้าย ลิงก์ข้ามภายในหน้า และลิงก์โฆษณาที่ฝังไว้ ต้องถูกยกเว้น
ขนาดของหน้าเว็บที่เก็บถาวรเป็นไฟล์ .mht วัดเป็น KB หน้าเว็บจะถูกบันทึกเป็นหน้าเว็บไฟล์เดียว (.mht) โดยใช้เบราว์เซอร์ และเมื่อผู้ใช้เปิดในเครื่อง ลิงก์ทั้งหมดไปยังธีมของหน้าเว็บก็สามารถแสดงได้ กล่าวอีกนัยหนึ่ง 'จำนวนลิงก์ (LC)' จะไม่สูญหายไปหลังจากที่ผู้ใช้คัดลอกหน้าเว็บในเครื่องแล้ว mht เป็นตัวย่อของ 'MHTML' หรือที่เรียกว่า 'ไฟล์เก็บถาวรเว็บ/ไฟล์เก็บถาวรหน้าเว็บ'
อัตราส่วนของ 'จำนวนลิงก์' ต่อขนาดการเก็บถาวรของหน้าเว็บเรียกว่า 'ความหนาแน่นของลิงก์' สูตรการคำนวณ:
LD = LC / mht-size (KB)
หากจำนวนลิงก์ของหน้าเว็บเกิน 1,000 และความหนาแน่นของลิงก์มากกว่า 1 จะเรียกว่า 'หน้าเว็บรวมขนาดใหญ่' โดยมีเงื่อนไขดังนี้:
LSIP: LC ≥ 1000
& LD > 1
จากตัวอย่างหน้าเว็บที่มี 1,000 ลิงก์ ขนาดไฟล์เก็บถาวรจะต้องได้รับการควบคุมภายใน 1,000KB (1MB) ก่อนจึงจะเรียกว่า LSIP เมื่อคำนวณจากมุมมองอื่น กล่าวคือ ขนาดไฟล์เก็บถาวรที่ลิงก์ LSIP แต่ละลิงก์ต้องไม่เกิน 1KB ในวิชาฟิสิกส์ ความหนาแน่นของน้ำ (H2O) คือ 1 หากความหนาแน่นของวัตถุน้อยกว่า 1 วัตถุนั้นจะลอยอยู่บนน้ำ หากความหนาแน่นของลิงก์ (LD) ของหน้าเว็บน้อยกว่า 1 แสดงว่า หน้าเว็บ 'มีน้ำมากเกินไป' ไม่ใช่หน้าเว็บแบบรวมจริงๆ -
โครงการ LSIP โดยไดมอน
Dameng เสนอแนวคิดของ LSIP ในระหว่างการฝึกปฏิบัติในการสร้างหน้าเว็บ และชี้แจงทิศทางของการปฏิบัติหลังจากเสนอแนวคิดของ LSIP หน้าเว็บสี่หน้าสามารถเรียกได้ว่าเป็น LSIP ทั่วไป:
ตัวชี้วัดทางเทคนิคของโครงการ LSIP เหล่านี้มีดังนี้:
ชื่อโครงการและเวอร์ชัน | จำนวนลิงก์ (LC) | ขนาดไฟล์เก็บถาวร | ความหนาแน่นของลิงก์ (LD) |
---|---|---|---|
ตารางประเทศ v0.7.7 | 1431 | 662 KB | 2.168 |
องค์กรกลางแชร์ v0.4.1 | 1109 | 358 KB | 3.098 |
วิธีการรวบรวม v0.9.4 | 3045 | 542 KB | 5.618 |
Qianxian.com เวอร์ชัน 0.6.7 | 3205 | 559 KB | 5.733 |
เอกสารที่เกี่ยวข้อง:
ตั้งชื่อ
แนวทางปฏิบัติของ 'หน้าเว็บรวม' ปรากฏขึ้นครั้งแรกในปี 2019 เมื่อ Dameng ผลิตหน้าเว็บ "Old Cliché Cloud Media" Dameng ประสบปัญหาในการค้นหาเว็บไซต์สื่ออย่างเป็นทางการจากสถานที่ต่างๆ ในช่วงแรก ๆ ของการแพร่ระบาดของโควิด-19 เขาจึงคิดขึ้นมาว่า แนวคิดในการรวมเว็บไซต์สื่ออย่างเป็นทางการทั้งหมดไว้บนหน้าเว็บ...
ที่มาและการตั้งชื่อของ LSIP{:target="_top"}
แนวคิดใหม่เกิดขึ้นแล้ว! "เครือข่ายรัฐบาลจีนพันมณฑล" สามารถเรียกได้ว่า: 'หน้าเว็บบูรณาการขนาดใหญ่'! อังกฤษ: หน้าเว็บบูรณาการขนาดใหญ่ ย่อว่า: LSIP
วงจรรวมขนาดใหญ่ LSIC หมายถึงวงจรที่รวมทรานซิสเตอร์มากกว่า 1,000 ตัว
การรวมหน้าเว็บขนาดใหญ่ LSIP หมายถึงการรวมหน้าเว็บเข้ากับไฮเปอร์ลิงก์มากกว่า 1,000 รายการ
ค่าใช้จ่าย
LSIC ได้รับความนิยมเนื่องจากมีโซลูชันราคาประหยัดสำหรับความต้องการที่หลากหลาย และ LSIP ก็ต้องการข้อได้เปรียบนี้เช่นกัน
วัตถุดิบหลักของ LSIC มีราคาถูกมาก ซึ่งก็คือซิลิกา (ทราย) และสามารถละเลยต้นทุนวัตถุดิบได้ ดังนั้นต้นทุนของ LSIC จึงอยู่ที่ลิงค์การออกแบบและลิงค์การผลิต (การคัดลอก) เป็นหลัก และแรงงานมักถูกแบ่งระหว่างบริษัทต่างๆ ตัวอย่างเช่น Huawei ออกแบบชิป HiSilicon และส่งมอบให้กับ TSMC เพื่อการผลิต
วัตถุดิบหลักของ LSIP คือข้อมูลเว็บไซต์ (ไฮเปอร์ลิงก์) ซึ่งมักจะได้มาง่าย ในขณะที่การผลิต (การคัดลอก) หน้าเว็บมีค่าใช้จ่ายเกือบเป็นศูนย์ ดังนั้นต้นทุน LSIP จึงมุ่งเน้นไปที่กระบวนการออกแบบ การออกแบบวงจรรวมค่อนข้างยากและต้องการความช่วยเหลือจากคอมพิวเตอร์ เว็บเพจรวมก็จะพัฒนาไปในทิศทางนี้เช่นกัน
แต่ LSIP ก็มีค่าใช้จ่ายที่ฮาร์ดแวร์ไม่มีเช่นกัน - การอัปเดต หลังจากจำหน่ายฮาร์ดแวร์แบบเดิมแล้ว โดยทั่วไปจะไม่มีการอัพเดตผลิตภัณฑ์ยกเว้นการซ่อมแซมข้อบกพร่อง เมื่อหน่วยความจำโทรศัพท์มือถือของเราเต็ม เราจะหาผู้ผลิตเพื่อทดแทนด้วยหน่วยความจำที่ใหญ่กว่านี้ได้หรือไม่ ไม่สามารถ ยกเว้นหัวเว่ย! [2] แต่หน้าเว็บแบบรวมสามารถอัพเกรดให้ใหญ่ขึ้นและใหม่กว่าได้ สาระสำคัญของ LSIP คือผลิตภัณฑ์ที่ครอบคลุมซึ่งรวมเอกสาร ซอฟต์แวร์ และโครงการอินเทอร์เน็ต เอกสารมีงานตรวจสอบ ซอฟต์แวร์มีงานอัปเกรด และอินเทอร์เน็ตมีงานอัปเดต สาขาต่างๆ มีความคิดเห็นที่แตกต่างกันเกี่ยวกับการบำรุงรักษาผลิตภัณฑ์ในภายหลัง แน่นอนว่าผู้อ่านจะตั้งตารอที่จะได้เห็นเนื้อหาล่าสุดและครอบคลุมที่สุดบน LSIP ซึ่งเป็นเป้าหมายการอัปเดตของ LSIP
โดยสรุป ต้นทุนของวัตถุดิบหลักสำหรับทั้งสองนั้นต่ำมาก ต้นทุนของวงจรรวมอยู่ที่การออกแบบและการผลิต ในขณะที่ต้นทุนของหน้าเว็บรวมอยู่ที่การออกแบบและการอัปเดต หากต้องการเข้าร่วมทีมผู้สร้าง LSIP คุณต้องเตรียมความสามารถในการออกแบบและอัปเดต
ซอฟต์แวร์การออกแบบ
การออกแบบ LSIP สามารถแบ่งออกเป็นสามขั้นตอน: ขั้นตอนแรก: ข้อมูล หลังจากการสกัดและการทำให้บริสุทธิ์จะเข้าสู่ขั้นตอนที่สอง: ข้อมูล มันเชื่อมโยงและจัดระเบียบเพื่อสร้างฐานข้อมูลในที่สุดรหัส HTML จะถูกส่งออกผ่านฐานข้อมูลไปยัง ขั้นตอนที่สาม: หน้าเว็บ .
เพิ่งเสนอแนวคิด LSIP ปัจจุบันไม่มีซอฟต์แวร์การออกแบบเฉพาะทางในอุตสาหกรรมไอที แต่มีซอฟต์แวร์สำเร็จรูปสำหรับขั้นตอนการออกแบบสามขั้นตอน ด้วยการผสมผสานระหว่างฟังก์ชันซอฟต์แวร์และงานเขียนโปรแกรมแบบ low-code การออกแบบ LSIP จึงเป็นแบบกึ่งอัตโนมัติ ซึ่งช่วยปรับปรุงประสิทธิภาพการออกแบบได้อย่างมาก Dameng แสดงรายการต่อไปนี้ตามประสบการณ์การออกแบบของเขาเอง:
การรวบรวมข้อมูล การรวบรวมข้อมูล
การแปลงข้อมูลเป็นดิจิทัล การแปลงข้อมูลเป็นดิจิทัล
หน้าเว็บ การแปลง ข้อมูล
Dameng หวังว่า LSIP จะเหมาะสำหรับการอ่านของมนุษย์และสะดวกสำหรับการดึงข้อมูลจากเครื่อง ซึ่งสอดคล้องกับวิสัยทัศน์ของ 'Semantic Web' ที่เสนอโดย W3C นี่เป็นความท้าทายในระดับการออกแบบ
หลังจากการออกแบบ LSIP เสร็จสิ้นและเข้าสู่ขั้นตอนการบำรุงรักษา จะดำเนินการตรวจจับเว็บไซต์เป็นหลักเพื่อให้แน่ใจว่าลิงก์มีความถูกต้อง
Dameng หวังว่า ผู้ที่มีความรู้ลึกซึ้ง จะเข้าร่วมทีมผู้สร้าง LSIP ทุกคนสามารถออกแบบและผลิต 'หน้าเว็บบูรณาการขนาดใหญ่' ในสาขาที่สนใจเพื่อสนับสนุนการพัฒนาคุณภาพสูงของมาตุภูมิ!
ฉันหวังว่าผู้ใช้ภาษาอื่น ๆ จะสร้างโครงการ LSIP ให้กับพลเมืองของตน ซึ่งสามารถช่วยให้ผู้คนเข้าใจโลกโดยรวมได้ง่ายขึ้น ซึ่ง Twitter และ Facebook ไม่สามารถทำได้
ผู้อ่านสามารถฝากข้อความไว้เพื่อการอภิปรายได้ และผู้ใช้ GitHub ก็สามารถส่งประเด็นต่างๆ ได้
'หน้าเว็บรวม' คือเว็บฟอร์มใหม่ที่ใช้เวิลด์ไวด์เว็บ (WWW): รวมไฮเปอร์ลิงก์ทั้งหมดภายใต้หัวข้อเดียวกันบนหน้าเว็บเดียว เพื่อใช้งาน URL ชุดเต็มสำหรับหัวข้อนั้น
เมื่อจำนวนไฮเปอร์ลิงก์เกินหนึ่งพันลิงก์ จะเรียกว่า 'Large Scale Integrated web Page' (LSIP) ซึ่งตั้งชื่อโดย DiamonWoo บน github.com , 202207
หากคุณมีความตั้งใจอันแรงกล้าและใจบริสุทธิ์ เข้าร่วมเลย!
CC 3.0 BY-NC-ND 可转载-需署名-非演绎
大规模集成网页(LSIP)© 2022-2023 大萌
https://diamonwoo.github.io/LSIP
Version 0.5.2 202406
LSIP เป็นโครงการที่สืบเนื่องมาจากเว็บไซต์โบราณ