Hugging Face เปิดตัว Cosmopedia ซึ่งเป็นชุดข้อมูลสังเคราะห์แบบเปิดขนาดใหญ่ที่ประกอบด้วยโทเค็น 25 พันล้านโทเค็น ซึ่งเป็นทรัพยากรที่มีคุณค่าสำหรับการวิจัยข้อมูลสังเคราะห์ ชุดข้อมูลนี้มาจากข้อมูลหน้าเว็บและครอบคลุมหัวข้อต่างๆ ทำให้ผู้ใช้สามารถโหลดข้อมูลในพาร์ติชันเฉพาะตามความต้องการได้ง่าย และให้ชุดย่อยที่เล็กลงเพื่ออำนวยความสะดวกให้ผู้ใช้สามารถเริ่มต้นและทดลองได้อย่างรวดเร็ว การเปิดตัว Cosmopedia มอบความเป็นไปได้ใหม่ๆ สำหรับการวิจัยและการประยุกต์ในด้านปัญญาประดิษฐ์ และยังถือเป็นความก้าวหน้าครั้งสำคัญในด้านขนาดและขอบเขตการใช้งานของชุดข้อมูลแบบเปิด โดยจะอำนวยความสะดวกในการฝึกอบรมโมเดลและการวิจัยในวงกว้างขึ้น และขับเคลื่อนการพัฒนาเทคโนโลยีข้อมูลสังเคราะห์เพิ่มเติม
ชุดข้อมูล Cosmopedia ที่เผยแพร่โดย HuggingFace มีขนาด 25 พันล้านโทเค็น ทำให้เป็นเหตุการณ์สำคัญในด้านข้อมูลสังเคราะห์ การเปิดกว้างของชุดข้อมูลนี้จะส่งเสริมการวิจัยทางวิชาการและนวัตกรรมทางเทคโนโลยี และส่งเสริมการพัฒนาด้านปัญญาประดิษฐ์ วิธีการเข้าถึงข้อมูลที่สะดวกและใช้งานง่ายยังช่วยลดอุปสรรคในการใช้และให้โอกาสแก่นักวิจัยมากขึ้น เราหวังว่าจะได้รับผลการวิจัยที่น่าประหลาดใจเพิ่มเติมจาก Cosmopedia ในอนาคต