repo นี้มีชุด .traineddata
หลายชุดที่ Tesseract.js สามารถใช้ได้ ซึ่งรวมถึงไฟล์ที่ใช้โดย Tesseract.js เป็นค่าเริ่มต้น เช่นเดียวกับเวอร์ชันอื่นๆ เนื้อหาของไฟล์และวิธีการใช้กับ Tesseract.js มีอธิบายไว้ด้านล่างนี้
คำอธิบายของไฟล์แต่ละชุดอยู่ด้านล่าง แหล่งที่มายังแสดงอยู่ในรายการด้วย แม้ว่าเวอร์ชันที่ใช้ที่นี่อาจไม่สะท้อนถึงเวอร์ชันล่าสุดของไฟล์ใน repo ที่เชื่อมโยง
4.0.0_best_int
- "Tessdata Best" เวอร์ชันรวม4.0.0
- "เทสดาต้า"4.0.0-fast
- "Tessdata เร็ว"4.0.0_best
- "Tessdata ดีที่สุด"3.0.2
- ไฟล์ Tessdata ประวัติศาสตร์จาก Tesseract v3 ไฟล์ 4.0.0
และ 4.0.0_best_int
สำหรับแต่ละภาษาได้รับการเผยแพร่ในแพ็คเกจ NPM เฉพาะภาษา แต่ละภาษามีแพ็คเกจของตัวเองเนื่องจากการรวมเป็นแพ็คเกจเดียวจะนำไปสู่การดาวน์โหลดจำนวนมหาศาล แพ็กเกจมีชื่อว่า @tesseract.js-data/{lang}
ตัวอย่างเช่น แพ็คเกจภาษาอังกฤษชื่อ @tesseract.js-data/eng
ดูเอกสาร Tesseract.js สำหรับคำแนะนำเกี่ยวกับวิธีตั้งค่า langPath
ด้วยตนเอง รายละเอียดเกี่ยวกับตำแหน่งไฟล์ใน Repo นี้สามารถพบได้ที่ด้านล่างนี้
ไฟล์เหล่านี้สามารถเข้าถึงได้โดยใช้ CDN ใดก็ได้ที่จะสะท้อน NPM โดยอัตโนมัติ ตัวอย่างยอดนิยมอยู่ด้านล่าง
ตามค่าเริ่มต้น Tesseract.js จะใช้ JSDelivr CDN ลิงก์สำหรับข้อมูลภาษาอังกฤษเริ่มต้นบน JSDelivr อยู่ด้านล่าง https://cdn.jsdelivr.net/npm/@tesseract.js-data/[email protected]/4.0.0_best_int/eng.traineddata.gz
Unpkg เป็นอีกหนึ่ง CDN ที่สะท้อน NPM ในภูมิภาคส่วนใหญ่ unpkg ดูเหมือนจะมีความน่าเชื่อถือน้อยกว่า JSDelivr เล็กน้อย (แม้ว่าจะยังใช้งานได้ก็ตาม) อย่างไรก็ตาม ผู้ใช้รายงานว่า unpkg สามารถเข้าถึงได้ในบางส่วนของประเทศจีนที่ JSDelivr ถูกบล็อก ดังนั้นให้ใช้ unpkg ด้วยเหตุผลดังกล่าว คุณสามารถดูการอภิปรายเกี่ยวกับปัญหานี้ รวมถึงโค้ดตัวอย่างที่เปลี่ยนจาก JSDelivr เป็น unkpg
ได้ที่นี่
ลิงก์สำหรับข้อมูลภาษาอังกฤษเริ่มต้นใน unkpkg อยู่ด้านล่าง https://unpkg.com/@tesseract.js-data/eng/4.0.0_best_int/eng.traineddata.gz
ผู้ใช้มีอิสระในการใช้สำเนาไฟล์เหล่านี้ในเครื่องของตนเอง แทนที่จะอาศัย CDN ระยะไกล สำหรับ Node.js คุณสามารถเพิ่มแพ็คเกจ NPM ที่เกี่ยวข้องเป็นการพึ่งพา หรือดาวน์โหลดไฟล์และรวมเป็นทรัพยากรโปรเจ็กต์ สำหรับเวอร์ชันเบราว์เซอร์ เพียงดาวน์โหลดไฟล์ที่เกี่ยวข้องและโฮสต์ไฟล์เหล่านั้นบนเว็บไซต์ของคุณ
ไซต์ tessdata.projectnaptha.com
เสื่อมราคาแล้ว และไม่ได้รับการอัปเดตอีกต่อไป อย่าชี้โค้ดใหม่ไปที่ไซต์นี้
ใน Tesseract.js เวอร์ชันเก่า ตำแหน่ง langPath
เริ่มต้นคือไซต์หน้า GitHub แบบธรรมดาที่โฮสต์ repo นี้ อย่างไรก็ตาม นอกเหนือจากผู้ใช้ที่รายงานว่าเพจ GitHub ไม่น่าเชื่อถือแล้ว ตอนนี้ repo นี้มีขนาดเกินขีดจำกัดขนาดเพจ GitHub ดังนั้นไซต์นั้นจึงไม่ได้รับการอัพเดตอีกต่อไป ไซต์นี้ถูกปล่อยทิ้งไว้ตามเดิมเพื่อหลีกเลี่ยงไม่ให้โค้ดเก่าเสียหาย อย่างไรก็ตาม นักพัฒนาควรเปลี่ยนมาใช้