เมื่อเร็วๆ นี้ Anthropic ประกาศว่ารุ่น Claude 3.5 Sonnet ได้เพิ่มความสามารถในการประมวลผลไฟล์ PDF และขณะนี้ได้เข้าสู่ขั้นตอนการทดสอบสาธารณะแล้ว ฟังก์ชันนี้ช่วยให้ผู้ใช้วิเคราะห์ข้อความ รูปภาพ แผนภูมิ และตารางในเอกสาร PDF และใช้ได้กับแอปพลิเคชันที่หลากหลาย รวมถึงรายงานทางการเงิน เอกสารทางกฎหมาย และการแปลเอกสาร เครื่องมือแก้ไข Downcodes จะอธิบายรายละเอียดคุณสมบัติ การใช้งาน และข้อควรระวังของคุณสมบัติใหม่นี้ เพื่อช่วยให้คุณเข้าใจและใช้เครื่องมือ AI อันทรงพลังนี้ได้ดียิ่งขึ้น
กระบวนการประมวลผล PDF ของ Claude 3.5 Sonnet แบ่งออกเป็นสามขั้นตอน ขั้นแรก ระบบจะแยกเนื้อหาที่เป็นข้อความออกจากเอกสาร จากนั้นแต่ละหน้าของเอกสารจะถูกแปลงเป็นรูปภาพเพื่อการวิเคราะห์เชิงลึก ด้วยวิธีนี้ ผู้ใช้ไม่เพียงสามารถรับข้อมูลข้อความเท่านั้น แต่ยังได้รับข้อมูลเชิงลึกเกี่ยวกับข้อมูลภาพในไฟล์ PDF อีกด้วย
เป็นที่น่าสังเกตว่าฟังก์ชัน PDF ของ Claude สามารถใช้ร่วมกับคุณสมบัติอื่นๆ ได้ เช่น การแยกข้อมูลเฉพาะและใช้เป็นอินพุตเครื่องมือ ควรสังเกตว่าไฟล์ที่อัปโหลดต้องมีขนาดน้อยกว่า 32MB และจำนวนหน้าต้องไม่เกิน 100 หน้า ขณะนี้ระบบไม่รองรับเอกสารที่เข้ารหัสหรือป้องกันด้วยรหัสผ่าน
ค่าใช้จ่ายในการประมวลผลไฟล์ PDF จะแตกต่างกันไปขึ้นอยู่กับความยาวและความหนาแน่นของเนื้อหาของเอกสาร โดยทั่วไป มีการใช้โทเค็น 1,500 ถึง 3,000 โทเค็นต่อหน้าเอกสารโดยไม่มีค่าใช้จ่ายเพิ่มเติมนอกเหนือจากค่าธรรมเนียมโทเค็นมาตรฐาน ผู้ใช้สามารถใช้ฟีเจอร์ใหม่นี้ผ่านการดูตัวอย่างฟีเจอร์ Claude Chat และการเข้าถึง API ส่วนหัวคำขอเฉพาะ "anthropic-beta: pdfs-2024-09-25" จำเป็นต้องใช้ในคำขอ API Anthropic วางแผนที่จะขยายฟังก์ชันการทำงานนี้ไปยังแพลตฟอร์ม Amazon Bedrock และ Google Vertex AI ในอนาคต
เพื่อปรับปรุงการประมวลผล Anthropic แนะนำให้ผู้ใช้ตรวจสอบให้แน่ใจว่าเอกสารมีข้อความที่ชัดเจนและอ่านได้ และเค้าโครงหน้าถูกต้อง นอกจากนี้ เมื่ออ้างอิงเนื้อหาเฉพาะ ผู้ใช้ควรใช้หมายเลขหน้าที่แสดงในโปรแกรมอ่าน PDF เมื่อใช้ API ควรวางไฟล์ PDF ไว้หน้าข้อความ หากเอกสารมีขนาดใหญ่เกินขีดจำกัด Anthropic แนะนำให้แบ่งเอกสารออกเป็นส่วนเล็กๆ สุดท้ายนี้ เมื่อวิเคราะห์เอกสารเดียวกันหลายครั้ง ผู้ใช้อาจพิจารณาใช้แคชคำใบ้เพื่อปรับปรุงประสิทธิภาพการประมวลผล
ฟังก์ชันการประมวลผล PDF ของ Claude 3.5 Sonnet ช่วยให้ผู้ใช้มีวิธีการประมวลผลเอกสารที่มีประสิทธิภาพและสะดวกยิ่งขึ้น และฉันเชื่อว่าฟังก์ชันนี้จะถูกนำไปใช้อย่างแพร่หลายในด้านอื่นๆ ในอนาคต การปรับปรุงและการเพิ่มประสิทธิภาพอย่างต่อเนื่องของ Anthropic ก็คุ้มค่าที่จะรอคอย!