Anthropic baru-baru ini mengumumkan bahwa model Claude 3.5 Sonnet-nya telah menambahkan kemampuan pemrosesan file PDF dan kini telah memasuki tahap pengujian publik. Fungsi ini memungkinkan pengguna menganalisis teks, gambar, bagan, dan tabel dalam dokumen PDF, dan berlaku untuk berbagai aplikasi, termasuk laporan keuangan, dokumen hukum, dan terjemahan dokumen. Editor Downcodes akan menjelaskan secara rinci fitur, penggunaan, dan tindakan pencegahan fitur baru ini untuk membantu Anda lebih memahami dan menggunakan alat AI canggih ini.
Proses pemrosesan PDF Claude 3.5 Soneta dibagi menjadi tiga langkah. Pertama, sistem mengekstraksi konten tekstual dari dokumen. Setiap halaman dokumen kemudian diubah menjadi gambar untuk analisis lebih dalam. Dengan cara ini, pengguna tidak hanya dapat memperoleh informasi teks, tetapi juga memperoleh wawasan tentang informasi visual dalam file PDF.
Perlu disebutkan bahwa fungsionalitas PDF Claude juga dapat digunakan bersama dengan fitur lain, seperti mengekstrak informasi spesifik dan menggunakannya sebagai masukan alat. Perlu diperhatikan bahwa file yang diunggah harus kurang dari 32MB dan jumlah halaman tidak boleh melebihi 100 halaman. Sistem saat ini tidak mendukung dokumen terenkripsi atau dilindungi kata sandi.
Biaya pemrosesan file PDF akan bervariasi tergantung pada panjang dan kepadatan konten dokumen. Biasanya, 1.500 hingga 3.000 token dikonsumsi per halaman dokumen tanpa biaya tambahan di atas biaya token standar. Pengguna dapat menggunakan fitur baru ini melalui pratinjau fitur Claude Chat dan akses API. Header permintaan khusus "anthropic-beta: pdfs-2024-09-25" perlu digunakan dalam permintaan API. Anthropic berencana untuk memperluas fungsi ini ke platform Amazon Bedrock dan Google Vertex AI di masa depan.
Untuk meningkatkan pemrosesan, Anthropic merekomendasikan pengguna untuk memastikan bahwa dokumen memiliki teks yang jelas dan dapat dibaca serta tata letak halaman sudah benar. Selain itu, saat mereferensikan konten tertentu, pengguna harus menggunakan nomor halaman yang ditampilkan di pembaca PDF. Saat menggunakan API, file PDF harus ditempatkan sebelum teks. Jika dokumen lebih besar dari batas, Anthropic menyarankan untuk membaginya menjadi bagian-bagian yang lebih kecil. Terakhir, saat menganalisis dokumen yang sama beberapa kali, pengguna juga dapat mempertimbangkan untuk menggunakan cache petunjuk untuk meningkatkan efisiensi pemrosesan.
Fungsi pemrosesan PDF Claude 3.5 Sonnet memberi pengguna cara yang lebih efisien dan nyaman untuk memproses dokumen, dan saya yakin ini akan digunakan secara luas di lebih banyak bidang di masa depan. Peningkatan dan optimalisasi berkelanjutan dari Anthropic juga patut dinantikan!