Anthrope anunció recientemente que su modelo de soneto Claude 3.5 ha agregado capacidades de procesamiento de archivos PDF, y ahora ha ingresado a la etapa beta pública. Esta función permite a los usuarios analizar los elementos de texto y visuales en los documentos PDF, incluidas las imágenes, los gráficos y las tablas. Este movimiento amplía aún más las funciones de Claude, proporcionando a los usuarios capacidades de procesamiento de documentos más fuertes y mejorando la eficiencia laboral.
Recientemente, la compañía de inteligencia artificial Anthrope anunció que ha agregado capacidades de procesamiento de archivos PDF a su modelo de soneto Claude 3.5, que ahora ha ingresado a la fase de prueba pública. Los usuarios ahora pueden usar el modelo para analizar elementos de texto y visuales en documentos PDF, incluidas imágenes, cuadros y tablas, para una variedad de escenarios como informes financieros, documentos legales y traducción de documentos.
El proceso de procesamiento PDF del soneto Claude 3.5 se divide en tres pasos. Primero, el sistema extrae contenido de texto del documento. Luego, cada página del documento se convierte en una imagen para un análisis más profundo. Esto permite a los usuarios no solo obtener información de texto, sino también obtener información sobre la información visual en los archivos PDF.
Vale la pena mencionar que la función PDF de Claude también se puede usar junto con otras características, como extraer información específica y usarla como entrada de herramienta. Cabe señalar que los archivos cargados deben ser inferiores a 32 MB, y el número de páginas no debe exceder las 100 páginas. El sistema actualmente no admite documentos cifrados o protegidos con contraseña.
El costo de procesar archivos PDF varía según la longitud del documento y la densidad de contenido. Por lo general, se consumen 1,500 a 3.000 tokens por página sin cargos adicionales que excedan la tarifa de token estándar. Los usuarios pueden usar esta nueva característica a través de la vista previa de la función de chat de Claude y el acceso a la API, que requiere el uso de un encabezado de solicitud específico "Anthrope-beta: PDFS-2024-09-25" en solicitudes de API. Anthrope planea expandir esta función a Amazon Bedrock y Google Vertex AI Platforms en el futuro.
Para mejorar el procesamiento, Anthrope recomienda que los usuarios se aseguren de que el documento tenga un texto claro y legible y que el diseño de la página sea correcto. Además, al citar contenido específico, los usuarios deben usar el número de página que se muestra en el lector PDF. Y durante el uso de API, los archivos PDF deben colocarse antes del texto. Si el documento es más grande y excede el límite, Anthrope recomienda dividirlo en secciones más pequeñas. Finalmente, al analizar el mismo documento varias veces, los usuarios también pueden considerar usar la memoria caché rápida para mejorar la eficiencia del procesamiento.
Puntos clave:
Anthrope inicia el soneto Claude 3.5, agregando capacidades de procesamiento de archivos PDF para admitir el análisis de texto e imágenes.
El proceso de procesamiento se divide en tres pasos: extraer texto, convertir páginas en imágenes y análisis integral.
Los costos de procesamiento varían según la longitud del documento y la densidad de contenido, y los usuarios están sujetos al tamaño del archivo y los límites de la página.
La función de procesamiento PDF de Claude 3.5 Sonnet proporciona a los usuarios soluciones de análisis de documentos eficientes y convenientes se ampliará aún más en el futuro.