En su última investigación, el científico informático del MIT, Luo Hongyin, señaló que los modelos actuales de idiomas grandes como GPT-4 tienen limitaciones significativas en el razonamiento lógico preciso. Aunque estos modelos funcionan bien en el manejo de las tareas del lenguaje natural, a menudo luchan por lograr la precisión esperada cuando se trata de razonamiento estructurado y controlable.
Luo Hongyin y su equipo de investigación creen que la raíz de este problema radica en el hecho de que los modelos de lenguaje grande dependen demasiado de los datos de lenguaje masivo para la capacitación, mientras que el lenguaje natural en sí carece de un mecanismo de expresión lógica preciso. La ambigüedad, la ambigüedad y la dependencia del contexto en los textos del lenguaje dificulta que el modelo capture relaciones lógicas estrictas, afectando así la precisión del razonamiento.
Para superar este desafío, el equipo de investigación propuso un enfoque innovador llamado NLEP (lenguaje natural al programa ejecutable). La idea central de este enfoque es transformar las descripciones del lenguaje natural en el código del programa ejecutable, lo que permite un razonamiento estructurado más preciso. De esta manera, NLEP puede convertir la lógica del lenguaje complejo en instrucciones que las computadoras pueden ejecutar directamente, asegurando la precisión y la capacidad de control del proceso de inferencia.
En las pruebas experimentales, el método NLEP mostró ventajas significativas. El equipo de investigación realizó una prueba comparativa en tareas de inferencia múltiple, y los resultados mostraron que NLEP puede resolver los problemas de inferencia en los ejemplos 100% precisos, y su rendimiento supera con creces otros métodos como el intérprete de código GPT. Este logro no solo verifica la efectividad de NLEP, sino que también proporciona una nueva dirección para el desarrollo futuro de la inteligencia artificial en el campo del razonamiento lógico.
Luo Hongyin predice además que el desarrollo futuro de la inteligencia artificial puede presentar un patrón de IA simbólica complementaria y la IA empirista. La IA simbolista se destaca en un razonamiento lógico preciso y tareas estructuradas, mientras que el empirista IA tiene ventajas en el procesamiento de datos a gran escala y la comprensión del lenguaje natural. La combinación de los dos ayudará a construir un sistema de inteligencia artificial más completo e inteligente y promover la aplicación de la tecnología de IA en una gama más amplia de campos.
En general, la investigación de Luo Hongyin proporciona nuevas soluciones a las limitaciones de los modelos de idiomas grandes y atrae un plan prometedor para el desarrollo futuro de la inteligencia artificial. Con la mejora continua de métodos como NLEP, tenemos razones para creer que el rendimiento de la IA en el razonamiento lógico y las tareas estructuradas marcarán el comienzo de los nuevos avances.