Conéctese conmigo en LinkedIn si tiene un proyecto de interrupción/intereses comunes. https://www.linkedin.com/in/mayankladdha31/
Cómo los ajustes menores en el preprocesamiento de consultas y el refinamiento rápido podrían mejorar la recuperación y los resultados finales: Multihop-Rag es un conjunto de datos de control de calidad para evaluar la recuperación y el razonamiento en todos los documentos con metadatos en las tuberías #RAG. Contiene consultas, con evidencia de cada consulta distribuida en 2 a 4 documentos. Primero probé una recuperación simple. Para inferencia_query, los resultados no fueron tan malos. Pero para otros tipos de consultas (comparación y temporal), los resultados fueron bastante pobres. Luego, intenté ver si podemos mejorar para otros tipos de consultas mediante el preprocesamiento de consultas menores (tratando de obtener fragmentos más relevantes dividiendo la consulta en frases relevantes) y ajustando un poco el mensaje.
Observé una mejora notable. Si bien algunas respuestas fueron incorrectas, la mejora general de la versión anterior fue significativa. Podemos tratar de ajustar el mensaje, usar un mejor modelo (GPT4), experimentar con diferentes estrategias (hacer un mejor uso de metadatos, probar diferentes métodos de fragmentación), puede ser un gráfico de conocimiento. Mi objetivo no era obtener la mejor precisión, sino ver si los ajustes menores en el preprocesamiento de consultas y el refinamiento rápido podrían mejorar la recuperación y los resultados finales. Y lo hace.