Recientemente, el modelo Big Yi-34b bajo cero-1000W ha causado una controversia generalizada sobre el uso de la arquitectura de LLAMA pero modificando el nombre del tensor. Este comportamiento ha causado fuertes dudas en la comunidad de código abierto, y muchos creen que es una manifestación de falsas propaganda y violaciones de licencias. Los miembros de la comunidad señalaron que si bien el modelo afirma estar basado en la arquitectura de la llama, modificando el nombre del tensor, cero diez mil parece estar tratando de enmascarar su verdadera fuente tecnológica, que es directamente contraria al espíritu del protocolo de código abierto.
Frente a dudas externas, la compañía de cero 1000 cosas respondió rápidamente. La compañía dijo que el modelo YI-34B en realidad se basa en la estructura GPT, no en la arquitectura de llamas. Explicaron que los nombres de tensor en el código fueron renombrados debido a los requisitos de capacitación y los ajustes técnicos, pero eso no significa que la arquitectura central del modelo haya cambiado. La compañía enfatizó que esta modificación era para la optimización técnica, no para eludir los requisitos de los protocolos de código abierto.
El núcleo de la controversia se centra en dos aspectos: primero, ¿YI-34B viola el protocolo de código abierto? La comunidad de código abierto cree que el comportamiento de modificar los nombres de tensores puede violar la licencia de código abierto de la arquitectura de llamas, especialmente si cero-100 cosas no les informan explícitamente de su comportamiento de modificación. En segundo lugar, los parámetros de rendimiento del modelo y la transparencia de las modificaciones del código también se han convertido en el foco. La comunidad requiere cero 100 para revelar más detalles técnicos para demostrar la independencia y la innovación de su modelo.
Esta controversia no se trata solo del modelo YI-34B en sí, sino que también toca el problema de la confianza entre la comunidad de código abierto y las empresas comerciales. El núcleo del software de código abierto radica en transparencia y colaboración, y cuando las empresas comerciales usan tecnología de código abierto, a menudo necesitan encontrar un equilibrio entre la innovación y el cumplimiento. El cero mil caso nos recuerda que cualquier modificación para el código de código abierto debe seguir el protocolo y ser transparente para evitar una controversia legal y moral innecesaria.
Además, este incidente también ha provocado discusiones sobre el desarrollo de la tecnología modelo a gran escala. Con el rápido desarrollo de la tecnología de IA, cada vez más empresas están comenzando a desarrollar sus propios modelos basados en arquitecturas de código abierto. Sin embargo, cómo mantener el respeto por la comunidad de código abierto en la innovación se ha convertido en un problema urgente para resolverse. La controversia sobre cero y diez mil cosas puede ser solo el comienzo, y los casos similares pueden aparecer con mayor frecuencia en el futuro.
En general, la controversia sobre el modelo YI-34B no solo expone la contradicción potencial entre la comunidad de código abierto y las empresas comerciales, sino que también nos brinda la oportunidad de reflexionar. Si bien la innovación tecnológica, cómo garantizar el cumplimiento y la transparencia serán un desafío que todos los desarrolladores de IA necesitan enfrentar juntos. Si la respuesta de las cosas cero-10 puede calmar la controversia aún por verificar aún más por el tiempo y la comunidad.