Modelo de aprendizaje de representación de lenguaje visual de código abierto Gelingshentong RWKV-CLIP
Gelingshentong ha abierto el modelo RWKV-CLIP, que es un alumno de representación de lenguaje visual que combina las ventajas de Transformer y RNN. El modelo mejora significativamente el rendimiento en tareas visuales y de lenguaje al ampliar el conjunto
2024-12-13