Magic Square Quantization lanza DeepSeek-V3: rendimiento comparable al GPT-4, el costo de capacitación alcanza un mínimo histórico
Magic Square Quantitative lanzó una nueva generación del modelo grande DeepSeek-V3 la noche del 26 de diciembre, mostrando un avance tecnológico sorprendente. Este modelo que utiliza la arquitectura MoE (Mixed Experts) no solo es comparable en rendimiento
2024-12-30