Apple schlägt den MAD-Bench-Benchmark vor, um das Problem der multimodalen Halluzination großer Sprachmodelle zu lösen
Apple Research hat den MAD-Bench-Benchmark vorgeschlagen, um das Problem der Anfälligkeit multimodaler großer Sprachmodelle (MLLMs) beim Umgang mit irreführenden Informationen zu lösen. Diese Studie umfasste 850 Bild-Cue-Paare und bewertete die Fähigkeit
2025-01-05