Disiksa dan menangis! Epoch AI meluncurkan FrontierMath, sebuah tolok ukur baru untuk matematika. Model AI teratas memecahkan tidak lebih dari 2% masalah
Tes benchmark baru FrontierMath lahir untuk menantang batas kemampuan penalaran matematis AI! Editor Downcodes mengetahui bahwa FrontierMath, yang dibuat oleh Epoch AI dan lebih dari 60 pakar matematika terkemuka, berisi ratusan masalah matematika di luar
2024-12-01