GPT-4o, o1 и Claude не смогли выполнить «большинство» реальных фриланс-задач на программирование — исследование OpenAI

Больше всех на платформе для фрилансеров Upwork «заработал» бы Claude 3.5 Sonnet.

Суммарные выплаты, которые бы получили модели за выполненные задач на фриланс-бирже. Источник здесь и далее: OpenAI
8
3
1