Сотрудники OpenAI публично обвиняют результаты тестов производительности последней модели ИИ от xAI, Grok3, в введении в заблуждение
Недавно сотрудник OpenAI публично обвинил компанию xAI Илона Маска в публикации вводящих в заблуждение результатов тестов для последней модели ИИ, Grok3. В ответ Игорь Бабушкин, соучредитель xAI, настаивал на том, что никаких нарушений не было.
График xAI показывает, что две версии Grok3 - Grok3 Reasoning Beta и Grok3 mini Reasoning - превзошли по производительности текущую самую сильную доступную модель OpenAI o3-mini-high на AIME 2025. Однако сотрудник OpenAI быстро указал на платформе X, что график xAI не включал оценку o3-mini-high при условии "cons@64" в AIME 2025.
На платформе X Бабушкин утверждал, что OpenAI также выпускала в прошлом аналогичные вводящие в заблуждение графики тестов. Несмотря на то, что эти графики использовались для сравнения производительности их собственных моделей.
Дисклеймер: содержание этой статьи отражает исключительно мнение автора и не представляет платформу в каком-либо качестве. Данная статья не должна являться ориентиром при принятии инвестиционных решений.
Вам также может понравиться
Популярное
ДалееЦены на крипто
Далее








