Bitget App

Торгуйте разумнее

Сотрудники OpenAI публично обвиняют результаты тестов производительности последней модели ИИ от xAI, Grok3, в введении в заблуждение

Сотрудники OpenAI публично обвиняют результаты тестов производительности последней модели ИИ от xAI, Grok3, в введении в заблуждение

Посмотреть оригинал

Bitget2025/02/23 03:37

Недавно сотрудник OpenAI публично обвинил компанию xAI Илона Маска в публикации вводящих в заблуждение результатов тестов для последней модели ИИ, Grok3. В ответ Игорь Бабушкин, соучредитель xAI, настаивал на том, что никаких нарушений не было.

График xAI показывает, что две версии Grok3 - Grok3 Reasoning Beta и Grok3 mini Reasoning - превзошли по производительности текущую самую сильную доступную модель OpenAI o3-mini-high на AIME 2025. Однако сотрудник OpenAI быстро указал на платформе X, что график xAI не включал оценку o3-mini-high при условии "cons@64" в AIME 2025.

На платформе X Бабушкин утверждал, что OpenAI также выпускала в прошлом аналогичные вводящие в заблуждение графики тестов. Несмотря на то, что эти графики использовались для сравнения производительности их собственных моделей.

Дисклеймер: содержание этой статьи отражает исключительно мнение автора и не представляет платформу в каком-либо качестве. Данная статья не должна являться ориентиром при принятии инвестиционных решений.

PoolX: вносите активы и получайте новые токены.

APR до 12%. Аирдропы новых токенов.

Внести!

Вам также может понравиться

Индекс доллара США вырос на 0,58% 15 числа

金色财经•2025/04/16 06:24

Матрикспорт: Притоки средств в Bitcoin-ETF сосредоточены среди крупных институтов, что отражает более сильный институциональный спрос по сравнению с участием розничных инвесторов

星球日报•2025/04/16 06:24