พนักงาน OpenAI กล่าวหาผลการทดสอบมาตรฐานของโมเดล AI ล่าสุดของ xAI, Grok3 ว่าทำให้เข้าใจผิด
เมื่อไม่นานมานี้ พนักงานของ OpenAI ได้กล่าวหาบริษัท xAI ของ Elon Musk อย่างเปิดเผยว่าปล่อยผลการทดสอบมาตรฐานที่ทำให้เข้าใจผิดสำหรับโมเดล AI ล่าสุดของพวกเขา Grok3 ในการตอบสนอง Igor Babushkin ผู้ร่วมก่อตั้ง xAI ยืนยันว่าไม่มีการกระทำที่ไม่เหมาะสม
แผนภูมิของ xAI แสดงให้เห็นว่า Grok3 สองเวอร์ชัน - Grok3 Reasoning Beta และ Grok3 mini Reasoning - มีประสิทธิภาพดีกว่าโมเดลที่แข็งแกร่งที่สุดของ OpenAI ในปัจจุบัน o3-mini-high ใน AIME 2025 อย่างไรก็ตาม พนักงานของ OpenAI ได้ชี้ให้เห็นอย่างรวดเร็วบนแพลตฟอร์ม X ว่าแผนภูมิของ xAI ไม่ได้รวมคะแนนของ o3-mini-high ภายใต้เงื่อนไข "cons@64" ใน AIME 2025
บนแพลตฟอร์ม X Babushkin โต้แย้งว่า OpenAI ก็เคยปล่อยแผนภูมิการทดสอบมาตรฐานที่ทำให้เข้าใจผิดในลักษณะเดียวกันในอดีต แม้ว่าแผนภูมิเหล่านี้จะถูกใช้เพื่อเปรียบเทียบประสิทธิภาพของโมเดลของพวกเขาเอง
ข้อสงวนสิทธิ์: เนื้อหาทั้งหมดในบทความนี้เป็นเพียงความคิดเห็นของผู้เขียนเท่านั้น ไม่ได้มีส่วนเกี่ยวข้องกับแพลตฟอร์มแต่อย่างใด บทความนี้ไม่มีจุดประสงค์เพื่อใช้เป็นข้อมูลอ้างอิงประกอบการตัดสินใจลงทุน
เผื่อคุณอาจชื่นชอบ
ดัชนีความกลัวและความโลภวันนี้ลดลง 18 จุดเหลือ 15 ซึ่งอยู่ใน "สถานะตื่นตระหนกอย่างรุนแรง"
จีนตอบโต้ภาษีของทรัมป์: กำหนดภาษี 15% สำหรับสินค้านำเข้าจากสหรัฐฯ
รัฐบาลออสเตรเลียระบุว่าไม่มีแผนที่จะจัดตั้งกองทุนสำรองสกุลเงินดิจิทัลเชิงกลยุทธ์
กำลังมาแรง
เพิ่มเติมราคาคริปโต
เพิ่มเติม








