0 reply
0 recast
0 reaction

Grok 4 của a guột phá vỡ mọi kỷ lục về hiệu suất
* Lại một thế hệ quái vật mới chuẩn bị ra đời *
Trong bài kiểm tra GPQA, #Grok4 đạt 87,5%, còn #Grok4Heavy đạt 88,9%. Trong bài kiểm tra AIME 2025, #Grok4Heavy đạt độ chính xác tuyệt đối 100%.
Đặc biệt, trong bài đánh giá khó nhằn nhất Humanity’s Last Exam,
Grok 4 Heavy đạt 44,4% và Grok 4 đạt 38,6%, với sự hỗ trợ của công cụ.
Trong khi đó, Gemini 2.5 Pro đạt 26,9% và o3 của OpenAI chỉ đạt 24,9% (cũng có hỗ trợ công cụ).
Đáng chú ý nhất, trong bài đánh giá mới ra mắt ARC-AGI-2, Grok 4 đạt 15,9%, mức cao nhất một mô hình từng đạt được.
Con số này gấp đôi kết quả của Claude Opus 4 và OpenAI o3.
Grok 4 hiện đang là mô hình AI có tư duy tiên tiến nhất hiện nay - A guột Musk cũng cho biết một mô hình AI chuyên viết mã sẽ được phát hành vào tháng 8, một tác nhân đa phương thức (multi-modal agent) sẽ được giới thiệu vào tháng 9, và có thể chúng ta sẽ thấy một mô hình tạo video vào tháng 10.
Tổng thể, #xAI một lần nữa chứng minh rằng họ là phòng thí nghiệm AI hàng đầu thế giới, sẵn sàng thách thức tất cả các “ông lớn” trong ngành AI 2 replies
1 recast
15 reactions
0 reply
0 recast
0 reaction