Luis from 5PC 🎩 on Farcaster

Content pfp

https://warpcast.com/~/channel/movement-vietnam

0 reply

0 recast

0 reaction

Haan⌘ 🦍 pfp

Grok 4 của a guột phá vỡ mọi kỷ lục về hiệu suất * Lại một thế hệ quái vật mới chuẩn bị ra đời * Trong bài kiểm tra GPQA, #Grok4 đạt 87,5%, còn #Grok4Heavy đạt 88,9%. Trong bài kiểm tra AIME 2025, #Grok4Heavy đạt độ chính xác tuyệt đối 100%. Đặc biệt, trong bài đánh giá khó nhằn nhất Humanity’s Last Exam, Grok 4 Heavy đạt 44,4% và Grok 4 đạt 38,6%, với sự hỗ trợ của công cụ. Trong khi đó, Gemini 2.5 Pro đạt 26,9% và o3 của OpenAI chỉ đạt 24,9% (cũng có hỗ trợ công cụ). Đáng chú ý nhất, trong bài đánh giá mới ra mắt ARC-AGI-2, Grok 4 đạt 15,9%, mức cao nhất một mô hình từng đạt được. Con số này gấp đôi kết quả của Claude Opus 4 và OpenAI o3. Grok 4 hiện đang là mô hình AI có tư duy tiên tiến nhất hiện nay - A guột Musk cũng cho biết một mô hình AI chuyên viết mã sẽ được phát hành vào tháng 8, một tác nhân đa phương thức (multi-modal agent) sẽ được giới thiệu vào tháng 9, và có thể chúng ta sẽ thấy một mô hình tạo video vào tháng 10. Tổng thể, #xAI một lần nữa chứng minh rằng họ là phòng thí nghiệm AI hàng đầu thế giới, sẵn sàng thách thức tất cả các “ông lớn” trong ngành AI

2 replies

1 recast

15 reactions

Luis from 5PC 🎩 pfp

Luis from 5PC 🎩

Grok quá là đỉnh luôn ấy

0 reply

0 recast

0 reaction