Anthropic tung ra mô hình mới Claude Opus 4.8 “trung thực hơn”, lập trình tốt hơn và giảm mạnh chi phí vận hành
Công ty Anthropic vừa tung ra Claude Opus 4.8 (Claude.ai), phiên bản nâng cấp mới nhất của mô hình trí tuệ nhân tạo cao cấp nhất của hãng. Theo Anthropic, bản cập nhật này tập trung cải thiện 3 yếu tố chính gồm khả năng lập trình, suy luận và xử lý tri thức thực tế. Nó được cung cấp ngay cho người dùng với mức giá không đổi so với Opus 4.7. Bên cạnh đó, Anthropic cũng tung ra một bộ công cụ và tính năng tiết kiệm chi phí nhằm giúp người dùng sử dụng AI nhiều hơn đối với các vấn đề có quy mô lớn.

Opus 4.8: Lập trình thông minh hơn và trung thực hơn gấp 4 lần
Một trong những vấn đề phổ biến của các mô hình AI hiện đại là xu hướng đưa ra kết luận quá nhanh hoặc khẳng định chắc chắn ngay cả khi dữ liệu chưa đủ cơ sở. Anthropic cho biết Opus 4.8 được thiết kế để giảm đáng kể tình trạng này.
Theo phản hồi từ các nhóm thử nghiệm sớm, Opus 4.8 có xu hướng chủ động chỉ ra những điểm chưa chắc chắn trong quá trình phân tích, đồng thời hạn chế đưa ra các tuyên bố thiếu bằng chứng.
Trong khi đó, các bài đánh giá nội bộ của Anthropic cũng cho thấy mô hình mới có khả năng phát hiện lỗi trong mã lập trình tốt hơn đáng kể. Cụ thể, Opus 4.8 được cho là ít bỏ sót các sai sót trong code hơn khoảng 4 lần so với Opus 4.7.
Không chỉ cải thiện về độ chính xác, Anthropic cho biết Opus 4.8 còn vượt qua nhiều đối thủ trong các bài đánh giá tiêu chuẩn của ngành, đặc biệt ở các lĩnh vực phân tích tài chính, suy luận phức tạp và lập trình tác nhân AI.
Bổ sung chế độ tăng tốc và kiểm soát mức độ “suy nghĩ” của AI
Song song với mô hình mới, Anthropic cũng tung ra nhiều tính năng nhằm tối ưu chi phí vận hành AI - yếu tố ngày càng được doanh nghiệp quan tâm khi triển khai ở quy mô lớn.
Một trong những điểm mới là chế độ “Fast Mode”, cho phép Opus 4.8 xử lý tác vụ nhanh hơn khoảng 2,5 lần so với chế độ thông thường. Anthropic khẳng định chi phí vận hành chế độ này hiện đã giảm xuống còn khoảng 1/3 so với các phiên bản trước.
Ngoài ra, người dùng nền tảng Claude.ai giờ đây có thể tự điều chỉnh mức độ “effort” - tức mức độ “suy nghĩ” mà AI dành cho mỗi câu trả lời. Với các tác vụ phức tạp, người dùng có thể tăng mức effort để mô hình suy luận sâu hơn, ngược lại, với các tác vụ đơn giản, có thể giảm mức này để tiết kiệm token và chi phí.
Dynamic Workflows hỗ trợ các dự án lập trình quy mô lớn
Đối với các nhà phát triển phần mềm, Anthropic cũng giới thiệu tính năng Dynamic Workflows trên nền tảng Claude Code. Công cụ này cho phép AI tạo và vận hành đồng thời nhiều tác nhân phụ để chia nhỏ và xử lý các vấn đề lập trình quy mô lớn.
Anthropic cũng cho biết Opus 4.8 cho thấy sự suy giảm rõ rệt trong các hành vi không mong muốn như đánh lừa người dùng hoặc hỗ trợ các mục đích sử dụng sai lệch - một yếu tố ngày càng được chú trọng khi AI được triển khai rộng rãi hơn trong doanh nghiệp.
LÊ PHI (Theo Timesofindia, Techcrunch)

