13/03/2026
x
+
aa
-

Gemini có thể tự lướt web và thao tác như con người

Google vừa giới thiệu mô hình trí tuệ nhân tạo (AI) Gemini mới được thiết kế để điều hướng và tương tác với web thông qua trình duyệt.

Với tên gọi Gemini 2.5 Computer Use, công cụ này cho phép các tác nhân AI thực hiện những tác vụ trong các giao diện được thiết kế cho con người, thay vì cho robot. Mô hình sử dụng "khả năng hiểu và lập luận trực quan" để phân tích yêu cầu của người dùng và thực hiện các tác vụ như điền và gửi biểu mẫu.

Gemini không chỉ hiểu mà còn hành động trên internet. ẢNH: ZDNET

Gemini 2.5 Computer Use có thể được áp dụng để kiểm tra giao diện người dùng (UI), điều hướng các giao diện không có API hoặc kết nối trực tiếp khác. Trước đó, các phiên bản khác của mô hình này đã được sử dụng cho các tính năng trong Chế độ AI và Dự án Mariner - một nguyên mẫu nghiên cứu cho phép AI tự thực hiện các tác vụ trong trình duyệt, chẳng hạn như thêm hàng vào giỏ dựa trên danh sách nguyên liệu.

Gemini 2.5 Computer Use là câu trả lời đối với ChatGPT Agent

Thông báo của Google được đưa ra chỉ một ngày sau khi OpenAI công bố các ứng dụng mới cho ChatGPT, nhấn mạnh vào tính năng ChatGPT Agent có khả năng hoàn thành các tác vụ phức tạp. Đồng thời, Anthropic cũng đã phát hành phiên bản mô hình AI Claude với "khả năng sử dụng máy tính" vào năm ngoái.

Google đã chia sẻ một số video demo cho thấy cách thức hoạt động của mô hình này, đồng thời cho biết nó nhanh gấp 3 lần so với các lựa chọn khác. Tuy nhiên, khác với ChatGPT Agent và công cụ của Anthropic, mô hình AI mới của Google chỉ có thể truy cập vào trình duyệt, không phải toàn bộ môi trường máy tính.

Google cũng lưu ý rằng mô hình này "chưa được tối ưu hóa để điều khiển ở cấp độ hệ điều hành máy tính để bàn" và hiện hỗ trợ 13 thao tác, bao gồm mở trình duyệt web, nhập văn bản, cũng như kéo và thả các thành phần.

Gemini 2.5 Computer Use hiện đã có sẵn cho các nhà phát triển thông qua Google AI Studio và Vertex AI, cùng với một bản demo trên Browserbase, nơi người dùng có thể theo dõi quá trình hoàn thành các nhiệm vụ khác nhau./.

Theo Báo Thanh Niên

Nguồn: https://thanhnien.vn/gemini-co-the-tu-luot-web-va-thao-tac-nhu-con-nguoi-185251008153539324.htm

Other news

Tổng đài ảo Buss Call - Giải pháp công nghệ hỗ trợ doanh nghiệp tối ưu hoạt động liên lạc 
Hiện nay, việc ứng dụng các giải pháp công nghệ vào hoạt động quản lý và chăm sóc khách hàng đang trở thành yêu cầu thiết yếu đối với nhiều doanh nghiệp. Đặc biệt, các hệ thống liên lạc hiện đại giúp doanh nghiệp nâng cao hiệu quả vận hành, tiết kiệm chi phí...
Galaxy S26 Ultra được đồn giảm banding/gradient khi chụp bầu trời: Cải tiến xử lý ảnh hay đổi phần cứng? 
Nếu bạn từng chụp bầu trời xanh, hoàng hôn hoặc những mảng màu chuyển nhẹ trên Galaxy Ultra đời gần đây, đôi lúc bạn sẽ thấy hiện tượng “bậc thang” trên vùng chuyển màu: các dải màu không mịn mà thành từng lớp rõ rệt.
VinSmart Future ra mắt kỹ thuật phiên bản trải nghiệm sớm siêu ứng dụng “một chạm” V-App 
Ngày 29/01/2026, VinSmart Future - công ty công nghệ trụ cột của Tập đoàn Vingroup ra mắt kỹ thuật phiên bản trải nghiệm sớm siêu ứng dụng V-App, tích hợp toàn diện các dịch vụ, sản phẩm và chương trình khách hàng thân thiết của hệ sinh thái chỉ với thao tác “một chạm”.
Nâng cao hiệu suất website với BizFly CDN - Giải pháp tối ưu tốc độ trang web thời 4.0 
Một trang web tải chậm không chỉ gây mất lòng tin từ khách hàng mà còn ảnh hưởng trực tiếp đến các chỉ số quan trọng như lượt truy cập, tỷ lệ chuyển đổi, doanh số bán hàng và hình ảnh thương hiệu. Để giải quyết vấn đề này, Bizfly CDN ra đời như một giải pháp...
Vật liệu cách nhiệt mới giúp tiết kiệm năng lượng 
Nhóm nghiên cứu từ Đại học Colorado Boulder (Mỹ) vừa tạo ra một loại vật liệu cách nhiệt mỏng gọi là Vật liệu cách nhiệt trong suốt quang học có cấu trúc xốp (MOCHI).
Top