24/06/2026
x
+
aa
-

Microsoft tạo ra máy phát giọng nói AI nguy hiểm đến mức không thể phát hành

Microsoft đã tạo ra một mô hình trí tuệ nhân tạo (AI) hỗ trợ chuyển văn bản thành giọng nói có thể mô phỏng giọng nói của con người tốt đến mức công ty cho rằng nó quá không an toàn để đưa ra thị trường.

Các công cụ sử dụng AI như ChatGPT ngày càng tinh vi và ấn tượng hơn, nhưng khi chúng trở nên quá tốt thì sẽ không thể phân biệt được đâu là con người và đâu là máy móc. Điều đó đã xảy ra, hoặc ít nhất khi nói đến trình tạo giọng nói dựa trên AI của Microsoft.

VALL-E 2 tốt đến mức Microsoft không muốn phát hành công khai. (Ảnh: Chụp màn hình)

Được phát hiện bởi LiveScience, Microsoft được cho là đã tạo ra trình AI có thể chuyển văn bản thành giọng nói mạnh đến mức công ty cho rằng không an toàn để công bố sản phẩm ra công chúng vì mô hình này có thể "tạo ra giọng nói chính xác, tự nhiên theo đúng giọng nói của người nói ban đầu". Rõ ràng việc công khai công cụ này có thể dẫn đến các hành vi gia tăng gian lận, mạo danh…

Mô hình AI nguy hiểm của Microsoft được gọi là VALL-E 2 và trong một bài báo, các nhà nghiên cứu giải thích rằng mô hình này đánh dấu một cột mốc trong quá trình tổng hợp văn bản thành giọng nói và đã đạt được sự tương đương với giọng nói người mà nó muốn sao chép. Các tiêu chuẩn nội bộ của Microsoft phát hiện VALL-E 2 có thể sao chép giọng nói của con người hoặc thậm chí vượt trội trong một số trường hợp.

Các nhà nghiên cứu của Microsoft cho biết: "Các thí nghiệm của chúng tôi, được tiến hành trên các tập dữ liệu LibriSpeech và VCTK, đã chỉ ra rằng VALL-E 2 vượt trội hơn các hệ thống TTS zero-shot trước đây về độ mạnh mẽ, tự nhiên và độ tương đồng của giọng nói. Đây là hệ thống đầu tiên đạt được sự tương đương với con người trên các tiêu chuẩn này".

Microsoft tuyên bố VALL-E 2 hoàn toàn là một dự án nghiên cứu, có nghĩa công ty không có kế hoạch đưa VALL-E 2 vào sản phẩm hoặc mở rộng quyền truy cập của công chúng. Tuy nhiên, công ty đã phác thảo một số trường hợp sử dụng công nghệ này có thể là những người trong ngành như giáo dục, báo chí, nội dung tự biên soạn, tính năng trợ năng, hệ thống phản hồi bằng giọng nói, dịch thuật và chatbot./.

Microsoft 'ép' người dùng Windows 11 sử dụng tài khoản trực tuyến? 

Microsoft bị chỉ trích vì cố tình ‘ép’ người dùng Windows 11 sử dụng tài khoản trực tuyến.

Theo thanhnien.vn

Nguồn: https://thanhnien.vn/microsoft-tao-ra-may-phat-giong-noi-ai-nguy-hiem-den-muc-khong-the-phat-hanh-185240715084010453.htm

Other news

Áo khoác trưng thu nước sạch từ không khí 
Các kỹ sư tại Đại học Texas (Mỹ) vừa phát triển vật liệu sợi sinh khối có thể dệt thành vải may quần áo để chuyển đổi hơi ẩm trong không khí thành nước uống. Phương pháp này mở ra triển vọng giải quyết phần nào nhu cầu nước sạch tại nhiều khu vực khô hạn trên thế giới.
Mặt dây chuyền cảnh báo tiếp xúc tia UV có hại 
The90 Gem được thiết kế như một vòng cổ thanh lịch, nhưng có khả năng theo dõi và biến những thông tin vô hình về mức độ tiếp xúc với ánh nắng thành hướng dẫn chăm sóc da thiết thực, dễ dàng.
Đánh giá OPPO A thế hệ mới: Smartphone pin "khủng", giá rẻ đáng mua nhất dịp hè này 
Trong phân khúc điện thoại tầm trung, OPPO A Series là dòng sản phẩm được nhiều người dùng quan tâm nhờ mức giá dễ tiếp cận cùng những trang bị thực dụng.
ChatGPT có tính năng mới “Dreaming V3”, nâng khả năng ghi nhớ và cá nhân hóa trải nghiệm người dùng 
OpenAI vừa công bố tính năng mới mang tên “Dreaming V3” dành cho ChatGPT, đánh dấu bước tiến mới trong việc nâng cấp khả năng ghi nhớ và cá nhân hóa trải nghiệm trò chuyện của chatbot AI này.
Nâng tầm hiệu quả tác nghiệp với tòa soạn hội tụ AI 
Triển khai tòa soạn hội tụ ứng dụng AI có thể giúp phóng viên nâng cao 80% hiệu suất trong các tác vụ xử lý thông tin, tổng hợp dữ liệu.
Top