Bỏ qua tới nội dung chính
Quay lại tin tức

Google công bố Gemini 3.5 Live Translate cho tính năng dịch giọng nói tức thời

Ars Technica AI· Ryan Whitwam· 9/6/2026general

Google đã theo đuổi tính năng dịch thuật theo thời gian thực trong nhiều năm, mà hãng này cho biết là một trong những "thử nghiệm học máy tiên phong". Chúng ta đã chứng kiến nhiều bản demo trên sân khấu tại các sự kiện của Google trong quá khứ, nhưng người dùng cần điện thoại Google, tai nghe hoặc một thiết lập cụ thể khác. Năm ngoái, Google đã đưa tính năng dịch thuật theo thời gian thực đến nhiều người dùng hơn trong ứng dụng Translate, và hiện tại hãng đang mở rộng khả năng tiếp cận. Với việc phát hành Gemini 3.5 Live Translate, người dùng sẽ có quyền truy cập vào tính năng dịch tức thời ở nhiều nơi hơn và với độ trễ thấp hơn bao giờ hết. Mô hình AI mới là một phần của dòng sản phẩm phiên bản 3.5 đã ra mắt.

Google đã theo đuổi tính năng dịch thuật theo thời gian thực trong nhiều năm, và hãng cho biết đây là một trong những "thử nghiệm học máy tiên phong" của mình. Chúng ta đã chứng kiến nhiều bản demo trên sân khấu tại các sự kiện của Google trong quá khứ, nhưng người dùng cần điện thoại Google, tai nghe hoặc một thiết lập cụ thể khác. Năm ngoái, Google đã mang tính năng dịch thuật theo thời gian thực đến nhiều người dùng hơn trong ứng dụng Translate, và hiện tại hãng đang mở rộng khả năng tiếp cận hơn nữa. Với việc phát hành Gemini 3.5 Live Translate, người dùng sẽ có quyền truy cập vào tính năng dịch tức thì ở nhiều nơi hơn và với độ trễ thấp hơn bao giờ hết. Mô hình AI mới là một phần của dòng phiên bản 3.5 đã ra mắt tại I/O. Trước hôm nay, Google mới chỉ triển khai phiên bản Flash, nhưng chúng ta đang mong đợi một mô hình Pro sẽ ra mắt trong những tuần tới. Gemini 3.5 Live Translate là một mô hình chuyển đổi giọng nói thành giọng nói được tinh chỉnh để tự động phát hiện và dịch hơn 70 ngôn ngữ. Google cho biết Gemini 3.5 Live Translate đủ nhanh để theo kịp một cuộc trò chuyện bình thường, chỉ chậm vài giây so với người nói đồng thời khớp với ngữ điệu, tốc độ và cao độ. Tóm lại, giọng nói nghe giống bạn hơn là một robot chung chung. Các bản demo, tất cả đều được ghi lại trong điều kiện có kiểm soát, nghe có vẻ ấn tượng. Tuy nhiên, bạn sẽ không phải đợi lâu để tự mình kiểm chứng khả năng của mô hình.

Nguồn tin: Ars Technica AI — Tác giả: Ryan Whitwam. Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.