Bỏ qua tới nội dung chính
Quay lại tin tức

Bạn có thực sự sẽ nói chuyện với Gemini như vậy không?

Engadget AI· staff@engadget.com (Ian Carlos Campbell)· 21/5/2026general

Các tính năng AI mới của Google tận dụng sự phổ biến của tính năng đọc chính tả bằng giọng nói và mong muốn giao phó việc tư duy cho AI.

Big Tech Google Bạn có thực sự sẽ nói chuyện với Gemini như vậy không? Các tính năng AI mới của Google tận dụng sự phổ biến của tính năng đọc chính tả bằng giọng nói và mong muốn để AI đảm nhiệm việc suy nghĩ. Bởi Ian Carlos Campbell Ngày 21/5/2026, 9:00 sáng EST Google Hơn một thập kỷ trước, Amazon và Google đã dạy thế giới cách nói chuyện với AI. Thông qua Amazon Alexa và Google Assistant, các từ đánh thức đã được học và các câu lệnh ngôn ngữ tự nhiên đã được thực hành, tất cả nhằm mục đích đặt hẹn giờ, yêu cầu phát nhạc, điều khiển nhà thông minh và tìm kiếm thông tin. Mọi thứ đã có chút khác biệt vào năm 2026. Nếu có một chủ đề tại Google I/O năm nay ngoài các tác nhân AI, thì đó là cách Google hình dung chúng ta sẽ nói chuyện với AI đang thay đổi. Nhiều tính năng mới mà công ty giới thiệu đều có tính năng nhập liệu bằng giọng nói – nhưng ở dạng chưa hoàn thiện, trong đó trách nhiệm thuộc về Gemini để diễn giải ý định và hành động phù hợp. Sự thay đổi này có thể có những tác động không mong muốn: Google muốn người dùng nói chuyện lan man với AI để hoàn thành công việc, nhưng trong quá trình đó, họ có thể suy nghĩ ít hơn nhiều. Lấy ví dụ, Rambler, một phiên bản cập nhật của tính năng chuyển giọng nói thành văn bản của Gboard mà Google đã trình diễn trong The Android Show: Google I/O 2026 Edition vào ngày 12/5. "Với Rambler, bạn không phải lo lắng về việc nói đúng từng từ trước khi bắt đầu", Google viết. "Bạn có thể nói chuyện tự nhiên và nó sẽ lấy những phần quan trọng, sau đó ghép chúng lại thành một tin nhắn ngắn gọn." Mô hình trên thiết bị mà Rambler sử dụng có thể loại bỏ các từ đệm như "ừm" và "à", đồng thời nắm bắt được ý chính của tin nhắn mà không cần chép lại lời nói lan man của bạn một cách nguyên văn. Quan trọng hơn, nó cũng có thể điều chỉnh việc chuyển đổi ngôn ngữ giữa chừng, theo cách mà nhiều người song ngữ nói chuyện với gia đình và bạn bè. Tính năng này mang lại ít nhất một lợi ích rõ ràng về khả năng tiếp cận ở chỗ cả việc phiên âm và chỉnh sửa tin nhắn có thể diễn ra đồng thời, mà không cần chạm vào bàn phím. Khả năng gửi một tin nhắn dài khi một hoặc cả hai tay đang bận về lý thuyết có thể hữu ích cho bất kỳ ai. Ứng dụng theo dõi công việc Todoist đã khám phá những ý tưởng tương tự thông qua một tính năng có tên Ramble, cho phép bạn nói ra những việc cần làm cho ứng dụng và để AI đảm nhiệm việc tạo và sắp xếp các công việc. Trong toàn bộ Thung lũng Silicon, The Wall Street Journal đã ghi nhận sự chuyển hướng sang đọc chính tả bằng giọng nói trong các không gian làm việc của công ty. Các ứng dụng như Wispr Flow và Monologue cho phép bạn nói hoặc thì thầm với máy tính và chuyển đổi giọng nói của bạn thành văn bản, tự động chỉnh sửa giọng điệu và phong cách tùy thuộc vào ứng dụng bạn đang sử dụng. Trong ngành chăm sóc sức khỏe, nhiều bác sĩ đã nhanh chóng áp dụng các công cụ phiên âm AI như một cách để ghi chú trong các cuộc hẹn. Những gì Google đang cung cấp là lợi ích của các công cụ đó mà không cần đăng ký bên thứ ba hoặc một ứng dụng bổ sung. Bạn có thể sử dụng nó trên bất kỳ thiết bị nào chạy Android 17. Docs Live là một trong số nhiều ví dụ về việc Google tích hợp trải nghiệm sử dụng Gemini Live – trò chuyện thoại trực tiếp với Gemini – vào các ứng dụng khác của mình. Với Docs Live, người dùng có thể nói chuyện với một mô hình AI và mô hình này sẽ tạo một Google Doc dựa trên những gì được chia sẻ. Google viết: "Chỉ cần nói, và Docs Live sẽ đảm nhận phần việc nặng nhọc – sắp xếp suy nghĩ của bạn, cấu trúc tài liệu của bạn, và, với sự cho phép của bạn, lấy các chi tiết liên quan từ Gmail, Drive, Chat và web". Trong bản demo của Google, việc ra lệnh này giống như việc đọc chính tả một dàn ý, nhưng Docs Live được cho là có khả năng biến một dòng suy nghĩ ngẫu nhiên thành một bản nháp. Keep Live sẽ mang lại trải nghiệm tương tự cho ứng dụng ghi chú của Google, trong khi Gmail Live sẽ biến các cuộc trò chuyện thoại AI thành một cách nhanh hơn để tìm email. Điều không được đề cập trong các trường hợp sử dụng của những tính năng mới này là những gì chúng loại bỏ. Video demo của Google cho Docs Live giới thiệu một kỹ sư phần mềm được yêu cầu trở lại trường cũ để nói chuyện với sinh viên về sự nghiệp của mình. Đó là một trải nghiệm mà, ít nhất là về mặt lý thuyết, đủ ý nghĩa để người dùng muốn tự viết bài phát biểu của mình, nhưng thay vào đó, người dùng trong demo lại giao phó nhiệm vụ này cho Docs Live. Không phải ai cũng là một nhà văn bẩm sinh – có vẻ như Google cố ý chỉ định người này là kỹ sư phần mềm – nhưng khả năng suy nghĩ rõ ràng và truyền đạt suy nghĩ, cảm xúc của bản thân vượt xa con đường sự nghiệp. Rambler cũng dường như bỏ qua phần thưởng của giao tiếp. Hầu hết mọi người đều phải vật lộn với ý nghĩa hoặc mục đích của một tin nhắn văn bản vào một thời điểm nào đó trong đời, nhưng Rambler cho phép bạn giao một phần công việc căng thẳng (nhưng bổ ích) đó cho AI. Không ai bắt buộc phải sử dụng các công cụ này, và trong trường hợp của Docs Live, Keep Live và Gmail Live, chúng sẽ chỉ giới hạn cho những người đăng ký trả phí AI Pro, AI Ultra và Workspace dành cho doanh nghiệp ban đầu. Điều mà sự phổ biến của các tính năng thoại AI khiến tôi tự hỏi là chúng sẽ dạy người dùng thường xuyên về AI điều gì. Google Assistant và Amazon Alexa đã trở nên tốt hơn trong việc hiểu sự phức tạp của lời nói con người theo thời gian, nhưng cấu trúc của hầu hết các tương tác với các trợ lý giọng nói đó vẫn mặc định là một cuộc gọi và phản hồi robot vì đó là cách tốt nhất để đảm bảo bạn nhận được điều mình muốn. Bạn phải suy nghĩ về bóng đèn nào bạn muốn Google Assistant bật hoặc kỹ năng Alexa nào bạn muốn kích hoạt, và nói chuyện tương ứng. Google hiện dường như ít quan tâm hơn đến chất lượng hoặc sự rõ ràng của những gì bạn nhập vào, miễn là nó có thể tạo ra một kết quả mà bạn hài lòng, điều mà trong thời đại AI dường như là một tiêu chuẩn dễ đạt được hơn trước đây. Google Docs sẽ là gì khi bạn không cần phải suy nghĩ quá nhiều về những gì bạn muốn viết? Hoặc Google Messages sẽ là gì khi bạn giao việc gửi tin nhắn cho AI? Các tính năng mới của Google có thể rất hữu ích cho hàng triệu người, nhưng bằng cách đòi hỏi ít suy nghĩ thực tế hơn, chúng có thể cuối cùng thay đổi hoàn toàn cách mọi người suy nghĩ.

Nguồn tin: Engadget AI — Tác giả: staff@engadget.com (Ian Carlos Campbell). Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.