Tại sao AI của Google không thể đánh vần Google (hoặc bất cứ…

Có bao nhiêu chữ "P" trong từ "Google"? Theo Google, có hai chữ "P". AI Overview của Google cũng cho biết có "chính xác 1 chữ 'r' trong từ 'poop'", cũng như hai chữ 'd' trong từ "journalism", nhưng lại đánh vần là: j-o-u-r-n-a-d-i-s-m. Ít nhất Google đã xác định được có một chữ "P" trong họ của Tổng thống Hoa Kỳ, nhưng lại đánh vần là t-r-p-u-m. Không cần phải là nhà tiên tri để dự đoán rằng việc Google đại tu công cụ Tìm kiếm theo hướng AI sẽ không suôn sẻ. Chúng ta đã từng chứng kiến điều này trước đây. Lần đầu tiên Google thêm AI Overviews vào Tìm kiếm, tính năng này đã trích dẫn các bài viết châm biếm từ The Onion và Reddit, khuyên mọi người ăn đá và cho keo dán vào pizza. Lần này, khi Google tăng cường cam kết biến AI tạo sinh thành trọng tâm của sản phẩm chủ lực 29 năm tuổi của mình, việc nó vấp váp không có gì đáng ngạc nhiên. Google đang cải tiến toàn bộ công cụ tìm kiếm của mình thành cái này btw pic.twitter.com/PIR4llFhiV — mersomas (@mersomas) ngày 27/5/2026 "Việc đếm chữ cái trong từ đã là một thách thức đối với các mô hình ngôn ngữ lớn (LLM) và chúng tôi đang nỗ lực khắc phục vấn đề cụ thể này", Google cho biết trong một tuyên bố gửi qua email cho TechCrunch. Những lỗi chính tả cơ bản này có vẻ quen thuộc. Các LLM, loại trí tuệ nhân tạo cung cấp năng lượng cho chatbot và các công cụ tạo văn bản khác, không được xây dựng để hiểu chính tả. Đã từ lâu, người ta thường nói đùa rằng bất cứ khi nào một công ty ra mắt một mô hình AI mới, bạn nên hỏi nó có bao nhiêu chữ 'r' trong từ "strawberry". Các mô hình AI này – có thể viết mã một ứng dụng trong vài giây hoặc giải quyết các vấn đề đã làm khó các nhà toán học trong nhiều thập kỷ – lại có khả năng đánh vần ngang với một học sinh mẫu giáo. Tuy nhiên, những vấn đề của AI Overview của Google không chỉ dừng lại ở những lỗi chính tả ngớ ngẩn. Google đã vá một lỗi từ tuần trước, trong đó khi tìm kiếm từ "disregard" (bỏ qua), kết quả sẽ hiển thị một định nghĩa từ điển, nhưng định nghĩa đó lại là: "Đã hiểu. Hãy cho tôi biết bất cứ khi nào bạn có một lời nhắc hoặc câu hỏi mới!". Nhưng những lỗi chính tả này vẫn gây cười vì chúng rất khó để loại bỏ. Như các nhà nghiên cứu đã giải thích trước đây khi chúng tôi hỏi về những câu đố chính tả này, AI không nhận thức các câu là các đơn vị ngôn ngữ được tạo thành từ các từ và chữ cái. Nhiều LLM được xây dựng trên các mô hình transformer, chia văn bản thành các token, có thể là toàn bộ từ, âm tiết hoặc chữ cái, tùy thuộc vào mô hình. Thay vì "đọc" như con người, AI chuyển đổi văn bản thành các biểu diễn số của chính nó, sau đó được ngữ cảnh hóa để giúp AI đưa ra một phản hồi hợp lý. Nguồn ảnh: TechCrunch Matthew Guzdial, nhà nghiên cứu AI và trợ lý giáo sư tại Đại học Alberta, nói với TechCrunch: “Các LLM dựa trên kiến trúc transformer này, vốn không thực sự đọc văn bản. Điều xảy ra khi bạn nhập một lời nhắc là nó được dịch thành một mã hóa. Khi nó nhìn thấy từ ‘the’, nó có một mã hóa về ý nghĩa của ‘the’, nhưng nó không biết về ‘T’, ‘H’, ‘E’”. Kiến trúc dựa trên token cung cấp năng lượng cho các LLM như AI Overview của Google vốn có những hạn chế cố hữu, và các nhà nghiên cứu không mấy lạc quan rằng họ có thể giải quyết được vấn đề chính tả. Ông Sheridan Feucht, nghiên cứu sinh về khả năng diễn giải mô hình ngôn ngữ lớn tại Đại học Northeastern, chia sẻ với TechCrunch: “Thật khó để trả lời chính xác câu hỏi ‘từ’ nên được định nghĩa như thế nào đối với một mô hình ngôn ngữ. Ngay cả khi các chuyên gia con người đồng ý về một bộ từ vựng mã hóa hoàn hảo, các mô hình có thể vẫn thấy hữu ích khi ‘phân đoạn’ mọi thứ sâu hơn nữa. Tôi đoán rằng không có bộ mã hóa nào hoàn hảo do sự mơ hồ này”. Đây không hẳn là một vấn đề cấp bách đối với các nhà nghiên cứu, vì tính hữu dụng của các LLM không nằm ở khả năng đánh vần. Tuy nhiên, những thất bại rõ ràng này giúp chúng ta nhớ rằng AI không hoàn hảo, ngay cả khi đôi khi nó có vẻ là một sức mạnh toàn năng vượt quá tầm hiểu biết của chúng ta. Chúng ta không thể tin tưởng mù quáng vào kết quả của AI mà không kiểm tra lại độ chính xác.

Tại sao AI của Google không thể đánh vần Google (hoặc bất cứ thứ gì khác)