Các nhà nghiên cứu tại Đại học Carnegie Mellon đã phát triển một phương pháp mới để tạo ra các mô hình ngôn ngữ lớn (LLM) có thể hoạt động hiệu quả trên các thiết bị có tài nguyên hạn chế. Phương pháp này, được gọi là "phiên bản thu nhỏ" (TinyLlama), cho phép các nhà phát triển tạo ra các LLM nhỏ hơn, nhanh hơn và tiết kiệm năng lượng hơn mà không làm giảm đáng kể hiệu suất.
TinyLlama được xây dựng dựa trên kiến trúc Llama 2 của Meta, một trong những LLM mã nguồn mở phổ biến nhất hiện nay. Tuy nhiên, thay vì huấn luyện mô hình với hàng nghìn tỷ token dữ liệu, TinyLlama chỉ sử dụng 1 nghìn tỷ token. Điều này giúp giảm đáng kể thời gian và chi phí huấn luyện, đồng thời tạo ra một mô hình nhỏ hơn, dễ triển khai hơn trên các thiết bị biên.
Mặc dù có kích thước nhỏ hơn, TinyLlama vẫn đạt được hiệu suất cạnh tranh so với các LLM lớn hơn trên nhiều tác vụ. Ví dụ, TinyLlama có thể tạo ra văn bản mạch lạc, trả lời câu hỏi và tóm tắt tài liệu với độ chính xác cao. Điều này cho thấy rằng việc giảm kích thước mô hình không nhất thiết phải đi kèm với sự suy giảm đáng kể về hiệu suất.
Thành công của TinyLlama mở ra những khả năng mới cho việc triển khai LLM trên các thiết bị có tài nguyên hạn chế, chẳng hạn như điện thoại thông minh, thiết bị IoT và hệ thống nhúng. Điều này có thể dẫn đến sự phát triển của các ứng dụng AI mới, chẳng hạn như trợ lý ảo cá nhân hóa, dịch thuật thời gian thực và phân tích dữ liệu trên thiết bị.
Các nhà nghiên cứu đã công bố mã nguồn và mô hình TinyLlama trên GitHub, cho phép các nhà phát triển khác sử dụng và cải tiến phương pháp này. Điều này có thể thúc đẩy sự phát triển của các LLM nhỏ hơn, hiệu quả hơn và dễ tiếp cận hơn cho mọi người.
Podcasts
Các bài đăng từ chủ đề này sẽ được thêm vào bản tin email hàng ngày và nguồn cấp dữ liệu trang chủ của quý vị.
Theo dõiTất cả Podcasts
AI
Các bài đăng từ chủ đề này sẽ được thêm vào bản tin email hàng ngày và nguồn cấp dữ liệu trang chủ của quý vị.
Theo dõiTất cả AI
Công nghệ
Các bài đăng từ chủ đề này sẽ được thêm vào bản tin email hàng ngày và nguồn cấp dữ liệu trang chủ của quý vị.
Theo dõiTất cả Công nghệ
Sundar Pichai về AI, tương lai của tìm kiếm và những gì đang diễn ra với web
Cách CEO của Google đang định hình lại công ty — và internet.
bởi Nilay Patel
Nilay Patel
Tổng biên tập
Các bài đăng từ tác giả này sẽ được thêm vào bản tin email hàng ngày và nguồn cấp dữ liệu trang chủ của quý vị.
Theo dõiTất cả bài viết của Nilay Patel
Ngày 26/5/2026, 14:00 UTC
Liên kết
Chia sẻ
Nilay Patel
Nilay Patel
Tổng biên tập
Các bài đăng từ tác giả này sẽ được thêm vào bản tin email hàng ngày và nguồn cấp dữ liệu trang chủ của quý vị.
Theo dõiTất cả bài viết của Nilay Patel
là tổng biên tập của The Verge, người dẫn chương trình podcast Decoder và đồng dẫn chương trình The Vergecast.
Liên kết
Chia sẻ
Hôm nay, tôi trò chuyện với CEO của Google và Alphabet, Sundar Pichai, trong một cuộc phỏng vấn mà chúng tôi đã ghi âm ngay sau hội nghị nhà phát triển Google I/O. Đây là năm thứ năm Sundar và tôi ngồi lại sau I/O, và nó đã trở thành một trong những truyền thống Decoder yêu thích của tôi.
Luôn có nhiều tin tức tại I/O, và năm nay cũng không ngoại lệ — Google có các mô hình Gemini mới mạnh mẽ, đang tích hợp các tác nhân AI vào mọi thứ, và đang thực hiện những thay đổi lớn đối với Tìm kiếm trên cả web và YouTube, điều này một lần nữa sẽ định hình lại hệ sinh thái thông tin.
Có rất nhiều điều để nói, và Sundar cùng tôi đã thảo luận tất cả. Nhưng tôi cũng nhận ra đã lâu rồi tôi chưa hỏi Sundar những câu hỏi của Decoder về cấu trúc và việc ra quyết định, vì vậy tôi bắt đầu từ đó. Quý vị sẽ nghe Sundar nói rằng ông nhận ra mình cần suy nghĩ lại cách Google hoạt động vài năm trước để đối phó với ChatGPT, và ông đã thực hiện nhiều thay đổi điều hành cũng như các quyết định lớn để đưa công ty vào một tư thế chủ động hơn.
Các thuê bao của Verge, đừng quên quý vị có quyền truy cập độc quyền vào Decoder không có quảng cáo ở bất cứ nơi nào quý vị nghe podcast. Truy cập tại đây. Chưa phải là thuê bao? Quý vị có thể đăng ký tại đây.
Tất nhiên, chúng tôi cũng đã nói về tất cả những thay đổi trong tìm kiếm đó, và cách mà tương lai thực sự của Google Search dường như là việc kết hợp những thứ như hộp tìm kiếm thông minh mới với nền tảng tác nhân Gemini Spark mới của công ty. Bằng cách đó, các tìm kiếm có thể khởi động các tác vụ, chứ không chỉ cung cấp kết quả. Điều đó thật thú vị, nhưng có vẻ như nó sẽ một lần nữa thay đổi động lực của web mở.
Nếu quý vị là người nghe Decoder, quý vị sẽ biết rằng tôi đã đặt ra thuật ngữ Google Zero vài năm trước — đó là ý tưởng rằng lưu lượng truy cập của Google đến các trang web sẽ giảm xuống 0 khi công ty trả lời ngày càng nhiều truy vấn trực tiếp trên trang kết quả tìm kiếm. Điều đó đã từ một ý tưởng mà Sundar đã bác bỏ trong các cuộc phỏng vấn trước đây trở thành một vấn đề mà toàn bộ ngành truyền thông đang phải vật lộn. Ngay cả các CEO của các nhà xuất bản lớn như Condé Nast hiện cũng đang công khai nói rằng họ đang lên kế hoạch cho một thế giới không có lưu lượng truy cập tìm kiếm từ bây giờ.
Google cũng đang đào tạo các mô hình của mình trên các video YouTube, và thay đổi tìm kiếm YouTube để tóm tắt và lập chỉ mục video để quý vị được đưa thẳng đến các phần liên quan. Điều đó chắc chắn sẽ gây ra một số lo lắng cho người sáng tạo, vì vậy tôi đã hỏi Sundar liệu ông có sẵn sàng chiến đấu những trận chiến tương tự với các YouTuber như ông hiện đang làm với các nhà xuất bản hay không.
Cuối cùng, tôi đã hỏi Sundar về việc Giám đốc điều hành Google DeepMind, Demis Hassbis, kết thúc bài phát biểu chính tại I/O bằng cách nói rằng chúng ta đang ở "chân đồi của điểm kỳ dị". Không ngạc nhiên khi Sundar đồng ý với Demis, nhưng những suy nghĩ của ông về thời gian đạt được AGI (Trí tuệ nhân tạo tổng quát) rất đáng được chú ý.
Như tôi đã nói, đây là một trong những tập tôi yêu thích nhất mỗi năm, bởi vì Sundar luôn sẵn lòng trả lời các câu hỏi – và thậm chí cùng tôi xem kết quả tìm kiếm trên điện thoại của tôi. Tôi nghĩ bạn sẽ thực sự thích cuộc trò chuyện năm nay.
Vâng: Sundar Pichai, Giám đốc điều hành của Alphabet và Google. Chúng ta bắt đầu thôi.
Cuộc phỏng vấn này đã được chỉnh sửa nhẹ để phù hợp về độ dài và sự rõ ràng.
Sundar Pichai, ông là Giám đốc điều hành của Alphabet và của Google. Chào mừng ông trở lại Decoder.
Rất vui được có mặt ở đây. Rất vui được gặp lại anh, Nilay.
Đây là một trong những cuộc trò chuyện thường niên yêu thích của tôi. Tôi nghĩ chúng ta đã thực hiện nó tại I/O gần năm lần rồi.
Ồ. Tôi không nhận ra đã năm lần rồi, nhưng tôi rất thích nó. Cảm ơn một lần nữa.
Tôi muốn bắt đầu với một vòng hỏi nhanh. Tôi đã nghĩ về điều này. Chúng ta đã nói rất nhiều. Chúng ta luôn đi sâu vào chi tiết của web và tìm kiếm cũng như những ý tưởng lớn, và tôi nhận ra rằng tôi đã không hỏi ông những câu hỏi của Decoder trong một thời gian khá dài.
Tôi vừa xem lại các cuộc trò chuyện trước đây của chúng ta, và bản thân Google, và ông đã thực hiện khá nhiều thay đổi đối với Google. Tôi nghĩ một số cấp dưới trực tiếp của ông đã thay đổi theo thời gian. Rõ ràng ông đã tái cấu trúc DeepMind, các nền tảng và thiết bị, và Android. Hãy cho tôi biết Google hiện đang được cấu trúc như thế nào.
Được rồi. Đó là Google và Alphabet. Rõ ràng chúng ta cũng có Alphabet, nhưng nhìn chung tôi nghĩ về nó như có ba mảng kinh doanh chính trong Google: Tìm kiếm, YouTube và Google Cloud. Có những nền tảng khổng lồ mà chúng ta vận hành, đó là Android, Chrome và toàn bộ lĩnh vực liên quan đến nó. Và cung cấp năng lượng cho tất cả là tất cả các lĩnh vực công nghệ quan trọng này, đó là AI và công việc cơ sở hạ tầng của chúng ta. Và sau đó bạn có các chức năng đi kèm với nó.
Nhưng ở cấp độ cao, bạn có thể nghĩ về nó như Tìm kiếm, YouTube, Google Cloud, và sau đó là các nền tảng điện toán lớn của chúng ta. Đó là những nhóm chính, và rõ ràng được hỗ trợ bởi Google DeepMind và các nhóm cơ sở hạ tầng của chúng ta. Đó là một cách đơn giản để có được một mô hình tư duy về nó. Và tất nhiên, chúng ta có những khoản đầu tư khác ngoài đó, Waymo là nổi bật nhất trong số đó, nhưng có rất nhiều khoản đầu tư khác, như Isomorphic Labs và vân vân.
Tôi muốn tập trung vào Google. Tôi cảm thấy chúng ta có thể dành cả một giờ để nói về Alphabet và cách nó được cấu trúc và cách nó hoạt động như một công ty đại chúng với nhiều khoản đầu tư. Nhưng để tập trung vào Google trong một giây, điểm yếu của Google trong lịch sử là đây là một công ty mà...
Nguồn tin: The Verge AI — Tác giả: Nilay Patel. Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.