
Mô hình Gemma 4 12B mới của Google được thiết kế để chạy trên bất kỳ máy tính xách tay nào có RAM 16GB.
Sự bùng nổ của AI tạo sinh đã đẩy chi phí bộ nhớ lên cao ngất ngưởng, và Google là một phần quan trọng của xu hướng này. Do đó, việc Google cung cấp một số mô hình AI cục bộ ít tốn RAM hơn là điều hợp lý. Công ty đã công bố phát hành mô hình Gemma 4 mới, lấp đầy khoảng trống trong dòng sản phẩm ra mắt đầu năm nay. Mô hình mới này đủ hiệu quả để có thể chạy trên một máy tính xách tay tiêu dùng khá phổ biến. Vào tháng 4, Google đã phát hành bốn mô hình trong dòng Gemma 4, đồng thời đánh dấu sự chuyển đổi sang giấy phép Apache 2.0 cởi mở hơn. Các mô hình ban đầu bao gồm hai mô hình được tối ưu hóa cho thiết bị di động.
Sự bùng nổ của AI tạo sinh đã đẩy chi phí bộ nhớ lên cao, và Google là một phần quan trọng của xu hướng này. Do đó, việc Google cung cấp một số mô hình AI cục bộ ít tiêu tốn RAM hơn là điều hợp lý. Công ty đã công bố phát hành một mô hình Gemma 4 mới, lấp đầy khoảng trống trong dòng sản phẩm ra mắt vào đầu năm nay. Mô hình mới này đủ hiệu quả để có thể chạy trên một máy tính xách tay tiêu dùng khá phổ biến.
Vào tháng 4, Google đã phát hành bốn mô hình thuộc dòng Gemma 4, đồng thời đánh dấu sự chuyển đổi sang giấy phép Apache 2.0 cởi mở hơn. Các mô hình ban đầu bao gồm hai tùy chọn tối ưu hóa cho thiết bị di động (E2B và E4B) cùng với một cặp mô hình dành cho các tác vụ nghiêm túc hơn (26B Mixture of Experts và 31B Dense). Điều đó để lại một khoảng trống khá lớn chưa được phục vụ ở giữa, và đó chính là vị trí của mô hình mới.
Gemma 4 12B có khả năng vượt trội đáng kể so với các phiên bản di động, nhưng sẽ không yêu cầu bộ tăng tốc AI trị giá 20.000 USD để chạy cục bộ. Google cho biết Gemma 4 12B là độc nhất vô nhị ở chỗ nó có thể chạy trên nhiều máy tính xách tay tiêu dùng mà không làm giảm chất lượng. Miễn là máy tính có 16GB RAM hệ thống hoặc VRAM, mô hình 12 tỷ tham số này sẽ hoạt động. Con số này chỉ bằng khoảng một nửa tổng dung lượng bộ nhớ của Gemma 4 26B MoE, và Google tuyên bố mô hình mới gần như có khả năng tương đương, ít nhất là theo các điểm chuẩn.
Nguồn tin: Ars Technica AI — Tác giả: Ryan Whitwam. Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.