Bỏ qua tới nội dung chính
Quay lại tin tức

Cách chạy chatbot AI cục bộ trên iPhone

Engadget AI· staff@engadget.com (Igor Bonifacic)· 28/5/2026general

Việc cài đặt các chatbot AI cục bộ trên iPhone mang lại nhiều lợi ích, bao gồm hiệu suất ngoại tuyến và quyền riêng tư.

Tin tức AI Cách chạy chatbot AI cục bộ trên iPhone của bạn Không có gì ngạc nhiên khi có một ứng dụng cho việc này. Bởi Igor Bonifacic Ngày 28/5/2026 9:30 sáng EST Igor Bonifacic cho Engadget Khi hầu hết chúng ta nghĩ về các chatbot AI, chúng ta nghĩ đến các hệ thống phức tạp chạy trên phần cứng mạnh mẽ trong các trung tâm dữ liệu khổng lồ. Đặt câu hỏi cho ChatGPT hoặc Gemini, sau đó xem nó "suy nghĩ" khi nó gửi yêu cầu đến một mạng máy chủ ở xa để xử lý, trước khi tạo ra câu trả lời. Thực tế, đó chỉ là một cách để tương tác với các mô hình AI mới nhất, và bạn có thể chạy một chatbot mã nguồn mở trên một chiếc iPhone đời mới. Một chatbot cục bộ có thể không mạnh mẽ bằng các đối tác đám mây của nó, nhưng có những lý do thuyết phục để từ bỏ ChatGPT, Claude và Gemini, mà tôi sẽ trình bày trong hướng dẫn này. Tôi cũng sẽ giải thích cách cài đặt một mô hình AI cục bộ trên điện thoại của bạn. Điều này có vẻ phức tạp, nhưng tôi hứa nó dễ hơn bạn nghĩ. Tại sao phải chạy chatbot AI cục bộ? Igor Bonifacic cho Engadget Đối với nhiều người, lý do hấp dẫn nhất để sử dụng chatbot cục bộ sẽ là số tiền bạn có thể tiết kiệm. Hiện tại, việc chạy một mô hình cục bộ trên iPhone của bạn chỉ tốn tối đa 5 USD cho một lần mua. Hãy so sánh điều đó với một gói đăng ký từ bất kỳ phòng thí nghiệm AI lớn nào. Ví dụ, nếu bạn muốn sử dụng ChatGPT mà không có quảng cáo, bạn sẽ cần chi ít nhất 20 USD mỗi tháng cho gói Plus của OpenAI. Bạn có thể sử dụng gói Go với chi phí phải chăng hơn hoặc thậm chí sử dụng gói miễn phí nếu bạn chỉ định sử dụng ChatGPT một cách không thường xuyên, nhưng sau đó bạn cũng cần xem xét giới hạn tốc độ. Tương tự, các gói Google AI bắt đầu từ 8 USD mỗi tháng, nhưng bạn có thể chi tới 100 USD mỗi tháng cho gói Ultra của họ. Khi bạn chạy một chatbot AI từ iPhone của mình, bạn có thể sử dụng nó bao nhiêu tùy thích. Với tư cách là người dùng thành thạo, bạn rất có thể sẽ đạt đến giới hạn sử dụng hàng ngày với ChatGPT, Claude hoặc Gemini nếu bạn không trả tiền. Đối với những người quan tâm đến quyền riêng tư, chatbot cục bộ mang lại một lợi thế khác. Không có tùy chọn nào tôi sẽ đề xuất trong bài viết này yêu cầu đăng nhập hoặc bạn phải chia sẻ dữ liệu của mình với các phòng thí nghiệm đã đào tạo các mô hình bạn muốn chạy. Các nhà phát triển ứng dụng cũng cho biết họ không thu thập bất kỳ thông tin sử dụng nào. Với các mô hình độc quyền, bạn nên giả định rằng các lời nhắc của bạn và bất kỳ thông tin, hình ảnh, âm thanh hoặc video nào bạn chia sẻ sẽ được sử dụng để đào tạo các mô hình trong tương lai. Có những trường hợp ngoại lệ hiếm hoi. Chatbot Lumo của Proton, ví dụ, hoàn toàn riêng tư theo mặc định. Đối với hầu hết các chatbot, bao gồm ChatGPT, bạn sẽ cần tìm hiểu kỹ để từ chối chia sẻ dữ liệu của mình để đào tạo mô hình. Một điều bạn cũng không thể làm với ChatGPT, Claude hoặc Gemini là sử dụng chúng mà không có kết nối internet, trong khi các chatbot cục bộ có thể chạy ngay cả khi bạn ngoại tuyến. Tuy nhiên, có một vài nhược điểm đáng chú ý. Mặc dù các mô hình mã nguồn mở mới nhất có khả năng, nhưng chúng không tinh vi bằng các mô hình độc quyền mới nhất từ Anthropic, OpenAI và các phòng thí nghiệm AI vì lợi nhuận khác. Ví dụ, các mô hình đóng, do phần cứng đám mây mạnh mẽ hỗ trợ chúng, có xu hướng cung cấp các cửa sổ ngữ cảnh dài hơn cho phép chúng tham chiếu thông tin từ các cuộc trò chuyện trước đây. Trong thực tế, điều đó có nghĩa là các chatbot cảm thấy thông minh hơn và có tính đối thoại hơn, vì bạn sẽ không cần phải lặp lại bản thân thường xuyên, nếu có. Ngoài ra, cả ChatGPT và Claude đều cung cấp các tính năng "bộ nhớ" mạnh mẽ, cho phép cá nhân hóa phản hồi cho từng người dùng. Phiên bản ChatGPT của tôi biết rằng cây đàn chính của tôi là chiếc Fender Stratocaster đời 1993 và thường xuyên nhắc đến thông tin này khi tôi hỏi các câu hỏi liên quan đến guitar. Đối với một số người, điều này có thể khiến việc sử dụng chatbot trở nên gây nghiện, vì họ cảm thấy hệ thống muốn tìm hiểu về mình. Nếu cần một chatbot có thể cung cấp thông tin kịp thời, một mô hình cục bộ có thể không đáp ứng được. Tất cả các LLM đều có giới hạn kiến thức (knowledge cutoff). Đó là thời điểm mà dữ liệu huấn luyện của chúng không bao gồm các sự kiện sau đó. Ví dụ, trong trường hợp GPT-5.5 Instant, nó sẽ không thể tham chiếu các sự kiện sau tháng 8/2024. Đối với Llama 3.2, ngày đó là tháng 12/2023. Để trả lời các câu hỏi vượt quá giới hạn kiến thức, một mô hình lý tưởng sẽ sử dụng công cụ tìm kiếm web mạnh mẽ. Các mô hình độc quyền mang lại hai lợi thế liên quan đến tính kịp thời. Thứ nhất, tốc độ phát hành các mô hình mới của các công ty như OpenAI hiện nay có nghĩa là các hệ thống đó tự thân đã tích hợp nhiều dữ liệu gần đây hơn vì chúng mới hơn. Hơn nữa, vì cần kết nối internet để sử dụng ChatGPT, Claude hoặc Gemini, các chatbot này có thể dễ dàng tìm kiếm trên web để bổ sung cho câu trả lời của mình. Các mô hình mã nguồn mở có thể sử dụng các công cụ tìm kiếm web, nhưng không thể thiếu các tiện ích mở rộng của bên thứ ba. Các chatbot cục bộ tốt nhất Igor Bonifacic cho Engadget Vậy, khi đã quyết định thử nghiệm thế giới LLM mã nguồn mở, làm thế nào để có một cái trên iPhone? Đương nhiên, cần một ứng dụng, và có hai ứng dụng đáng chú ý: Locally AI và Private LLM. Cả hai đều giúp việc cài đặt và chạy một chatbot cục bộ trên iPhone trở nên cực kỳ dễ dàng. Ứng dụng đầu tiên có thể tải xuống miễn phí, trong khi ứng dụng thứ hai có giá 5 USD. Trong hai ứng dụng này, Locally AI phù hợp hơn với hầu hết mọi người. Không chỉ miễn phí, mà nó còn có trải nghiệm khởi động trực quan hơn. Khi khởi chạy ứng dụng lần đầu tiên, nó sẽ đề xuất một trong ba mô hình để thử trước và sau đó tải xuống mô hình đã chọn. Từ đó, có thể bắt đầu trò chuyện ngay lập tức. Nếu vào menu cài đặt, dễ dàng tìm và tải xuống các mô hình khác để thử. Bằng cách nhấn vào Cá nhân hóa (Personalization), cũng có thể viết một lời nhắc hệ thống (system prompt) để hướng dẫn cách chatbot cấu trúc câu trả lời của mình. Khi tải xuống các chatbot khác nhau để thử, hãy chú ý đến số lượng tham số (parameter counts). Các mô hình có nhiều tham số hơn sẽ tạo ra câu trả lời tốt hơn vì chúng thường đại diện cho các hệ thống phức tạp hơn. Tuy nhiên, nhược điểm là chúng sẽ chiếm nhiều không gian hơn trên thiết bị và hoạt động chậm hơn do yêu cầu tính toán cao hơn. Tùy thuộc vào mô hình cụ thể, dung lượng

Nguồn tin: Engadget AI — Tác giả: staff@engadget.com (Igor Bonifacic). Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.