Năm 2023, các nhà khoa học đã đạt được những tiến bộ đáng kể trong việc phát triển các mô hình ngôn ngữ lớn (LLM) có khả năng thực hiện nhiều tác vụ khác nhau, từ dịch thuật và tóm tắt văn bản đến tạo mã và trả lời câu hỏi. Tuy nhiên, việc đào tạo các LLM này đòi hỏi một lượng lớn tài nguyên tính toán, đặc biệt là các đơn vị xử lý đồ họa (GPU).
Để giải quyết thách thức này, các nhà nghiên cứu tại Đại học Stanford đã phát triển một phương pháp mới để đào tạo các LLM hiệu quả hơn. Phương pháp của họ, được gọi là "LoRA" (Low-Rank Adaptation), cho phép đào tạo các LLM lớn hơn với ít GPU hơn và thời gian ngắn hơn.
LoRA hoạt động bằng cách đóng băng các trọng số của mô hình LLM đã được đào tạo trước và chỉ đào tạo một tập hợp nhỏ các trọng số bổ sung. Các trọng số bổ sung này được sử dụng để điều chỉnh mô hình cho một tác vụ cụ thể, chẳng hạn như dịch thuật hoặc tóm tắt.
Các nhà nghiên cứu đã chứng minh rằng LoRA có thể đạt được hiệu suất tương đương với các phương pháp đào tạo truyền thống, nhưng với chi phí tính toán thấp hơn đáng kể. Ví dụ, họ đã sử dụng LoRA để đào tạo một mô hình LLM với 13 tỷ tham số trên một GPU duy nhất trong vòng chưa đầy 24 giờ.
LoRA có tiềm năng cách mạng hóa cách chúng ta đào tạo các LLM. Bằng cách giảm chi phí tính toán, LoRA có thể giúp các nhà nghiên cứu và nhà phát triển dễ dàng tiếp cận hơn với công nghệ LLM, từ đó thúc đẩy sự đổi mới trong lĩnh vực trí tuệ nhân tạo (AI).
Ngoài ra, LoRA cũng có thể được sử dụng để đào tạo các LLM trên các thiết bị có tài nguyên hạn chế, chẳng hạn như điện thoại thông minh và máy tính bảng. Điều này có thể mở ra những khả năng mới cho các ứng dụng AI, chẳng hạn như trợ lý ảo cá nhân và dịch thuật theo thời gian thực.
Nhìn chung, LoRA là một bước tiến quan trọng trong việc phát triển các LLM hiệu quả hơn. Phương pháp này có tiềm năng giúp các nhà nghiên cứu và nhà phát triển dễ dàng tiếp cận hơn với công nghệ LLM, từ đó thúc đẩy sự đổi mới trong lĩnh vực AI.
AI
Tin tức
Chính sách
Thị trưởng Shelbyville, Indiana, cho rằng chỉ những người sống trong “nhà tồi tàn” mới phản đối trung tâm dữ liệu.
Cư dân thành phố cho rằng Scott Furgeson đã thiếu tôn trọng.
Cư dân thành phố cho rằng Scott Furgeson đã thiếu tôn trọng.
bởi Terrence O'Brien
Biên tập viên cuối tuần
Ngày 6/6/2026, 3:05 PM UTC
Liên kết
Chia sẻ
Tặng
Nếu bạn mua hàng từ liên kết của Verge, Vox Media có thể kiếm được hoa hồng. Xem tuyên bố đạo đức của chúng tôi.
Ảnh: Cath Virginia / The Verge, Getty Images
Một phần của
Tất cả các cập nhật mới nhất về trung tâm dữ liệu AI
xem tất cả các cập nhật
Terrence O'Brien
là biên tập viên cuối tuần của Verge. Ông có hơn 18 năm kinh nghiệm, bao gồm 10 năm làm tổng biên tập tại Engadget.
Một trung tâm dữ liệu trị giá 2 tỷ USD được đề xuất đã trở thành điểm nóng chính trị tại thành phố nhỏ Shelbyville, Indiana. Cuộc tranh cãi càng trở nên gay gắt hơn sau khi Thị trưởng Scott Furgeson bị ghi hình nói về các biển báo “Không có Trung tâm Dữ liệu” đang mọc lên rằng, “Tôi đã thấy rất nhiều biển báo này khắp thị trấn, nhưng tôi chỉ thấy chúng ở những ngôi nhà tồi tàn,” trước khi nói thêm, “hầu hết chúng là nhà cho thuê.”
Người phụ nữ nói chuyện với ông trong đoạn clip nhanh chóng phản bác, nói rằng họ là “người lao động,” và một người khác xen vào nói thêm điều mà một thị trưởng không nên phải nghe về cử tri của mình: “không quan trọng đó là nhà cho thuê, họ vẫn là con người.”
Cư dân Shelbyville đương nhiên bị sốc trước ngôn ngữ coi thường của Furgeson đối với cử tri của mình. Alexas Williams gọi lời nói của thị trưởng là “khá thiếu tôn trọng” và “khá tổn thương” khi nói chuyện với chi nhánh NBC địa phương WTHR.
Thị trưởng đã từ chối bình luận thêm, mặc dù người phát ngôn của văn phòng thị trưởng đã đưa ra một tuyên bố nói rằng, “Thị trưởng lấy làm tiếc vì cách dùng từ của ông có thể đã gây ra sự xúc phạm.”
Theo dõi các chủ đề và tác giả từ câu chuyện này để xem thêm những nội dung tương tự trong nguồn cấp dữ liệu trang chủ được cá nhân hóa của bạn và để nhận thông báo qua email. Terrence O'Brien
Biên tập viên cuối tuần
AI
Tin tức
Chính sách
Chính trị
Thêm trong: Tất cả các cập nhật mới nhất về trung tâm dữ liệu AI
Các nhà lập pháp New York thông qua lệnh cấm một năm đối với các trung tâm dữ liệu mới
Lauren Feiner ngày 5 tháng 6
Kevin O’Leary đồng ý thu hẹp trung tâm dữ liệu khổng lồ ở Utah
Emma Roth, ngày 4/6
Tuần này, chúng ta sẽ nói về việc xây dựng trung tâm dữ liệu AI quy mô lớn.
Jay Peters, ngày 3/6
Được quan tâm nhất
Được quan tâm nhất
Summer Game Fest Live 2026: Những tin tức, trailer và thông báo quan trọng nhất
Bộ ba phiên bản làm lại của Final Fantasy VII sẽ kết thúc với Revelation
Siri mới lại xuất hiện
Grand Theft Auto VI đang làm thay đổi lịch phát hành trò chơi điện tử
Windows trở lại trong thực đơn của Microsoft
The Verge Daily
Bản tin tổng hợp miễn phí hằng ngày về những tin tức quan trọng nhất.
Email (bắt buộc)
Đăng ký
Bằng cách gửi email, quý vị đồng ý với Điều khoản và Thông báo quyền riêng tư của chúng tôi. Trang web này được bảo vệ bởi reCAPTCHA và áp dụng Chính sách quyền riêng tư cùng Điều khoản dịch vụ của Google.
Nội dung quảng cáo từ
Đây là tiêu đề cho quảng cáo tự nhiên
Nguồn tin: The Verge AI — Tác giả: Terrence O’Brien. Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.