Thiết kế các mô hình học ngôn ngữ thống kê: Thử nghiệm trên các…

Dưới đây là bản dịch bài viết của bạn: **Microsoft và OpenAI đang lên kế hoạch cho một trung tâm dữ liệu Stargate trị giá 100 tỷ USD** Microsoft và OpenAI được cho là đang lên kế hoạch cho một dự án trung tâm dữ liệu có tên mã "Stargate", có thể tiêu tốn tới 100 tỷ USD. Dự án này sẽ bao gồm một siêu máy tính trí tuệ nhân tạo (AI) khổng lồ, dự kiến sẽ được triển khai trong sáu năm tới. Thông tin này được đưa ra bởi The Information, trích dẫn những người quen thuộc với các kế hoạch. Theo báo cáo, Stargate sẽ là một trong số các siêu máy tính mà hai công ty đang có kế hoạch xây dựng trong vài năm tới. Dự án Stargate được cho là sẽ lớn hơn nhiều so với các trung tâm dữ liệu hiện có của Microsoft. Nó sẽ được đặt tại Hoa Kỳ và có thể bắt đầu hoạt động sớm nhất vào năm 2028. Sam Altman, Giám đốc điều hành của OpenAI, đã bày tỏ mong muốn huy động hàng tỷ USD để xây dựng các nhà máy sản xuất chip AI. Ông tin rằng việc này là cần thiết để hỗ trợ sự phát triển của AI. Microsoft sẽ tài trợ cho dự án Stargate, dự kiến sẽ đắt gấp 100 lần so với các trung tâm dữ liệu lớn nhất hiện nay. Chi phí này chủ yếu đến từ việc mua hàng triệu chip máy chủ chuyên dụng. Brad Smith, Phó Chủ tịch kiêm Chủ tịch của Microsoft, cho biết công ty đang tìm kiếm các giải pháp năng lượng thay thế để cung cấp năng lượng cho các trung tâm dữ liệu AI của mình. Ông cũng lưu ý rằng Microsoft đang đầu tư vào năng lượng hạt nhân nhỏ để giải quyết nhu cầu năng lượng ngày càng tăng. Stargate sẽ là siêu máy tính lớn thứ năm trong chuỗi siêu máy tính mà Microsoft và OpenAI đã lên kế hoạch. Microsoft đã xây dựng một siêu máy tính nhỏ hơn cho OpenAI, sử dụng hàng chục nghìn chip đồ họa (GPU) Nvidia. Các siêu máy tính AI này rất quan trọng đối với OpenAI, vì chúng cung cấp sức mạnh tính toán cần thiết để đào tạo các mô hình ngôn ngữ lớn (LLM) của công ty. Microsoft và OpenAI đã hợp tác chặt chẽ trong nhiều năm. Microsoft đã đầu tư hơn 13 tỷ USD vào OpenAI và tích hợp công nghệ của công ty này vào các sản phẩm của mình. Mối quan hệ đối tác này đã mang lại lợi ích cho cả hai công ty. OpenAI đã có quyền truy cập vào các nguồn lực điện toán khổng lồ của Microsoft, trong khi Microsoft đã có thể tích hợp công nghệ AI tiên tiến vào các sản phẩm của mình. Dự án Stargate là một minh chứng cho cam kết của Microsoft và OpenAI trong việc thúc đẩy sự phát triển của AI. Nó cũng cho thấy quy mô đầu tư cần thiết để xây dựng các hệ thống AI thế hệ tiếp theo.

Paperium Đăng ngày 29/5 • Ban đầu được xuất bản tại paperium.net Thiết kế các mô hình học ngôn ngữ thống kê: Thử nghiệm trên các danh từ ghép #ai #deeplearning #computerscience #machinelearning AI (Loạt 3314 phần) 1 Học tập của tác nhân thông qua kinh nghiệm ban đầu 2 MM-HELIX: Tăng cường suy luận phản xạ chuỗi dài đa phương thức với nền tảng toàn diện và tối ưu hóa chính sách lai thích ứng ... 3310 phần nữa... 3 MemMamba: Suy nghĩ lại các mẫu bộ nhớ trong mô hình không gian trạng thái 4 UniVideo: Hiểu, tạo và chỉnh sửa video thống nhất 5 VideoCanvas: Hoàn thành video thống nhất từ các bản vá không gian-thời gian tùy ý thông qua điều kiện trong ngữ cảnh 6 DreamOmni2: Chỉnh sửa và tạo dựa trên hướng dẫn đa phương thức 7 Từ cái gì đến tại sao: Một hệ thống đa tác nhân để suy luận điều kiện phản ứng hóa học dựa trên bằng chứng 8 Nhận thức siêu việt tăng cường các mô hình suy luận: Học tăng cường tự căn chỉnh 9 Khi suy nghĩ gặp sự thật: Suy luận có thể tái sử dụng cho các mô hình ngôn ngữ lớn (LLM) ngữ cảnh dài 10 Các token có xác suất thấp duy trì khám phá trong học tăng cường với phần thưởng có thể kiểm chứng 11 Điệu nhảy căn chỉnh: Đào tạo đồng thời các tác nhân để hợp tác vì sự an toàn 12 Tối ưu hóa chính sách tương đối nhóm không cần đào tạo 13 Tăng cường lai: Khi phần thưởng thưa thớt, dày đặc sẽ tốt hơn 14 NewtonBench: Đánh giá khám phá luật khoa học tổng quát trong các tác nhân LLM 15 ARTDECO: Hướng tới tái tạo 3D hiệu quả và độ trung thực cao theo thời gian thực với biểu diễn cảnh có cấu trúc 16 DeepPrune: Mở rộng song song không có sự dư thừa giữa các dấu vết 17 Lần thử đầu tiên quan trọng: Xem xét lại vai trò của sự phản ánh trong các mô hình suy luận 18 LLM học cách lừa dối một cách vô ý: Sự sai lệch xuất hiện trong sự không trung thực từ các mẫu sai lệch đến tương tác người-AI thiên vị 19 UniMMVSR: Một khung đa phương thức thống nhất để siêu phân giải video theo tầng 20 NaViL: Suy nghĩ lại các thuộc tính mở rộng của các mô hình ngôn ngữ lớn đa phương thức gốc dưới các ràng buộc dữ liệu 21 CoMAS: Các hệ thống đa tác nhân đồng tiến hóa thông qua phần thưởng tương tác 22 PickStyle: Chuyển đổi phong cách video sang video với bộ điều hợp ngữ cảnh-phong cách 23 UNIDOC-BENCH: Một điểm chuẩn thống nhất cho RAG đa phương thức tập trung vào tài liệu 24 InstructX: Hướng tới chỉnh sửa hình ảnh thống nhất với hướng dẫn MLLM 25 LongRM: Tiết lộ và mở khóa ranh giới ngữ cảnh của mô hình phần thưởng 26 Học trong công việc: Một tác nhân tự tiến hóa dựa trên kinh nghiệm cho các nhiệm vụ dài hạn 27 Tăng cường các mô hình khuếch tán bằng cách tối ưu hóa ưu tiên nhóm trực tiếp 28 Kiểm soát tạo video chuyển văn bản thành âm thanh thông qua điều kiện và tương tác phương thức nâng cao 29 Kích hoạt điều hòa entropy: Tăng cường kiểm soát liên tục, các mô hình ngôn ngữ lớn và phân loại hình ảnh bằng cách kích hoạt như 30 Truy xuất và củng cố bộ nhớ trong các mô hình ngôn ngữ lớn thông qua các token chức năng 31 Tái chế các điểm kiểm tra được đào tạo trước: Tăng trưởng trực giao của hỗn hợp chuyên gia để đào tạo trước mô hình ngôn ngữ lớn hiệu quả 32 GCPO: Khi độ tương phản thất bại, hãy chọn vàng 33 UP2You: Tái tạo nhanh chóng bản thân từ các bộ sưu tập ảnh không giới hạn 34 OmniRetarget: Tạo dữ liệu bảo toàn tương tác cho thao tác loco-manipulation toàn thân hình người và tương tác cảnh 35 DexNDM: Thu hẹp khoảng cách thực tế cho xoay trong tay khéo léo thông qua mô hình động lực học thần kinh theo khớp 36. A^2Search: Trả lời câu hỏi nhận biết sự mơ hồ bằng học tăng cường. 37. Học cách định tuyến các mô hình ngôn ngữ lớn (LLM) từ phản hồi Bandit: Một chính sách, nhiều đánh đổi. 38. Search-R3: Thống nhất suy luận và tạo nhúng trong các mô hình ngôn ngữ lớn. 39. R2RGEN: Tạo dữ liệu 3D từ thực tế sang thực tế để thao tác tổng quát hóa không gian. 40. Drive&Gen: Đồng đánh giá các mô hình lái xe đầu cuối và tạo video. 41. Vượt ra ngoài các giá trị ngoại lai: Một nghiên cứu về các bộ tối ưu hóa trong lượng tử hóa. 42. SViM3D: Khuếch tán vật liệu video ổn định để tạo 3D từ một hình ảnh. 43. GyroSwin: Các mô hình thay thế 5D cho mô phỏng nhiễu loạn plasma Gyrokinetic. 44. Hướng tới chỉnh sửa 3D có thể mở rộng và nhất quán. 45. Sử dụng mạng trực tuyến nếu có thể: Hướng tới học tăng cường nhanh và ổn định. 46. Thành phần dữ liệu nhận biết độ trung thực để tổng quát hóa robot mạnh mẽ. 47. SciVideoBench: Đánh giá suy luận video khoa học trong các mô hình đa phương thức lớn. 48. Khuếch tán quy mô lớn thông qua tính nhất quán theo thời gian liên tục được điều chỉnh theo điểm số. 49. Vượt qua giới hạn lượt: Huấn luyện các tác nhân tìm kiếm sâu với cửa sổ ngữ cảnh động. 50. OpenRubrics: Hướng tới tạo tiêu chí tổng hợp có thể mở rộng để mô hình hóa phần thưởng và căn chỉnh LLM. 51. Tư duy bằng camera: Một mô hình đa phương thức thống nhất để hiểu và tạo ra hình ảnh lấy camera làm trung tâm. 52. D2E: Mở rộng tiền huấn luyện thị giác-hành động trên dữ liệu máy tính để chuyển sang AI thể hiện. 53. TAG: Hướng dẫn khuếch đại tiếp tuyến để lấy mẫu khuếch tán chống ảo giác. 54. Tối ưu hóa lời nhắc đa phương thức: Tại sao không tận dụng nhiều phương thức cho MLLM. 55. AutoPR: Hãy tự động hóa việc thăng tiến học thuật của bạn! 56. R-Horizon: Mô hình suy luận lớn của bạn thực sự có thể đi xa đến đâu về chiều rộng và chiều sâu? 57. Webscale-RL: Quy trình dữ liệu tự động để mở rộng dữ liệu RL đến cấp độ tiền huấn luyện. 58. SpaceVista: Suy luận không gian trực quan mọi quy mô từ mm đến km. 59. StreamingVLM: Hiểu biết thời gian thực cho các luồng video vô hạn. 60. Đừng lãng phí sai lầm: Tận dụng các nhóm RL tiêu cực thông qua việc điều chỉnh lại độ tin cậy. 61. ARES: Suy luận thích ứng đa phương thức thông qua định hình entropy cấp độ mã thông báo nhận biết độ khó. 62. KORMo: Mô hình suy luận mở tiếng Hàn cho mọi người. 63. DISCO: Đa dạng hóa việc cô đặc mẫu để đánh giá mô hình hiệu quả. 64. Kết nối suy luận với học tập: Làm sáng tỏ ảo ảnh bằng cách tổng quát hóa độ phức tạp ngoài phân phối. 65. Biến đổi Gaussian lũy tiến với nhận biết dị hướng.

Thiết kế các mô hình học ngôn ngữ thống kê: Thử nghiệm trên các danh ngữ ghép