Bỏ qua tới nội dung chính
Quay lại tin tức

[AINews] Microsoft Build: MAI-Thinking-1 và các mô hình thuộc dòng MAI

Latent Space· 3/6/2026models

Hôm nay là một ngày trọng đại, đặc biệt là khi chúng tôi đã cập nhật tình hình GitHub so với Agents, và ghi lại một podcast đặc biệt với No Priors và Satya Nadella — tại MS Build, Satya và Mustafa đã công bố 7 mô hình MAI mới: Đây là một danh mục ấn tượng, đặc biệt khi xét đến việc thỏa thuận Microsoft-Inflection thiết lập MAI chỉ mới diễn ra 2 năm trước, và tất cả các mô hình này đều được huấn luyện từ đầu. MAI ngày nay không phải là một phòng thí nghiệm tiên phong không đủ tiêu chuẩn, nhưng nó là một neolab (phòng thí nghiệm mới) cấp 2 tốt với những động lực rõ ràng để hỗ trợ các tinh chỉnh chuyên biệt theo lĩnh vực (trái ngược với các phòng thí nghiệm tiên phong đã loại bỏ gần như tất cả các tinh chỉnh).

Hôm nay là một ngày trọng đại, đặc biệt là khi chúng tôi đã cập nhật tình hình GitHub so với các tác nhân (Agents) và ghi lại một podcast đặc biệt với No Priors và Satya Nadella tại MS Build. Satya và Mustafa đã công bố 7 mô hình MAI mới: Đây là một danh mục ấn tượng, đặc biệt khi xét đến việc thỏa thuận Microsoft-Inflection thành lập MAI mới chỉ diễn ra cách đây 2 năm, và tất cả các mô hình này đều được huấn luyện từ đầu. MAI ngày nay không phải là một phòng thí nghiệm tiên phong không đủ tiêu chuẩn, nhưng nó là một phòng thí nghiệm mới cấp 2 tốt với những động lực rõ ràng để hỗ trợ các tinh chỉnh chuyên biệt theo lĩnh vực (ngược lại với các phòng thí nghiệm tiên phong đã loại bỏ gần như tất cả các tinh chỉnh). Điểm nhấn của sự kiện là báo cáo kỹ thuật MAI dài hơn 100 trang, nhận được nhiều đánh giá tích cực từ cộng đồng nghiên cứu: Bạn có thể tìm hiểu tất cả các thông báo còn lại trong bản tóm tắt xuất sắc của Verge và các tóm tắt trên Twitter dưới đây: Tin tức AI ngày 1/6/2026-2/6/2026. Chúng tôi đã kiểm tra 12 subreddit, 544 tài khoản Twitter và không có Discord nào khác. Trang web của AINews cho phép bạn tìm kiếm tất cả các số báo trước đây. Xin nhắc lại, AINews hiện là một phần của Latent Space. Bạn có thể chọn nhận/không nhận email theo tần suất! Tóm tắt AI trên Twitter Tin tức hàng đầu: Tóm tắt Microsoft Build và chi tiết kỹ thuật mô hình MAI mới Điều gì đã xảy ra Microsoft đã sử dụng Build để định vị mình vừa là một công ty nền tảng AI vừa là một phòng thí nghiệm mô hình tiên phong, kết hợp các đợt ra mắt sản phẩm rộng rãi với những tiết lộ chi tiết bất thường về dòng mô hình MAI mới của mình. Microsoft AI đã công bố bảy mô hình MAI mới bao gồm suy luận, mã, hình ảnh, chuyển đổi giọng nói thành văn bản và giọng nói, dẫn đầu là MAI-Thinking-1, MAI-Code-1-Flash, MAI-Image-2.5, MAI-Transcribe-1.5 và MAI-Voice-2 theo @MicrosoftAI và @mustafasuleyman Mô hình suy luận hàng đầu MAI-Thinking-1 được giới thiệu là mô hình suy luận đầu tiên của Microsoft, được xây dựng với nguồn dữ liệu rõ ràng và không có sự chắt lọc từ các mô hình của bên thứ ba trong các bài đăng từ @mustafasuleyman, @baseten, @tuhinone và @HannaHajishirzi Microsoft đã phát hành báo cáo kỹ thuật dài 109 trang cho MAI-Thinking-1, thu hút phản ứng tích cực mạnh mẽ từ những độc giả có định hướng kỹ thuật vì mức độ minh bạch của nó, bao gồm @eliebakouch, @ethanCaballero, @nrehiew_, @yacinelearning và @stochasticchasm Microsoft cũng nhấn mạnh AI cục bộ và Windows tích hợp tác nhân (agent-native): Thông điệp của Build làm nổi bật các lớp thực thi an toàn cho các tác nhân, một Surface RTX Spark Dev Box mới, quyền truy cập AI của Windows vào cơ sở cài đặt GPU Windows rộng lớn hơn và các phần cứng ý tưởng như Project Solara/Scout, được tóm tắt bởi @yusuf_i_mehdi, @TheTuringPost, @kimmonismus và @kimmonismus Build cũng bao gồm một đợt thúc đẩy ứng dụng GitHub Copilot lớn như "ngôi nhà máy tính để bàn cho phát triển phần mềm tích hợp tác nhân", với các canvas, tính liên tục trên các thiết bị và quy trình làm việc tác nhân GitHub chặt chẽ hơn, từ @pierceboggan, @lukehoban và phản ứng từ @techgirl1908 Microsoft đã giới thiệu Web IQ, một ngăn xếp API tìm kiếm/nền tảng mới cho các tác nhân AI, tuyên bố các API này đã cung cấp năng lượng cho "gần như tất cả các tác nhân AI và chatbot trong ngành hiện nay, bao gồm Copilot và ChatGPT," thông qua @JordiRib1 Satya Nadella đã định hình Build như một khoảnh khắc hệ sinh thái chứ không phải là một đợt ra mắt sản phẩm đơn lẻ, trong khi Mustafa Suleyman định hình nó như là kết quả của "cỗ máy leo đồi" nội bộ của Microsoft, trong @satyanadella, @mustafasuleyman và phản ứng từ @nrehiew_ Dòng mô hình MAI: các sự kiện được tiết lộ và chi tiết kỹ thuật MAI-Thinking-1 Microsoft mô tả MAI-Thinking-1 là một MoE 35 tỷ tham số hoạt động với cửa sổ ngữ cảnh 256K trong @mustafasuleyman Một bản tóm tắt riêng từ @scaling01 cho biết mô hình này là mô hình 1T@35B tham số, được huấn luyện trước trên 30T token và sử dụng 8192 GPU GB200; đây dường như là một cách đọc báo cáo kỹ thuật hơn là tài liệu tiếp thị của Microsoft. @kimmonismus cũng tóm tắt tương tự là một MoE cỡ trung với 45B tham số hoạt động, nhưng điều này mâu thuẫn với con số 35B tham số hoạt động của Mustafa; con số đáng tin cậy hơn trong các tweet là con số chính thức 35B tham số hoạt động. Microsoft tuyên bố đạt 97% trên AIME 2025 và 53% trên SWE-Bench Pro, với những người đánh giá ẩn danh trên Surge ưu tiên mô hình này hơn Sonnet 4.6, theo @mustafasuleyman và @asadovsky. Microsoft cho biết mô hình được tối ưu hóa trên MAIA 200, với hiệu suất trên mỗi đô la tốt hơn 30% và hiệu suất trên mỗi watt tăng 1,4 lần so với GB200 khi chạy các mô hình MAI từ đầu đến cuối, theo @mustafasuleyman. Microsoft và các đối tác liên tục nhấn mạnh không có sự chắt lọc từ bên thứ ba, "nguồn gốc dữ liệu sạch" và tinh chỉnh do doanh nghiệp kiểm soát với dữ liệu sau huấn luyện "100% không giám sát" thông qua Baseten, trong @baseten, @tuhinone và @MicrosoftAI. MAI-Code-1-Flash Microsoft đã giới thiệu MAI-Code-1-Flash như một mô hình mã hóa nhanh cho VS Code và GitHub Copilot CLI, lần đầu tiên được công bố bởi @pierceboggan và sau đó được @mariorod1 nhấn mạnh. Thông điệp chính thức của Microsoft qua @mustafasuleyman cho biết Code-1-Flash đạt 51% trên SWE-Bench Pro mặc dù chỉ có 5B tham số, định vị nó gần với kích thước/chi phí của Haiku. Một bản tóm tắt cạnh tranh từ @scaling01 mô tả nó là một MoE 137B tham số, ngữ cảnh 256K, được huấn luyện trên 10T+ token và "mạnh hơn và hiệu quả hơn Claude 4.5 Haiku." Điều này có thể chỉ ra 5B tham số hoạt động thay vì tổng số tham số; các tweet không hoàn toàn làm rõ sự khác biệt này, nhưng cùng nhau ngụ ý một dấu chân hoạt động nhỏ trong một MoE lớn hơn nhiều. Khả dụng khi ra mắt được nhấn mạnh là ưu tiên GitHub Copilot / VS Code, theo @scaling01 và @mariorod1. MAI-Image-2.5 Microsoft đã ra mắt MAI-Image-2.5 và một biến thể Flash, tuyên bố cả hai đều đạt vị trí thứ 2 trên bảng xếp hạng, với @mustafasuleyman nói rằng chúng vượt qua Nano Banana 2 trong chỉnh sửa hình ảnh. Các tài khoản bảng xếp hạng độc lập đã ủng hộ thứ hạng cao: @arena báo cáo vị trí thứ 2 trong Image Edit Arena với điểm 1401, +10 điểm so với Nano Banana 2, Grok Imagine và ChatGPT Image Latest HF. @arena còn cho biết MAI-Image-2.5 "thúc đẩy biên giới Pareto," nghĩa là không có mô hình nào ở mức giá của nó đạt điểm cao hơn trên tiêu chuẩn đó. Các đối tác phân phối nhanh chóng theo sau, bao gồm @OpenRouter và @fal. MAI-Transcribe-1.5 @ArtificialAnlys báo cáo MAI-Transcribe-1.

Nguồn tin: Latent Space. Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.