[AINews] Các kỳ lân AI Infra mới: Exa, Modal, TurboPuffer

Tham gia Khảo sát Kỹ thuật AI năm 2026 để nhận hơn 2.000 USD tín dụng và vé AIE WF! Chúc mừng các khách mời đã đạt được những cột mốc quan trọng trong tuần này: Turbopuffer: 100 triệu USD ARR và có lợi nhuận (podcast của chúng tôi) Exa: 250 triệu USD với định giá 2,2 tỷ USD trong vòng Series C (podcast của chúng tôi) Modal: 355 triệu USD với định giá 4,7 tỷ USD trong vòng Series C (podcast của chúng tôi) Chúng tôi thực sự cần sớm huy động quỹ Latent Space... nhưng trong lúc đó... hãy giúp chúng tôi bằng cách tham gia Khảo sát Kỹ thuật AI năm 2026 để nhận hơn 2.000 USD tín dụng Notion và Vercel cùng vé AIE WF! Tin tức AI từ ngày 20/5/2026 đến ngày 21/5/2026. Chúng tôi đã kiểm tra 12 subreddit, 544 tài khoản Twitter và không có Discord nào khác. Trang web của AINews

Tham gia Khảo sát Kỹ thuật AI năm 2026 và nhận hơn 2.000 USD tín dụng cùng vé tham dự AIE WF! Chúc mừng tất cả các khách mời đã đạt được những cột mốc quan trọng trong tuần này: Turbopuffer: 100 triệu USD ARR và có lợi nhuận (podcast của chúng tôi) Exa: 250 triệu USD với định giá 2,2 tỷ USD trong vòng Series C (podcast của chúng tôi) Modal: 355 triệu USD với định giá 4,7 tỷ USD trong vòng Series C (podcast của chúng tôi) Chúng tôi thực sự cần sớm huy động quỹ Latent Space... nhưng trong lúc đó... hãy giúp chúng tôi bằng cách tham gia Khảo sát Kỹ thuật AI năm 2026 và nhận hơn 2.000 USD tín dụng Notion và Vercel cùng vé tham dự AIE WF! Tin tức AI từ ngày 20/5/2026 đến ngày 21/5/2026. Chúng tôi đã kiểm tra 12 subreddit, 544 tài khoản Twitter và không có thêm Discord nào. Trang web của AINews cho phép bạn tìm kiếm tất cả các số báo trước đây. Xin nhắc lại, AINews hiện là một phần của Latent Space. Bạn có thể chọn nhận/không nhận email theo tần suất! Tổng hợp tin tức AI trên Twitter Cập nhật về mô hình, điểm chuẩn và nghiên cứu: RAEv2, Gated DeltaNet-2, Lọc dữ liệu và Open Math RAEv2 và mã hóa ưu tiên biểu diễn: Một số nhà nghiên cứu đã nhấn mạnh RAEv2 là một bước tiếp theo quan trọng của Representation Autoencoders để hiểu và tạo hình ảnh thống nhất. @1jaskiratsingh cho biết bản cập nhật này mang lại tốc độ hội tụ nhanh hơn gấp 10 lần, khả năng tái tạo tốt hơn và khả năng tạo tốt hơn, với các thử nghiệm mở rộng sang mô hình văn bản thành hình ảnh và mô hình thế giới. Một bản tóm tắt tiếng Trung từ @recatm đã trích xuất hữu ích ba phát hiện chính: tổng hợp K lớp mã hóa cuối cùng thay vì chỉ lớp cuối cùng giúp cải thiện cả tái tạo và tạo mà không tăng chi phí suy luận; RAE và REPA bổ sung cho nhau về ngữ nghĩa so với cấu trúc không gian; và REPA có thể được định hình lại thành một cơ chế tự hướng dẫn nội bộ, tránh các bước hướng dẫn mô hình yếu bổ sung. @sainingxi`e cũng chỉ ra các quan điểm đánh giá mới ngoài FID, lập luận rằng vẫn còn nhiều tiềm năng chưa được khai thác trong các bộ giải mã pixel dựa trên biểu diễn. Các lựa chọn thay thế cho các giả định về cơ chế chú ý và bộ mã hóa tiêu chuẩn: Gated DeltaNet-2 của NVIDIA tách rời các hoạt động xóa và ghi trong cơ chế chú ý tuyến tính bằng các cổng theo kênh, vượt trội hơn KDA và Mamba-3 với 1,3 tỷ tham số trong mô hình ngôn ngữ và suy luận thông thường, với những cải thiện đáng kể trong việc truy xuất ngữ cảnh dài trên RULER; @rasbt gọi đây là một trong những hướng chú ý lai thú vị hơn. Về mã hóa, @NousResearch đã công bố một nghiên cứu có kiểm soát về lý do mã hóa từ con giúp ích, mô phỏng bảy lợi ích giả định trong một đường ống cấp byte 1,7 tỷ; chỉ ba trong số bảy can thiệp đã thay đổi lỗi xác thực ở quy mô đó. Riêng biệt, @tatsu_hashimoto đã báo cáo một kết quả mở rộng đáng ngạc nhiên trên DCLM: với đủ sức mạnh tính toán, bộ lọc dữ liệu tốt nhất có thể là không có bộ lọc, với các dự đoán cho thấy điểm giao nhau cho các nhóm quy mô internet nằm khoảng 1e30 FLOPs; các đánh giá hạ nguồn có vẻ nhiễu nhưng nhất quán về mặt định hướng (theo dõi). Khả năng diễn giải cơ học và hình học: @GoodfireAI lập luận rằng lời chỉ trích phổ biến "các mô hình suy nghĩ trong các đa tạp cong, SAE sử dụng các đặc trưng đường thẳng" chỉ đúng một phần. Giải pháp được đề xuất của họ là nhóm các đặc trưng SAE theo các mẫu kích hoạt chung, khôi phục hình học thông qua các nhóm đặc trưng thay vì các nguyên tử riêng lẻ (tiếp tục chủ đề, bài đăng). Đây là một bản cập nhật hữu ích cho cuộc thảo luận hiện tại về SAE: không phải là sự bác bỏ các đặc trưng thưa thớt, mà là một cảnh báo rằng việc diễn giải nên chuyển từ các đặc trưng đơn lẻ sang các tập hợp có cấu trúc. Toán học như một lĩnh vực nghiên cứu AI: Cuộc thảo luận khoa học lớn nhất tập trung vào kết quả được báo cáo của OpenAI về một bài toán khoảng cách đơn vị Erdős. @markchen90 đã coi đây là bằng chứng cho thấy toán học hiện là lĩnh vực dễ tiếp cận nhất đối với các đột phá nghiên cứu có sự hỗ trợ của AI, trong khi @wtgowers lưu ý rằng nếu mức độ tương tác của con người thấp được báo cáo là đúng, thì kết quả này thực sự thú vị. Cuộc tranh luận ngay lập tức bị định hình bởi sự hoài nghi và những lo ngại về điểm chuẩn/khả năng chơi game, với @memecrashes nói đùa rằng kết quả đã "lỗi thời chưa đầy 3 giờ sau đó bởi một con người", và @cloneofsimo chỉ ra "sự thay đổi mục tiêu" có thể dự đoán được xung quanh những gì được coi là toán học AI hợp pháp. Điểm kỹ thuật thú vị là toán học tiếp tục đóng vai trò là một ranh giới tương đối rõ ràng cho nghiên cứu hợp tác AI vì các kết quả có thể được kiểm tra, tranh luận và mở rộng. Các tác nhân, khung công cụ và công cụ dành cho nhà phát triển: Codex, Gemini, Devin và cơ sở hạ tầng tác nhân Các khung công cụ vẫn là một nguồn chính để tăng cường khả năng: @lvwerra đã phát hành physics-intern, một khung công cụ giải quyết vấn đề khoa học giúp tăng cường các mô hình như Gemini 3.1 Pro từ 17,7 lên 31,4, vượt qua GPT 5.5 Pro trong thiết lập đó. Điểm đáng chú ý là bản thân GPT 5.5 Pro không được hưởng lợi từ khung công cụ, cho thấy sự hấp thụ các thủ thuật hỗ trợ cụ thể theo mô hình. Với tinh thần tương tự, @KLieret đã làm cho mini-swe-agent có thể chạy trên ProgramBench, với mục đích rõ ràng là cải thiện sự đổi mới khung công cụ xung quanh các tác nhân kỹ thuật phần mềm. Các mẫu thiết kế tác nhân đang trưởng thành từ "tác nhân đơn lẻ trước tiên" đến sự điều phối tác nhân phụ rõ ràng: @cwolferesearch đưa ra một tổng hợp thực tế: bắt đầu với các hệ thống tác nhân đơn lẻ, và chỉ chuyển sang các cấu trúc liên kết quản lý/tác nhân phụ hoặc đa tác nhân phi tập trung khi sự tràn lan công cụ hoặc sự phình to lời nhắc trở nên không thể quản lý được. Lời khuyên đó phù hợp với những quan sát hoạt động hơn từ những người dùng tác nhân phụ: @andrew_locke mô tả quy trình làm việc sub-Devin của Cognition như một sự thay đổi đáng kể, nén những gì trước đây trông giống như 2+ tuần làm việc của kỹ sư thành vài giờ. Codex đã triển khai một lớp sản phẩm đáng kể trên mô hình: Các bản cập nhật "Codex Thursday" của OpenAI ít quan trọng hơn như các tính năng độc lập mà là dấu hiệu cho thấy các tác nhân mã hóa đang đi đến đâu. @OpenAIDevs đã ra mắt Appshots, ghi lại cả ảnh chụp màn hình và văn bản từ các cửa sổ ứng dụng Mac để có ngữ cảnh làm việc phong phú hơn; họ cũng đã thêm tính năng chia sẻ plugin nhóm (liên kết) và phân tích tổ chức chi tiết hơn (liên kết). Sự thay đổi hệ thống quan trọng hơn là việc sử dụng máy tính từ xa: @OpenAIDevs cho biết Codex hiện có thể sử dụng các ứng dụng trên máy Mac của bạn một cách an toàn từ điện thoại của bạn ngay cả khi máy Mac bị khóa. Đây là một tín hiệu mạnh mẽ cho thấy bề mặt sản phẩm tác nhân đang chuyển từ các IDE trò chuyện sang các quy trình làm việc của nhà điều hành liên tục trên nhiều thiết bị. Câu chuyện về tác nhân/công cụ của Gemini là