[AINews] Các decacorn (công ty khởi nghiệp trị giá trên 10 tỉ…

Hoàn thành Khảo sát Kỹ thuật AI năm 2026 để nhận hơn 2.000 USD tín dụng và vé tham dự AIE WF! Độc giả thích chúng tôi đưa tin không có gì mới, nhưng điều chúng tôi thích thứ hai là khi chúng tôi có thể củng cố một xu hướng mà bạn nên biết. Vào tháng 4, chúng tôi đã nhấn mạnh Điểm uốn suy luận (Inference Inflection), và nếu tiêu đề hôm nay gợi nhớ đến tiêu đề tuần trước, thì đó chính xác là điểm chúng tôi muốn đề cập. 2.000 USD tín dụng và vé tham dự AIE WF!","cta":null,"showBylines":true,"size":"sm","isEditorNode":true,"title":"[AINews] Các kỳ lân hạ tầng AI mới: Exa, Modal, TurboPuffer","publishedBylines":[{"id":89230629,"name":"Latent.Space","bi

Tham gia Khảo sát Kỹ thuật AI năm 2026 và nhận hơn 2.000 USD tín dụng cùng vé tham dự AIE WF! Độc giả thích khi chúng tôi đưa tin không có tin tức, nhưng điều chúng tôi thích thứ hai là khi chúng tôi có thể đơn giản củng cố một xu hướng mà bạn nên biết. Vào tháng 4, chúng tôi đã nhấn mạnh Điểm uốn suy luận (Inference Inflection), và nếu tiêu đề hôm nay gợi nhớ đến tiêu đề tuần trước, thì đó chính xác là điều chúng tôi muốn nói. Với tốc độ gây quỹ AI hiện nay, chính sách chung của chúng tôi là chỉ đưa tin về các công ty khởi nghiệp khi họ đạt trạng thái decacorn (hơn 10 tỷ USD) – nhưng chỉ khi được xác nhận, và tin tức hôm nay về vòng gọi vốn 15 tỷ USD của Fireworks ("đang đàm phán", tăng 3,75 lần trong 7 tháng, podcast của chúng tôi tại đây) và vòng gọi vốn 11 tỷ USD của Baseten ("đang huy động", tăng 2,2 lần trong 3 tháng) có vẻ hơi sớm, nhưng tốc độ tăng trưởng trong lĩnh vực Suy luận (Inference) và sự tiến triển từ unicorn lên decacorn quá hấp dẫn để không trở thành câu chuyện chính hôm nay, với vòng Series C trị giá 113 triệu USD của OpenRouter (tăng 5 lần về khối lượng trong 6 tháng) như một điểm nhấn: nếu bạn định thực hiện suy luận đa mô hình, bạn sẽ cần một bộ định tuyến (router). Tin tức AI từ ngày 23/5/2026 đến ngày 26/5/2026. Chúng tôi đã kiểm tra 12 subreddit, 544 tài khoản Twitter và không có Discord nào khác. Trang web của AINews cho phép bạn tìm kiếm tất cả các số báo trước đây. Xin nhắc lại, AINews hiện là một chuyên mục của Latent Space. Bạn có thể chọn nhận/không nhận email thường xuyên! Tổng hợp tin tức AI trên Twitter Các tác nhân AI, tiêu chuẩn mã hóa và sự dịch chuyển vượt ra ngoài "chỉ là mô hình" Kỹ thuật khai thác đang trở thành yếu tố khác biệt chính cho các tác nhân mã hóa: Một số bài đăng đã hội tụ vào cùng một luận điểm: bộ công cụ chiến thắng hiện nay là mô hình + khai thác + vòng lặp đánh giá, chứ không chỉ là một mô hình cơ sở mạnh hơn. Một bản tóm tắt dài trên Zhihu lập luận rằng DeepSeek đang xây dựng một nhóm khai thác để khép kín vòng lặp giữa đầu ra của mô hình, phản hồi thời gian chạy, xác thực và hiệu chỉnh, với lợi thế về chi phí đầu vào được lưu trữ, hỗ trợ các vòng lặp tương tác/xác minh chặt chẽ hơn. Song song đó, hướng dẫn Gemini Managed Agents của Google đã định hình cơ sở hạ tầng tác nhân như một lệnh gọi API duy nhất đến một khai thác được quản lý với hộp cát, tính bền vững và các điểm gắn kết, trong khi tài liệu create_agent được cập nhật của LangChain và bản tóm tắt bài báo "harness" của dair.ai đã chính thức hóa cùng một bộ công cụ: quản lý ngữ cảnh, bộ nhớ đáng tin cậy, định tuyến kỹ năng động. Các tiêu chuẩn đang ngày càng gần với trải nghiệm của nhà phát triển thực tế: DeepSWE, được giới thiệu là một tiêu chuẩn mới cho mã hóa tác nhân, đã nhận được sự ủng hộ mạnh mẽ từ các chuyên gia; @theo gọi đây là "tiêu chuẩn mã hóa đầu tiên thực sự phù hợp với cảm giác khi sử dụng các mô hình này để mã hóa." Nó cũng tạo ra sự phân tách lớn hơn ở phân khúc cao cấp so với những gì các bảng xếp hạng SWE công khai thường cho thấy. Các tín hiệu tiêu chuẩn liên quan: Qwen3.7 Max ra mắt ở vị trí thứ 4 trên Code Arena: Frontend, gần như ngang bằng với Claude Opus 4.6 trong các tác vụ phát triển web tác nhân, và Alibaba đã khuếch đại kết quả này. Trên toàn bộ bộ công cụ, Anthropic đã phát hành một plugin hướng dẫn bảo mật cho Claude Code và báo cáo giảm 30–40% các bình luận PR liên quan đến bảo mật trong quá trình sử dụng nội bộ, trong khi OpenAI đã nhấn mạnh GPT-5.5 trong Codex tại Databricks để phân tích tài liệu đáng tin cậy hơn. Các tác nhân nghiên cứu, suy luận dài hạn và "ngủ" để nén ngữ cảnh Các tác nhân toán học/khoa học cho thấy nhiều bằng chứng hơn về khả năng vượt trội—tùy thuộc vào khai thác phù hợp: Cụm tweet mạnh nhất xoay quanh các mô hình giải quyết các vấn đề mở cũ. Một nhà toán học đã báo cáo Claude Mythos giải quyết vấn đề số 90 của Erdős, với chi tiết tiếp theo là mô hình thường hội tụ theo một con đường chứng minh khác, sạch hơn so với lộ trình trước đây của OpenAI. Điều này được lặp lại bởi @_sholtodouglas, @kimmonismus, và sau đó được Sébastien Bubeck làm rõ hơn: với một khai thác thích hợp, cả Mythos và GPT-5.5 đều có thể tái tạo những gì một mô hình nội bộ đã làm trong một lần, ngụ ý một lượng lớn khả năng tiềm ẩn không được phơi bày bởi giao diện người dùng trò chuyện thông thường. Bộ nhớ dài hạn đang nổi lên trở lại như một nút thắt cổ chai cốt lõi: Bài báo "Language Models Need Sleep" đã nhận được sự chú ý đáng kể. Cơ chế là một giai đoạn hợp nhất giống như giấc ngủ, trong đó ngữ cảnh gần đây được chuyển đổi thành các trọng số nhanh liên tục trước khi xóa bộ nhớ đệm KV, chuyển tính toán sang một lần chạy ngoại tuyến trong khi vẫn giữ độ trễ thời gian thức. Bản tóm tắt của dair.ai đã nhấn mạnh góc độ hệ thống: đây là một giải pháp thay thế cho các bộ nhớ đệm KV ngày càng tăng đối với các tác nhân có quỹ đạo dài. Chủ đề này kết nối chặt chẽ với cuộc thảo luận đang diễn ra về hệ thống bộ nhớ trong các tác nhân, bao gồm cả gợi ý của Omar về bài nói chuyện về bộ nhớ và tính năng Dream của Anthropic. Các tác nhân nghiên cứu chuyên sâu mở và dự báo khoa học cũng đã tiến bộ: QUEST, một họ mô hình mở 2B–35B để tìm kiếm thông tin dài hạn, căn cứ trích dẫn và tổng hợp báo cáo, đã được phát hành dưới dạng một tác nhân nghiên cứu chuyên sâu đa năng. Về phía đánh giá khoa học, Sakana/Stan

[AINews] Các decacorn (công ty khởi nghiệp trị giá trên 10 tỉ USD) hạ tầng AI mới: Fireworks, Baseten (cùng với OpenRouter sắp ra mắt).