[AINews] Hôm nay không có nhiều sự kiện nổi bật

Anthropic đang chứng kiến những tia sáng của RSI, ChatGPT của OpenAI cuối cùng đã vượt mốc 1 tỷ người dùng hoạt động hàng tháng (MAU), chậm khoảng 5 tháng so với dự kiến và có bộ nhớ được cải thiện. SpaceXAI đang giải thích về đợt IPO của mình cho những người có thể không biết rằng họ sẽ bị buộc phải mua cổ phiếu. Tuy nhiên, tất cả những điều này không quan trọng bằng việc mua vé và đặt phòng khách sạn cho sự kiện AIEWF, cũng như theo dõi podcast mới nhất với Andon Labs! Nhận 2.000 USD tín dụng và vé AIE WF miễn phí!","cta":null,"showBylines":true,"size":"sm","isEditorNode":true,"title":"Thực tế: Đánh giá cuối cùng — Lukas Petersson và Axel Backlund của Andon Labs","publishedBylines":[],"post_date":"2026-06-04T20:39:18

Anthropic đang chứng kiến những tia sáng của RSI, ChatGPT của OpenAI cuối cùng đã vượt mốc 1 tỷ người dùng hoạt động hàng tháng (MAU) chậm khoảng 5 tháng so với dự kiến và cải thiện bộ nhớ, còn SpaceXAI đang giải thích về đợt IPO của mình cho những người có thể không biết rằng họ sẽ bị buộc phải mua. Không điều nào trong số đó quan trọng bằng việc mua vé và đặt khách sạn cho AIEWF và theo dõi podcast mới nhất với Andon Labs! 2.000 USD tín dụng và vé AIE WF miễn phí! Tin tức AI ngày 3/6/2026-4/6/2026. Chúng tôi đã kiểm tra 12 subreddit, 544 tài khoản Twitter và không có thêm Discord nào. Trang web của AINews cho phép bạn tìm kiếm tất cả các số báo trước đây. Xin nhắc lại, AINews hiện là một phần của Latent Space. Bạn có thể chọn nhận/không nhận email thường xuyên! Tổng hợp tin tức AI trên Twitter NVIDIA ra mắt Nemotron 3 Ultra và 3.5 ASR Nemotron 3 Ultra là bản phát hành kỹ thuật rõ ràng nhất trong ngày: một mô hình MoE 550B hoàn toàn mở với 55B tham số hoạt động, ngữ cảnh 1M và tập trung rõ ràng vào các tác vụ tác nhân (agent) chạy dài. NVIDIA cho biết mô hình này nhanh hơn tới 5 lần và chi phí thấp hơn 30% cho các tác vụ tác nhân, với trọng số, dữ liệu tổng hợp, điểm kiểm tra phần thưởng, các biến thể lượng tử hóa và công thức huấn luyện được phát hành theo OpenMDW 1.1 (NVIDIA ra mắt, các tạo phẩm mở của NVIDIAAI, chuỗi bài của Pavlo Molchanov). Kiến trúc này kết hợp Mamba/attention lai, LatentMoE và MTP gốc, với quá trình tiền huấn luyện được thực hiện trong NVFP4 trên 20T token – đáng chú ý vì nó đẩy quá trình tiền huấn luyện độ chính xác thấp vào một chế độ quy mô mới (ghi chú kỹ thuật, thảo luận về quy mô). Các điểm chuẩn và câu chuyện phục vụ mạnh mẽ bất thường đối với một bản phát hành mở. @ArtificialAnlys đã đo được 47,7 trên Chỉ số Thông minh của họ bằng cách sử dụng trọng số suy luận NVFP4 được NVIDIA khuyến nghị (48,2 trong BF16), khiến nó trở thành mô hình mã nguồn mở mạnh nhất của Mỹ mà họ đã thử nghiệm, mặc dù vẫn đứng sau Kimi K2.6. Thú vị hơn, họ đã báo cáo hơn 400 token đầu ra/giây thông qua BlackBox, và riêng biệt cho thấy Nemotron 3 Ultra nằm trên đường biên Pareto về độ trễ tác vụ so với hiệu suất trên các đánh giá kiểu Terminal-Bench trong giới hạn lượt (phân tích độ trễ, thông lượng BlackBox). Mô hình này đã được triển khai ngay lập tức trên toàn bộ hệ thống: vLLM, Modal, Together, Fireworks, Ollama cloud, Baseten, CoreWeave/W&B, Cline, Prime Intellect và Nous Portal. Nemotron 3.5 ASR là bản phát hành đi kèm ít ồn ào hơn nhưng thiết thực: một mô hình ASR streaming mở với một điểm kiểm tra 0,6B duy nhất, 40 sự kết hợp ngôn ngữ-địa phương và độ trễ dưới 100ms, được xây dựng trên thiết kế kiểu FastConformer / RNN-T nhận biết bộ nhớ đệm được tối ưu hóa cho các tác nhân giọng nói và các tác vụ giọng nói streaming (Piotr Zelasko, Together, khả dụng trên fal). Anthropic công bố ghi chú chính sách/nghiên cứu được thảo luận nhiều nhất trong ngày, lập luận rằng các hệ thống hiện tại cho thấy những dấu hiệu ban đầu của khả năng tự cải thiện đệ quy (RSI) – chưa phải là quyền tự chủ hoàn toàn trong định hướng nghiên cứu, nhưng là bằng chứng rõ ràng cho thấy AI đang thúc đẩy sự phát triển của AI (bài đăng của Anthropic). Các tuyên bố hoạt động chính rất cụ thể: hơn 80% mã được hợp nhất tại Anthropic hiện do Claude tạo ra, kỹ sư điển hình tạo ra lượng mã gấp 8 lần mỗi quý so với những năm trước và trong các tác vụ kỹ thuật mở nội bộ, tỷ lệ thành công của Claude đã tăng từ khoảng 26% lên 76% trong sáu tháng (số liệu mã, tóm tắt của Alex Albert). Điểm dữ liệu thực nghiệm nổi bật nhất là thử nghiệm định kỳ "tăng tốc một tập lệnh đào tạo mô hình nhỏ" của Anthropic: Claude Opus 4 đạt tốc độ tăng trung bình khoảng 3 lần, trong khi Mythos Preview được báo cáo đạt khoảng 52 lần (tuyên bố điểm chuẩn của Anthropic, đính chính về ngày). Anthropic cũng cho biết Mythos đưa ra các đề xuất nghiên cứu "nên làm gì tiếp theo" tốt hơn con người 64% số lần trong các phiên mà nhà nghiên cứu đã đi sai hướng (kết quả bước nghiên cứu tiếp theo). Luận điểm rộng hơn của họ: tự động hóa việc lựa chọn vấn đề vẫn chưa được giải quyết, nhưng tự động hóa phần lớn việc triển khai và lặp lại đã và đang diễn ra. Góc độ quản trị cũng quan trọng không kém các tuyên bố về năng suất. Anthropic đã viết rõ ràng rằng "sẽ tốt cho thế giới nếu có lựa chọn làm chậm hoặc tạm thời tạm dừng phát triển AI tiên tiến", coi các cơ chế xác minh và phối hợp là ngày càng cấp bách nếu các động lực giống RSI tiếp tục (tuyên bố quản trị của Anthropic, thảo luận, bình luận). Điều này xuất hiện trong bối cảnh chỉ trích rằng Anthropic gần đây đã làm suy yếu một số phần trong ngưỡng Chính sách mở rộng quy mô có trách nhiệm của mình liên quan đến rủi ro sinh học/hóa học, theo @CRSegerie. Riêng biệt, một liên minh bao gồm Altman, Amodei, Hassabis và Baker đã ủng hộ việc sàng lọc và lưu trữ hồ sơ tổng hợp DNA bắt buộc ở Hoa Kỳ, lập luận rằng AI đang làm xói mòn các rào cản kiến thức sinh học (tóm tắt thư). Cloudflare mua lại VoidZero và thắt chặt chuỗi công cụ tác nhân toàn diện Động thái nền tảng nhà phát triển lớn nhất là Cloudflare mua lại VoidZero, nhóm đứng sau Vite, Vitest, Rolldown, Oxc và Vite+. Cloudflare và VoidZero nhấn mạnh rằng Vite vẫn là mã nguồn mở, theo giấy phép MIT và trung lập với nhà cung cấp, với Cloudflare cũng cam kết 1 triệu USD vào một quỹ để phát triển hệ sinh thái Vite độc lập (Cloudflare, tuyên bố của Vite, Evan You). Phân tích chiến lược từ các nhà phát triển là điều này mang lại cho Cloudflare quyền kiểm soát chặt chẽ hơn đối với một ứng dụng ngày càng thân thiện với tác nhân.