Anthropic ra mắt Opus 4.8 với công cụ “quy trình làm việc động”…

Mô hình Opus mới đi kèm với một công cụ có tên Dynamic Workflows, dùng để điều phối các nhóm tác nhân phụ.

Ngày 16/5, Anthropic đã phát hành Opus 4.8, phiên bản mới nhất của mô hình tiên tiến nhất hiện có của hãng. Mô hình này hiện đã có mặt ở khắp mọi nơi, với mức giá tiêu chuẩn tương đương với phiên bản Opus trước đó. Mô hình mới ra mắt chỉ 41 ngày sau khi Opus 4.7 được phát hành, một chu kỳ nâng cấp nhanh hơn nhiều so với thông lệ của Anthropic. (Các mô hình Sonnet và Haiku gần đây nhất lần lượt đã ra mắt được ba và bảy tháng.) Tốc độ ra mắt nhanh chóng này có thể liên quan đến phản ứng lạnh nhạt đối với Opus 4.7, mà một số người dùng cho là đáng thất vọng. Trong khoảng thời gian đó, OpenAI cũng đã có những bản phát hành mới đáng kể cho Codex và Google cho mô hình Gemini Flash, làm tăng áp lực lên Anthropic để duy trì tốc độ. Opus 4.8 đi kèm với các kết quả điểm chuẩn (benchmark) tốt nhất trong phân khúc như mong đợi, nhưng cũng đặc biệt chú ý đến cách mô hình xử lý dữ liệu xấu hoặc không chắc chắn. Trong bài đăng ra mắt, những người thử nghiệm ban đầu của Anthropic nhận thấy rằng mô hình mới "có nhiều khả năng báo hiệu sự không chắc chắn về công việc của mình và ít có khả năng đưa ra các tuyên bố không có căn cứ hơn." Nhấn mạnh điểm này, một lời chứng thực từ các cộng sự của Bridgewater cho biết sự khác biệt lớn nhất trong bản nâng cấp là "xu hướng của Opus 4.8 chủ động báo hiệu các vấn đề với đầu vào và đầu ra của một phân tích, điều mà các mô hình khác thường bỏ sót và để người dùng tự phát hiện." Cùng với mô hình mới, Anthropic đã ra mắt một tính năng có tên Dynamic Workflows, sẽ có sẵn trong bản xem trước nghiên cứu. Hệ thống này được thiết kế để giúp các mô hình lớn hơn như Opus quản lý các tác vụ phức tạp trên hàng trăm tác nhân phụ song song. Bài đăng giải thích: "Claude Code cùng với Opus 4.8 hiện có thể thực hiện các di chuyển quy mô cơ sở mã trên hàng trăm nghìn dòng mã từ khi bắt đầu đến khi hợp nhất, với bộ thử nghiệm hiện có làm tiêu chuẩn." Anthropic vẫn đang giữ lại mô hình Mythos tiên tiến nhất của mình sau khi một bản xem trước thử nghiệm vào tháng trước đã gây ra lo ngại về an ninh mạng. Tuy nhiên, công ty đã gợi ý trong bản phát hành Opus hôm nay rằng thời gian xem trước Mythos có thể sớm kết thúc, một khi các biện pháp bảo vệ cần thiết được hoàn tất. Công ty viết: "Chúng tôi đang đạt được tiến bộ nhanh chóng trong việc phát triển các biện pháp bảo vệ này và hy vọng sẽ có thể mang các mô hình cấp Mythos đến tất cả khách hàng của chúng tôi trong những tuần tới." Lượt cài đặt DuckDuckGo tăng 30% khi người dùng từ chối bị "ép buộc" sử dụng tìm kiếm AI của Google Rebecca Bellan Con đường tái sử dụng của Starship trở nên mờ mịt sau sự kiện S-1 của SpaceX Tim Fernholz 6 thiết bị nhà bếp giúp việc trưởng thành trở nên dễ dàng hơn Lauren Forristal Tôi đã thử thiết bị đeo Bee của Amazon và cảm thấy vừa tò mò vừa hơi rùng mình Lucas Ropek Bạn không còn có thể tìm kiếm từ "disregard" (bỏ qua) trên Google Russell Brandom

Anthropic ra mắt Opus 4.8 với công cụ “quy trình làm việc động” mới