Deepseek giảm giá vĩnh viễn 75%, định giá token đầu ra thấp hơn…

Deepseek đã quyết định áp dụng vĩnh viễn mức giảm giá 75% cho mô hình hàng đầu V4-Pro của mình. Với mức giá 0,435 USD cho mỗi triệu token đầu vào, mô hình này rẻ hơn ít nhất 11,5 lần so với GPT-5.5 và rẻ hơn hơn 34 lần đối với token đầu ra. Đối với các hệ thống tác nhân (agentic systems) tiêu thụ nhiều token, mức giá này có thể gây áp lực lớn lên các nhà cung cấp phương Tây. Bài viết Deepseek áp dụng vĩnh viễn mức giảm giá 75%, định giá token đầu ra thấp hơn GPT-5.5 ít nhất 34 lần xuất hiện lần đầu trên The Decoder.

AI trong thực tiễn Deepseek giảm giá vĩnh viễn 75%, định giá token đầu ra thấp hơn GPT-5.5 ít nhất 34 lần. Matthias Bastian Ngày 23/5/2026 Nano Banana Pro được THE DECODER yêu cầu. Hỏi về bài viết này… Tìm kiếm Việc Deepseek giảm giá vĩnh viễn đã biến chiến lược AI của Trung Quốc thành một cuộc chiến giá cả gay gắt với các phòng thí nghiệm phương Tây. Deepseek đã giảm giá vĩnh viễn 75% đối với mô hình chủ lực của mình, Deepseek V4 Pro, công ty thông báo trên X. Chương trình khuyến mãi ban đầu dự kiến kết thúc vào ngày 31/5/2026. Theo mức giảm giá vĩnh viễn này, một triệu token đầu vào không có bộ nhớ đệm chỉ có giá 0,435 USD, trong khi một triệu token đầu ra có giá 0,87 USD. Lượt truy cập bộ nhớ đệm thậm chí còn đẩy giá đầu vào xuống thấp hơn. So với đó, GPT 5.5 tính phí 5 USD cho một triệu token đầu vào và 30 USD cho một triệu token đầu ra, trong khi Opus 4.7 có giá 5 USD cho đầu vào và 25 USD cho đầu ra. Mô hình Đầu vào trên 1 triệu token Lượt truy cập bộ nhớ đệm đầu vào Đầu ra trên 1 triệu token Deepseek-V4-Pro 0,435 USD 0,003625 USD 0,87 USD Deepseek-V4-Flash 0,14 USD 0,0028 USD 0,28 USD GPT-5.5 5,00 USD 0,50 USD 30,00 USD GPT-5.5 (Ngữ cảnh dài, >272K) 10,00 USD 1,00 USD 45,00 USD Opus 4.7 5,00 USD 0,50 USD 25,00 USD Điều này khiến mô hình chủ lực của Deepseek rẻ hơn khoảng 11,5 lần so với GPT 5.5 về giá đầu vào tiêu chuẩn. Khoảng cách còn lớn hơn nhiều đối với đầu ra, nơi Deepseek V4 Pro rẻ hơn khoảng 34,5 lần. So với giá ngữ cảnh dài của GPT 5.5 trên 272K token, Deepseek V4 Pro rẻ hơn khoảng 23 lần đối với đầu vào và khoảng 51,7 lần đối với đầu ra. Deepseek V4 Flash thậm chí còn rẻ hơn. Cả hai mô hình Deepseek đều cung cấp cửa sổ ngữ cảnh một triệu token và lên đến 384.000 token đầu ra. Deepseek cũng hỗ trợ cả định dạng API của OpenAI và Anthropic, giúp các nhà phát triển dễ dàng chuyển đổi hơn. Giá token chỉ nói lên một nửa câu chuyện Tuy nhiên, giá mỗi token thô chỉ là một phần của bức tranh. Mức tiêu thụ token cho mỗi tác vụ cũng quan trọng không kém. Hãy hình dung như giá xăng: giá thấp mỗi gallon không có ích gì nếu động cơ của bạn ngốn nhiên liệu. Một ví dụ điển hình là Gemini Flash 3.5 của Google. Trên lý thuyết, nó rẻ hơn và hoạt động tương tự như mô hình Pro 3.1 trước đó, nhưng nó tiêu thụ nhiều token hơn đáng kể, khiến nó có khả năng đắt hơn trong thực tế. Opus 4.7 của Anthropic cũng có vẻ rẻ hơn trên lý thuyết so với GPT-5.5, nhưng sử dụng nhiều token hơn so với phiên bản tiền nhiệm. Mặt khác, GPT-5.5 tiêu thụ ít token hơn GPT-5.4. Tuy nhiên, cả hai mô hình đều đắt hơn 30 đến 90% so với các mô hình mà chúng thay thế. Deepseek V4 rõ ràng tụt hậu so với các mô hình tiên tiến hàng đầu GPT-5.5 và Opus 4.7 về hiệu suất thô. Mức độ chính xác phụ thuộc vào tác vụ, và các điểm chuẩn chỉ nói lên một nửa câu chuyện; chỉ có việc sử dụng trong thế giới thực mới có thể cho biết. Nhưng khoảng cách giá là rất lớn, đặc biệt đối với các hệ thống AI tác nhân tiêu thụ nhiều token hơn gấp nhiều lần so với một chatbot tiêu chuẩn. Và khi việc sử dụng AI ngày càng tăng, các công ty ngày càng nhạy cảm hơn về giá. Chừng nào ROI (tỷ suất hoàn vốn) từ chi tiêu AI vẫn khó đo lường, nhiều công ty có thể thay đổi chiến lược: từ mô hình tốt nhất sang mô hình rẻ nhất nhưng vẫn đủ tốt. Deepseek đang bước vào vòng gọi vốn đầu tiên, nhưng công ty này không phải đối mặt với áp lực doanh thu như OpenAI và Anthropic – cả hai đều đang hướng tới IPO. Tin tức AI không cường điệu – Được tuyển chọn bởi con người Đăng ký THE DECODER để đọc không quảng cáo, nhận bản tin AI hàng tuần, báo cáo chuyên sâu "AI Radar" độc quyền sáu lần một năm, truy cập toàn bộ kho lưu trữ và quyền bình luận. Đăng ký ngay Nguồn: Deepseek qua X