LWiAI Podcast #243 - GPT 5.5, DeepSeek V4, phá hoại an toàn AI…

Tập thứ 243 của chúng tôi có phần tóm tắt và thảo luận về tin tức lớn về AI của tuần trước! Ghi vào ngày 29/04/2026 Dẫn chương trình bởi Andrey Kurenkov và Jeremie Harris Vui lòng gửi email cho chúng tôi câu hỏi và phản hồi của bạn tại andreyvkurenkov@gmail.com và/hoặc hello@gladstone.ai Trong tập này: OpenAI đã phát hành GPT-5.5 với những cải tiến mạnh mẽ theo định hướng mã hóa, thẻ hệ thống thảo luận về khả năng giám sát chuỗi suy nghĩ và kiểm tra độ lệch, giá cao hơn GPT-5.4 và những điểm kỳ quặc đáng chú ý như cảnh báo nhanh chóng của hệ thống về “yêu tinh”. xAI đã ra mắt Grok Voice Think Fast 1.0, khẳng định các khách hàng tiềm năng tiêu chuẩn lớn cho các đại lý thoại theo thời gian thực và báo cáo tác động chuyển đổi bán hàng và tự động hóa hỗ trợ khách hàng lớn của Starlink. DeepSeek DeepSeek V4 (Pro và Flash) mã nguồn mở có tính năng mở rộng MoE và bối cảnh mã thông báo 1M thông qua các thay đổi chú ý kết hợp/nén, trong khi Tencent phát hành bản xem trước Hunyuan 3 với hiệu suất điểm chuẩn yếu hơn; điểm chuẩn đặc vụ có tầm nhìn dài mới (Clawmark) cho thấy tỷ lệ thành công của nhiệm vụ thấp. Các cập nhật chính sách, pháp lý và kinh doanh chính bao gồm khoản đầu tư lên tới 40 tỷ USD theo kế hoạch của Google và cam kết tính toán 5GW cho Anthropic, thỏa thuận AWS Gravitron của Meta và việc Trung Quốc ngăn chặn việc mua lại Manus của Meta, một thỏa thuận OpenAI–Microsoft được cải tiến, các hoạt động phát triển thử nghiệm Musk–OpenAI đang diễn ra và nghiên cứu an toàn/bảo mật mới về hành vi phá hoại, làm suy giảm tài liệu theo ủy quyền và các cuộc tấn công lật bit. Dấu thời gian: (00:00:10) Giới thiệu / Nói đùa (00:02:00) Xem trước tin tức (00:02:26) Phản hồi ý kiến thính giả Công cụ & Ứng dụng (00:02:55) OpenAI tiết lộ mẫu GPT-5.5 mới, mạnh mẽ hơn - The New York Times (00:20:33) xAI ra mắt grok-voice-think-fast-1.0: Đứng đầu τ-voice Bench ở mức 67,3%, vượt trội so với Gemini, GPT Realtime và hơn thế nữa - MarkTechPost (00:26:00) Giờ đây Claude có thể cắm trực tiếp vào Photoshop, Blender và Ableton | The Verge Dự án & Nguồn mở (00:26:38) DeepSeek của Trung Quốc phát hành bản xem trước của mẫu V4 được chờ đợi từ lâu khi cuộc đua AI ngày càng gay gắt (00:44:05) Tencent ra mắt bản xem trước Hy3; Mô hình nâng cao khả năng của tác nhân và khả năng sử dụng trong thế giới thực - Tencent 腾讯 (00:47:14) ClawMark: Điểm chuẩn trong thế giới sống dành cho các đại lý đồng nghiệp nhiều lượt, nhiều ngày, đa phương thức Ứng dụng & Kinh doanh (00:50:03) Google có kế hoạch đầu tư tới 40 tỷ USD vào Anthropic (00:53:26) Meta sẽ sử dụng hàng trăm nghìn chip AWS Graviton (00:56:51) Trung Quốc chặn thương vụ Meta tiếp quản công ty khởi nghiệp AI Manus trị giá 2 tỷ USD (00:58:45) OpenAI bắt tay hợp tác với Microsoft, giới hạn thanh toán chia sẻ doanh thu (01:04:13) Elon Musk làm chứng về rủi ro AI tại phiên tòa, cho biết OpenAI đã cố gắng 'đánh cắp' một tổ chức từ thiện - WSJ (01:08:50) Thẩm phán bác bỏ đề nghị của DOJ nhằm trì hoãn kháng cáo của Anthrop trong tranh chấp ở Lầu Năm Góc (01:11:42) Gemini của Google giờ đây có thể chạy trên một máy chủ không có khe hở duy nhất — và biến mất khi bạn rút phích cắm (01:16:07) David Silver của DeepMind vừa huy động được 1,1 tỷ USD để xây dựng một AI có thể học mà không cần dữ liệu của con người | TechCrunch Chính sách & An toàn (01:19:47) Đánh giá liệu các mô hình AI có phá hoại nghiên cứu an toàn AI hay không (01:26:59) LLM làm hỏng tài liệu của bạn khi bạn ủy quyền (01:29:50) Bộ mã hóa tự động thưa thớt theo thời gian: Tận dụng tính chất tuần tự của ngôn ngữ để có thể diễn giải (01:36:53) Bản ghi nhớ về quá trình chắt lọc đối thủ của các mô hình AI của Mỹ (01:38:41) Các chàng trai tuổi teen đang hẹn hò với chatbot AI của họ — và các chuyên gia cảnh báo điều đó có thể giết chết sự nghiệp của họ | Vận may (01:40:57) Công bố Khảo sát chỉ số kinh tế nhân loại (01:42:21) Scoop: CISA thiếu quyền truy cập vào Mythos của Anthropic Truyền thông & Nghệ thuật tổng hợp (01:45:03) Taylor Swift nộp đơn đăng ký nhãn hiệu Giọng nói và khả năng bảo vệ khỏi việc lạm dụng AI Nghiên cứu & Tiến bộ (01:46:15) Tổn thương não tối đa nếu không có dữ liệu hoặc tối ưu hóa: Phá vỡ mạng lưới thần kinh thông qua việc lật Sign-Bit