Các nhà nghiên cứu tại Đại học Carnegie Mellon đã phát triển một phương pháp mới để tạo ra các hình ảnh 3D chất lượng cao từ một bức ảnh 2D duy nhất. Phương pháp này, được gọi là "3D-aware Diffusion Model" (Mô hình khuếch tán nhận biết 3D), sử dụng một mạng lưới thần kinh để học cách tạo ra các hình ảnh 3D nhất quán từ nhiều góc độ khác nhau.
Mô hình khuếch tán nhận biết 3D được đào tạo trên một tập dữ liệu lớn gồm các hình ảnh 2D và các mô hình 3D tương ứng của chúng. Trong quá trình đào tạo, mô hình học cách ánh xạ các đặc điểm của hình ảnh 2D sang biểu diễn 3D, sau đó có thể được sử dụng để tạo ra các hình ảnh 2D mới từ các góc độ khác nhau.
Một trong những thách thức chính trong việc tạo ra các hình ảnh 3D từ một bức ảnh 2D duy nhất là thiếu thông tin về độ sâu. Mô hình khuếch tán nhận biết 3D giải quyết vấn đề này bằng cách sử dụng một kỹ thuật gọi là "khuếch tán có điều kiện". Kỹ thuật này cho phép mô hình tạo ra các hình ảnh 3D nhất quán bằng cách điều kiện hóa quá trình khuếch tán trên hình ảnh 2D đầu vào.
Mô hình khuếch tán nhận biết 3D có thể được sử dụng cho nhiều ứng dụng, bao gồm tạo nội dung 3D cho trò chơi điện tử và thực tế ảo, tạo mô hình 3D của các đối tượng trong thế giới thực và tạo hình ảnh 3D của các đối tượng không tồn tại.
Các nhà nghiên cứu đã phát hành mã nguồn và dữ liệu đào tạo cho mô hình khuếch tán nhận biết 3D trên GitHub. Điều này sẽ cho phép các nhà nghiên cứu và nhà phát triển khác sử dụng và xây dựng dựa trên công việc của họ.
Mô hình khuếch tán nhận biết 3D là một bước tiến đáng kể trong lĩnh vực tạo hình ảnh 3D. Nó có tiềm năng cách mạng hóa cách chúng ta tạo và tương tác với nội dung 3D.
AICloseAI
Các bài viết từ chủ đề này sẽ được thêm vào bản tin email hàng ngày và nguồn cấp dữ liệu trang chủ của quý vị.
Theo dõiTheo dõiXem tất cả AI
ReportCloseReport
Các bài viết từ chủ đề này sẽ được thêm vào bản tin email hàng ngày và nguồn cấp dữ liệu trang chủ của quý vị.
Theo dõiTheo dõiXem tất cả Report
TechCloseTech
Các bài viết từ chủ đề này sẽ được thêm vào bản tin email hàng ngày và nguồn cấp dữ liệu trang chủ của quý vị.
Theo dõiTheo dõiXem tất cả Tech
Các công ty công nghệ đang rất muốn quay phim quý vị làm việc nhà
Các công ty khởi nghiệp đang trả tiền cho người dân để thu thập dữ liệu thực tế cần thiết nhằm huấn luyện robot của họ.
Các công ty khởi nghiệp đang trả tiền cho người dân để thu thập dữ liệu thực tế cần thiết nhằm huấn luyện robot của họ.
bởi Robert HartClose
Robert Hart
Phóng viên AI
Các bài viết từ tác giả này sẽ được thêm vào bản tin email hàng ngày và nguồn cấp dữ liệu trang chủ của quý vị.
Theo dõiTheo dõiXem tất cả bởi Robert Hart
Ngày 29/5/2026, 17:37 UTC
Liên kết
Chia sẻ
Tặng
Ảnh: The Verge
Robert HartClose
Robert Hart
Các bài viết từ tác giả này sẽ được thêm vào bản tin email hàng ngày và nguồn cấp dữ liệu trang chủ của quý vị.
Theo dõiTheo dõiXem tất cả bởi Robert Hart
là một phóng viên tại The Verge có trụ sở tại London, chuyên đưa tin về mọi thứ liên quan đến AI và là một Nghiên cứu viên cấp cao của Tarbell. Trước đây, ông đã viết về sức khỏe, khoa học và công nghệ cho Forbes.
Tuần này, một công ty khởi nghiệp huấn luyện AI có tên Shift cho biết họ sẽ dọn dẹp nhà cửa miễn phí cho người dân New York. Công ty này cũng có kế hoạch mở rộng sang các thành phố khác, bao gồm London, và nhìn quanh căn hộ của mình, tôi hiểu được sức hấp dẫn đó.
Tuy nhiên, có một điều kiện. Luôn luôn có một điều kiện.
Để đổi lấy việc dọn dẹp, Shift muốn có cảnh quay về những người dọn dẹp của họ đang làm việc: cọ rửa bát đĩa, lau dọn mặt bàn, phủi bụi bàn ghế, lau sàn nhà. Họ muốn tất cả mọi thứ. Video về tất cả những công việc nhàm chán mà chúng ta sẵn lòng thuê ngoài nếu có thể — và các công ty robot đang chạy đua để dạy máy móc làm những việc đó để họ có thể bán cho chúng ta một thứ gì đó để làm thay chúng ta.
Điều đó khó hơn nhiều so với âm thanh. Không giống như các chatbot, trình tạo hình ảnh và các công cụ AI khác đã bùng nổ trong những năm gần đây, robot phải đối phó với thế giới vật lý. Điều đó có nghĩa là phải hiểu không gian, chuyển động, lực, ma sát, hình dạng và vật liệu kỳ lạ, ánh sáng khó chịu và mọi thứ khác mà con người — và các sinh vật hữu cơ khác — có xu hướng nắm bắt một cách bản năng. Đó là lý do tại sao những việc thường dễ dàng đối với chúng ta, như gấp quần áo, nhặt một quả táo hoặc rót một ly nước, lại khiến các nhà nghiên cứu robot khó mã hóa đến vậy.
Dạy máy móc làm những việc đó cần dữ liệu. Rất nhiều dữ liệu. Văn bản, hình ảnh và video có thể dễ dàng được thu thập từ internet ở quy mô công nghiệp. Và chúng đã được thu thập, thường là không bồi thường cho những người đã tạo ra chúng. Thế giới vật lý khó thu thập hơn, và càng khó thu thập một cách lặng lẽ mà không phải trả tiền. Điều này có nghĩa là việc tiếp cận dữ liệu chất lượng cao là một nút thắt lớn đối với các công ty đang phát triển AI vật lý. Đây là một cơ hội sinh lợi, vì vậy các công ty như Shift đang trở nên sáng tạo.
Họ không đơn độc. Tại Ấn Độ, một báo cáo gần đây tiết lộ rằng nền tảng dịch vụ gia đình Pronto đã sử dụng nhà của khách hàng làm nguồn dữ liệu huấn luyện AI cho các công việc như nấu ăn, dọn dẹp và giặt giũ. Pronto cho biết họ chỉ ghi hình nếu khách hàng đồng ý rõ ràng — không rõ khách hàng nhận được gì đổi lại, ngoài một bản sao của cảnh quay — nhưng thực tế này vẫn gây ra một làn sóng phản ứng dữ dội trên thị trường, với các công ty khởi nghiệp đối thủ khẳng định họ chưa bao giờ ghi hình bên trong nhà để huấn luyện AI và không có kế hoạch làm như vậy.
Các công ty khởi nghiệp khác đang tập trung vào việc mở rộng quy mô thu thập dữ liệu. Chẳng hạn, Human Archive, một công ty có trụ sở tại Thung lũng Silicon, hy vọng hợp tác với các công ty như Pronto và để những người làm việc tự do ghi lại hoạt động của họ bằng những chiếc mũ camera không mấy thời trang. Những chiếc mũ này thu thập cảnh quay từ góc nhìn của người đeo, chính xác là loại dữ liệu "ích kỷ" hoặc góc nhìn thứ nhất mà các công ty robot cần để dạy máy móc cách con người di chuyển trong không gian vật lý. Trong khi đó, Shift cũng trực tiếp khai thác người tiêu dùng và tuyên bố đã trả tiền cho hàng chục nghìn người ở 15 quốc gia để ghi lại hoạt động của họ thông qua ứng dụng của mình.
Một số công ty hoàn toàn bỏ qua công việc hữu ích. Thay vào đó, người lao động được trả tiền để thực hiện chính xác các nhiệm vụ vật lý lặp đi lặp lại trong khi camera và cảm biến có thể ghi lại mọi chuyển động. Các trang trại dữ liệu được dàn dựng như vậy được thiết kế để biến hoạt động thể chất lặp đi lặp lại – gấp khăn, nhặt cốc, mang hộp – thành tài liệu đào tạo AI đủ giá trị để biện minh cho việc trả tiền cho người tạo ra nó.
Và một số dữ liệu được tạo ra bởi các robot đã có mặt trên thế giới. Mặc dù được cường điệu hóa, quá trình tự động hóa thực sự vẫn còn một chặng đường dài – do đó cần tất cả dữ liệu này – nhưng các công ty vẫn muốn xuất xưởng sản phẩm. Họ sẽ sử dụng dữ liệu từ nhà của khách hàng để cải thiện sản phẩm. Nhiều công ty dựa vào nhân viên từ xa để can thiệp khi robot không thể tránh khỏi bị kẹt. Họ cũng sẽ sử dụng dữ liệu đó.
Tất nhiên, hành động trao đổi dữ liệu để đổi lấy một thứ có giá trị không phải là mới. Các công ty đã cung cấp giảm giá, tiện lợi và dịch vụ miễn phí để đổi lấy quyền truy cập vào dữ liệu của bạn trong nhiều năm, từ thẻ khách hàng thân thiết và cookie đến camera hành trình, ứng dụng bảo hiểm giám sát cách mọi người lái xe và chiếc TV thông minh đáng ghét luôn hiển thị quảng cáo.
Điều mới là loại dữ liệu mà các công ty sẵn sàng trả tiền. Hiện tại, điều đó có nghĩa là có thể để một người dọn dẹp nhà của bạn miễn phí trong một chiếc mũ sành điệu để cuối cùng, một công ty có thể bán cho bạn một con robot để làm điều đó thay thế.
Theo dõi các chủ đề và tác giả từ câu chuyện này để xem thêm những nội dung tương tự trong nguồn cấp dữ liệu trang chủ được cá nhân hóa của bạn và để nhận thông tin cập nhật qua email. Robert Hart Đóng
Robert Hart
Phóng viên AI
Các bài đăng từ tác giả này sẽ được thêm vào bản tóm tắt email hàng ngày và nguồn cấp dữ liệu trang chủ của bạn.
Theo dõi Theo dõi Xem tất cả của Robert Hart
AI Đóng AI
Các bài đăng từ chủ đề này sẽ được thêm vào bản tóm tắt email hàng ngày và nguồn cấp dữ liệu trang chủ của bạn.
Theo dõi Theo dõi Xem tất cả AI
Báo cáo Đóng Báo cáo
Các bài đăng từ chủ đề này sẽ được thêm vào bản tóm tắt email hàng ngày và nguồn cấp dữ liệu trang chủ của bạn.
Theo dõi Theo dõi Xem tất cả Báo cáo
Robot Đóng Robot
Các bài đăng từ chủ đề này sẽ được thêm vào bản tóm tắt email hàng ngày và nguồn cấp dữ liệu trang chủ của bạn.
Theo dõi Theo dõi Xem tất cả Robot
Công nghệ Đóng Công nghệ
Các bài đăng từ chủ đề này sẽ được thêm vào bản tóm tắt email hàng ngày và nguồn cấp dữ liệu trang chủ của bạn.
Theo dõi
Nguồn tin: The Verge AI — Tác giả: Robert Hart. Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.