Nút thắt cổ chai tiềm ẩn trong Học máy lượng tử: Đưa dữ liệu…

Học máy lượng tử (QML) hứa hẹn khả năng tiếp cận các không gian biểu diễn lớn theo cấp số nhân. Tuy nhiên, trước khi bất kỳ phép tính nào có thể diễn ra, dữ liệu cổ điển phải được nhúng vào các hệ thống lượng tử. Bài viết này khám phá một trong những nút thắt cổ chai thường bị bỏ qua nhất trong QML: đưa dữ liệu vào máy tính lượng tử một cách hiệu quả. Bài viết Nút thắt cổ chai tiềm ẩn trong Học máy lượng tử: Đưa dữ liệu vào máy tính lượng tử xuất hiện đầu tiên trên Towards Data Science.

Điện toán lượng tử Nút thắt tiềm ẩn trong Học máy lượng tử: Đưa dữ liệu vào máy tính lượng tử Khám phá một trong những nút thắt bị bỏ qua nhiều nhất trong QML: đưa dữ liệu vào máy tính lượng tử một cách hiệu quả. Davinder Singh Ngày 22/5/2026 9 phút đọc Chia sẻ Các luồng dữ liệu cổ điển hội tụ vào một bộ xử lý lượng tử, minh họa nút thắt tải dữ liệu lượng tử. Hình minh họa do tác giả tạo bằng Gemini. Trong bài viết này: Mạng nơ-ron cổ điển đọc dữ liệu như thế nào Máy tính lượng tử không thể đọc bit Nhúng dữ liệu cổ điển vào trạng thái lượng tử Nút thắt tải dữ liệu trong Học máy lượng tử Kết luận Trí tuệ nhân tạo (AI) và Học máy (ML) hiện đại phụ thuộc rất nhiều vào việc xử lý khối lượng lớn dữ liệu và học các mẫu từ chúng. Nhìn chung, khả năng khái quát hóa của một mô hình được cải thiện khi lượng dữ liệu có sẵn tăng lên. Tuy nhiên, khi chúng ta chuyển từ học máy cổ điển sang Học máy lượng tử (QML), một trong những thách thức lớn đầu tiên mà chúng ta gặp phải là máy tính lượng tử không thể đọc trực tiếp các bit cổ điển. Trước khi bất kỳ phép tính nào có thể xảy ra, dữ liệu phải được nhúng vào các trạng thái lượng tử (qubit). Điều này thoạt nghe có vẻ đơn giản, nhưng trên thực tế lại khó một cách đáng ngạc nhiên. Khi kích thước và độ phức tạp của dữ liệu tăng lên, chi phí chuẩn bị các trạng thái lượng tử này có thể tăng theo cấp số nhân. Trên thực tế, hiện tại chưa có phương pháp hiệu quả phổ quát nào được biết đến để tải dữ liệu cổ điển tùy ý vào hệ thống lượng tử. Trong bài viết này, chúng ta sẽ khám phá lý do tồn tại vấn đề này, xem xét một số kỹ thuật nhúng dữ liệu lượng tử phổ biến và cuối cùng thảo luận về một vài cách tiếp cận hiện đại mà các nhà nghiên cứu đang tìm hiểu để khắc phục những hạn chế này. Mạng nơ-ron cổ điển đọc dữ liệu như thế nào Mạng nơ-ron (NN) là một trong những khối xây dựng nền tảng của Học máy hiện đại. Phần lớn thành công của chúng đến từ khả năng ngày càng tăng của chúng ta trong việc thu thập, lưu trữ và xử lý lượng lớn dữ liệu. Về cốt lõi, mạng nơ-ron là các hệ thống toán học được thiết kế để học các mẫu từ dữ liệu. Trong quá trình huấn luyện, chúng dần dần điều chỉnh các tham số nội bộ để nắm bắt các mối quan hệ đã tạo ra dữ liệu ngay từ đầu. Điều này cho phép chúng thực hiện các tác vụ như dự đoán, tạo và phân loại. Ví dụ: dự đoán giá cổ phiếu trong tương lai từ các xu hướng lịch sử, tạo văn bản giống con người, nhận dạng đối tượng trong hình ảnh, hoặc phân biệt giữa các loại dữ liệu khác nhau. Một trong những điểm mạnh lớn nhất của mạng nơ-ron cổ điển là tính linh hoạt của chúng. Chúng có thể xử lý nhiều loại dữ liệu khác nhau và học các mối quan hệ tồn tại trong chúng: Dữ liệu tuần tự → ngôn ngữ, chuỗi thời gian tài chính, tín hiệu âm thanh Dữ liệu không gian → hình ảnh, video, bản đồ địa lý Dữ liệu xác suất hoặc nhiễu → các phép đo cảm biến, phân rã phóng xạ, quan sát thực nghiệm Mặc dù có thể xử lý nhiều loại dữ liệu khác nhau, mạng nơ-ron không trực tiếp "nhìn thấy" hình ảnh, âm thanh hoặc văn bản theo cách con người làm. Về cơ bản, mọi thứ cuối cùng được chuyển đổi thành các vectơ hoặc tensor số trước khi được mạng xử lý. Ví dụ: Một hình ảnh có thể được biểu diễn dưới dạng một lưới các giá trị cường độ pixel Một câu có thể được chuyển đổi thành các nhúng token Một tín hiệu âm thanh có thể được biểu diễn dưới dạng một chuỗi các biên độ được lấy mẫu theo thời gian Đối với một mạng nơ-ron, tất cả những điều này chỉ đơn giản là các biểu diễn số có cấu trúc. Các phương thức dữ liệu khác nhau được biểu diễn dưới dạng vectơ. Minh họa do tác giả tạo bằng Gemini. Máy tính lượng tử không thể đọc bit Máy tính lượng tử là một phương pháp xử lý thông tin khác biệt cơ bản. Thay vì hoạt động trên các bit cổ điển, chúng sử dụng các bit lượng tử, hay qubit, tuân theo các nguyên tắc của cơ học lượng tử như chồng chập và vướng víu. Một bit cổ điển là một giá trị nhị phân, hoặc là 0 hoặc là 1. Tuy nhiên, một qubit có thể tồn tại trong trạng thái chồng chập của cả hai trạng thái cùng một lúc. Một trạng thái qubit tổng quát thường được viết là: |ψ⟩ = α |0⟩ + β |1⟩ trong đó α và β là các biên độ xác suất phức thỏa mãn ràng buộc: |α|² + |β|² = 1. Nếu một số khái niệm này cảm thấy xa lạ, bạn có thể tham khảo các bài viết về điện toán lượng tử dành cho người mới bắt đầu của tôi tại đây. Tuy nhiên, đối với bài viết này, ý tưởng quan trọng chỉ đơn giản là máy tính lượng tử lưu trữ thông tin rất khác so với máy tính cổ điển. Vì chúng ta sống trong một thế giới cổ điển, hầu hết dữ liệu của chúng ta tự nhiên tồn tại dưới dạng bit được lưu trữ trong bộ nhớ cổ điển. Một bộ xử lý lượng tử không thể trực tiếp đọc một hình ảnh, một câu văn, hoặc một dạng sóng âm thanh theo cách mà một mạng thần kinh chạy trên GPU có thể làm. Trước khi bất kỳ phép tính lượng tử nào có thể xảy ra, thông tin cổ điển này phải được mã hóa thành các qubit – một nhiệm vụ hóa ra khó hơn nhiều so với tưởng tượng. Nhúng dữ liệu cổ điển vào trạng thái lượng tử Thông tin cổ điển phải được chuyển đổi thành các trạng thái lượng tử. Quá trình này được gọi là nhúng dữ liệu lượng tử hoặc chuẩn bị trạng thái lượng tử. Các cách khả thi để thực hiện điều này là biên độ, pha hoặc các phép quay của qubit. Trong nhiều năm, các nhà nghiên cứu đã đề xuất nhiều cách tiếp cận để nhúng dữ liệu cổ điển vào các hệ thống lượng tử. Hai kỹ thuật được sử dụng phổ biến nhất là: Mã hóa dựa trên góc Mã hóa biên độ Mỗi cách tiếp cận đều có những ưu điểm, hạn chế và chi phí tính toán riêng. Mã hóa dựa trên góc Một trong những cách tiếp cận đơn giản và được sử dụng rộng rãi nhất để nhúng dữ liệu lượng tử là mã hóa góc (còn được gọi là nhúng dựa trên phép quay). Trong phương pháp này, các đặc trưng cổ điển được mã hóa dưới dạng các góc quay được áp dụng cho các qubit bằng cách sử dụng các cổng lượng tử như R-X, R-Y và R-Z, các cổng này lần lượt quay một qubit dọc theo các trục X, Y và Z. Ví dụ, một vectơ cổ điển: X = [x₁, x₂, x₃] có thể được nhúng vào một mạch lượng tử bằng cách quay các qubit khác nhau theo giá trị của từng đặc trưng. Hãy xem xét một triển khai đơn giản của mã hóa dựa trên phép quay trong PennyLane: import pennylane as qml import numpy as np # Classical input vector x = np.array([0.2, 0.7, 1.1]) n