Tại sao chúng ta không đo lường tác động của AI đối với con…

Khi các hệ thống AI ngày càng trở nên mạnh mẽ, nhiều nguồn lực và nỗ lực đang được đầu tư vào việc đánh giá khả năng của chúng. Các nhà nghiên cứu xem xét các chỉ số đánh giá kỹ thuật, kiểm tra khả năng suy luận của AI, theo dõi thông lượng của chúng và nhiều khía cạnh khác. Tuy nhiên, có một chỉ số quan trọng thường bị bỏ qua, và có lẽ là quan trọng nhất: AI đang tác động đến con người như thế nào? Ông Imran Khan dẫn đầu công tác đánh giá tâm lý xã hội về AI tại Trung tâm Công nghệ Nhân văn (Center for Humane Technology), một tổ chức phi lợi nhuận. Trong một bài luận gần đây được công bố trên Substack của tổ chức, ông Khan chỉ ra rằng chúng ta đang triển khai các công cụ AI có khả năng định hình lại nhận thức, các mối quan hệ và hành vi của chúng ta, nhưng lại ít có nỗ lực có hệ thống để đo lường những tác động lâu dài mà chúng gây ra cho chúng ta. Nỗ lực xem xét kỹ hơn các tác động tâm lý xã hội của AI tương tự như các cuộc tranh luận nảy sinh xung quanh mạng xã hội và những tác hại của nó, nhưng ông Khan tin rằng AI có thể có những tác động rộng hơn và sâu sắc hơn. Việc tập trung vào đo lường hiệu suất và tiến bộ của AI đã bỏ qua câu hỏi liệu công nghệ này cuối cùng có giúp con người phát triển hay làm xói mòn một số năng lực cơ bản nhất của chúng ta. Tạp chí IEEE Spectrum đã phỏng vấn ông Khan về lý do tại sao việc đánh giá AI lại tập trung quá hẹp, việc đo lường có ý nghĩa về kết quả đối với con người có thể trông như thế nào, và liệu ngành công nghiệp AI có động cơ để đặt ra những câu hỏi này hay không. Câu hỏi còn thiếu về hiệu suất mô hình AI Trong bài luận của mình, ông lập luận rằng chúng ta đã rất giỏi trong việc đo lường những gì hệ thống AI có thể làm, nhưng lại kém trong việc đo lường những gì chúng tác động đến con người. Điều gì đã khiến ông nhận ra đây là câu hỏi còn thiếu? Khan: Nếu bạn dành thời gian trong và xung quanh không gian phát triển AI, bạn sẽ thấy sự tiến bộ đáng kinh ngạc về khả năng của các mô hình, với các biểu đồ về hiệu suất của các mô hình khác nhau trong các bài kiểm tra như SWE-bench hoặc kỳ thi cuối cùng của nhân loại hoặc LLM arena. Có một động lực cạnh tranh trong cách các công ty AI muốn tiến bộ và được biết đến với các mô hình tốt nhất của họ. Bạn thấy dữ liệu ấn tượng đó, nhưng sau đó bạn cũng thấy những điều đáng sợ và nguy hiểm xảy ra trong thế giới thực, như thanh thiếu niên tự tử và những người mắc chứng loạn thần do AI. Vì vậy, một mặt, chúng ta đang dành một lượng năng lượng đáng kinh ngạc để đo lường cách AI hoạt động trên những thứ đôi khi khá khó hiểu, ít liên quan đến cuộc sống hàng ngày của hầu hết mọi người. Và mặt khác, AI đang tác động đến hạnh phúc của con người, và chúng ta đang đo lường điều đó ít hơn nhiều. Có vẻ như một nghịch lý kỳ lạ là những điều chúng ta nên quan tâm nhất, chúng ta lại đo lường ít nhất. Bài luận của ông chỉ ra rằng với mạng xã hội, những tác hại đã ăn sâu vào thời điểm bằng chứng đủ mạnh để hành động. Ông có nghĩ rằng AI đã tạo ra những tác hại có thể đo lường được trên quy mô lớn, hay chúng ta vẫn đang trong giai đoạn cảnh báo sớm? Có thể có những khác biệt nào trong tốc độ phát triển tác hại từ AI? Khan: Có một số trường hợp rất nổi bật mà tôi nghĩ là phần nổi của tảng băng chìm – các vụ tự tử ở tuổi vị thành niên, loạn thần do AI, những người dành vô số thời gian hoặc tiền bạc để tương tác với các chatbot AI được thiết kế để cực kỳ nịnh hót. Tôi nghĩ những tác hại đó đã tồn tại. Tuy nhiên, có rất nhiều điều chúng ta có thể làm. Do áp lực của công chúng, OpenAI đã phải điều chỉnh một trong các mô hình ChatGPT của mình do những lo ngại của công chúng về sự nịnh hót. Đây là một ví dụ nổi bật về cách các phòng thí nghiệm sẽ chú ý và phản ứng với sự giám sát. Vì vậy, có tiềm năng để thay đổi hướng của công nghệ để làm cho nó vẫn hữu ích, nhưng ít gây hại hơn. Nếu chúng ta có thể đo lường một số tác hại đó, đó là một phần vũ khí chúng ta có để thông báo điều đó. Điều khó khăn hơn là câu hỏi về những tác hại ở cấp độ xã hội. Điều gì sẽ xảy ra với các mối quan hệ lãng mạn, với gia đình, với bản sắc của thanh thiếu niên do mọi người sử dụng AI hàng ngày trong nhiều tháng và nhiều năm? Tôi lo lắng rằng nếu chúng ta không bắt đầu đo lường những loại hiện tượng đó sớm, thì sẽ quá muộn để tạo ra sự khác biệt. Các công ty AI có thể sẽ lập luận rằng người dùng của họ coi trọng sự tiện lợi và năng suất hơn tất cả. Ông sẽ nói gì về tuyên bố này? Khan: Nếu bạn đặt một chiếc bánh rán trước mặt tôi ngay bây giờ, tôi có lẽ sẽ không có đủ ý chí để không ăn nó. Tuy nhiên, tôi cũng muốn kiểm soát lượng đường nạp vào và ăn uống lành mạnh. Nhưng thiết kế công nghệ thường được tóm gọn thành “chà, chúng tôi chỉ cố gắng cung cấp cho người dùng những gì họ muốn, và những gì người dùng muốn được định nghĩa bởi lựa chọn họ đưa ra trong một khoảnh khắc cá nhân.” Đây là sự phức tạp của việc trở thành một con người và một người tiêu dùng: Chúng ta muốn những điều mâu thuẫn. Chúng ta cần hiểu không chỉ lựa chọn mà người dùng có thể đưa ra khi họ bận rộn hoặc trong một khoảnh khắc căng thẳng cao độ, mà còn cả những gì họ muốn một mối quan hệ lành mạnh với công nghệ này trông như thế nào. Hiện tại, chúng ta thường muốn ít ma sát. Nhưng tôi không nghĩ bất kỳ ai trong chúng ta tin rằng một cuộc sống ít ma sát là viên mãn nhất hoặc mang lại cho chúng ta nhiều bài học và quyền tự chủ nhất. Vì vậy, tôi nghĩ đó là việc đặt một câu hỏi khác một cách tinh tế. đó không phải là điều mọi người lựa chọn tại thời điểm hiện tại, mà là điều chúng ta mong muốn cho bản thân về lâu dài. Có những lĩnh vực cụ thể nào—giáo dục, trị liệu, đồng hành, trợ lý ảo tại nơi làm việc—mà bạn cho rằng việc đo lường tâm lý xã hội đặc biệt quan trọng? Một số lĩnh vực nổi bật nhất đối với tôi là những lĩnh vực liên quan đến tình bạn và hỗ trợ cảm xúc. Nhóm người tiêu dùng mục tiêu có khả năng cao nhất cho những mục đích sử dụng này cũng có thể là nhóm dễ bị tổn thương nhất trước những tác động tiềm tàng. Khi mọi người cô đơn và khao khát sự hỗ trợ cảm xúc mà một chatbot mang lại, điều họ thực sự cần là một người khác, một người thực sự quan tâm đến họ. Một AI không thể quan tâm đến bạn vì nó không có cảm xúc hay sự đồng cảm. Nó có thể đang kéo mọi người ra khỏi việc thực hiện điều khó khăn là cố gắng nuôi dưỡng và tham gia vào các mối quan hệ của con người. Việc trẻ em và thanh thiếu niên sử dụng cũng là một vấn đề khác vì đây là thời điểm hình thành và có tính dẻo thần kinh cao trong cuộc đời con người. Chúng ta không biết những tác động lâu dài lên bộ não đang phát triển nếu bạn giảm bớt ma sát cho các nhiệm vụ nhận thức hoặc sự gắn kết cảm xúc. Bạn bè của tôi là giáo viên hoặc phụ huynh đều có tất cả những câu hỏi này.

Tại sao chúng ta không đo lường tác động của AI đối với con người?