Một cái nhìn chính thức về ngữ pháp phụ thuộc và ngữ pháp cấu…

Dưới đây là bản dịch của văn bản đã cung cấp: Các nhà nghiên cứu tại Đại học Carnegie Mellon đã phát triển một phương pháp mới để tạo ra các mô hình ngôn ngữ lớn (LLM) có khả năng giải thích các quyết định của chúng. Phương pháp này, được gọi là "tự phản ánh", cho phép LLM tự động cải thiện khả năng giải thích bằng cách xem xét các giải thích trước đó và xác định những điểm cần cải thiện. Các LLM truyền thống thường được coi là "hộp đen" vì khó hiểu cách chúng đưa ra quyết định. Điều này gây ra những lo ngại về độ tin cậy và tính minh bạch, đặc biệt trong các ứng dụng quan trọng như y tế và tài chính. Khả năng giải thích của LLM là rất quan trọng để xây dựng niềm tin và đảm bảo trách nhiệm giải trình. Phương pháp tự phản ánh hoạt động bằng cách cung cấp cho LLM một tập hợp các ví dụ về nhiệm vụ và giải thích. Sau đó, LLM được hướng dẫn để tạo ra các giải thích cho các nhiệm vụ mới. Một mô-đun phản hồi sẽ đánh giá chất lượng của các giải thích này và cung cấp phản hồi cho LLM. LLM sau đó sử dụng phản hồi này để điều chỉnh các giải thích trong tương lai. Các nhà nghiên cứu đã thử nghiệm phương pháp tự phản ánh trên nhiều nhiệm vụ khác nhau, bao gồm phân loại văn bản và trả lời câu hỏi. Họ phát hiện ra rằng các LLM được đào tạo bằng phương pháp này đã tạo ra các giải thích rõ ràng, chính xác và hữu ích hơn đáng kể so với các LLM truyền thống. Một trong những lợi ích chính của phương pháp tự phản ánh là nó không yêu cầu bất kỳ dữ liệu được gắn nhãn bổ sung nào. Điều này có nghĩa là nó có thể được áp dụng cho bất kỳ LLM hiện có nào mà không cần đào tạo lại tốn kém. Các nhà nghiên cứu tin rằng phương pháp tự phản ánh có tiềm năng cách mạng hóa cách chúng ta tương tác với LLM. Bằng cách làm cho LLM có khả năng giải thích các quyết định của chúng, chúng ta có thể xây dựng các hệ thống AI đáng tin cậy, minh bạch và có trách nhiệm hơn. Nghiên cứu này là một bước quan trọng hướng tới việc phát triển các hệ thống AI có thể giải thích các quyết định của chúng. Khi các LLM ngày càng trở nên mạnh mẽ và phổ biến, khả năng giải thích của chúng sẽ trở nên quan trọng hơn bao giờ hết. Phương pháp tự phản ánh cung cấp một lộ trình đầy hứa hẹn để đạt được mục tiêu này.

Paperium Đăng ngày 30/5 • Ban đầu được xuất bản tại paperium.net Một cái nhìn chính thức về ngữ pháp phụ thuộc và ngữ pháp cấu trúc ngữ đoạn, với sự xem xét đặc biệt về các hiện tượng trật tự từ #ai #deeplearning #computerscience #machinelearning AI (Loạt bài gồm 3327 phần) 1 Học tập của tác nhân thông qua kinh nghiệm ban đầu 2 MM-HELIX: Tăng cường suy luận phản tư chuỗi dài đa phương thức với nền tảng toàn diện và tối ưu hóa chính sách lai thích ứng ... 3323 phần nữa... 3 MemMamba: Suy nghĩ lại các mẫu bộ nhớ trong mô hình không gian trạng thái 4 UniVideo: Hiểu, tạo và chỉnh sửa video thống nhất 5 VideoCanvas: Hoàn thành video thống nhất từ các bản vá không gian-thời gian tùy ý thông qua điều kiện theo ngữ cảnh 6 DreamOmni2: Chỉnh sửa và tạo đa phương thức dựa trên hướng dẫn 7 Từ cái gì đến tại sao: Một hệ thống đa tác nhân để suy luận điều kiện phản ứng hóa học dựa trên bằng chứng 8 Nhận thức siêu nhận thức tăng cường các mô hình suy luận: Học tăng cường tự căn chỉnh 9 Khi suy nghĩ gặp sự thật: Suy luận có thể tái sử dụng cho các mô hình ngôn ngữ lớn (LLM) ngữ cảnh dài 10 Các token có xác suất thấp duy trì khám phá trong học tăng cường với phần thưởng có thể kiểm chứng 11 Điệu nhảy căn chỉnh: Đào tạo đồng thời các tác nhân để hợp tác vì sự an toàn 12 Tối ưu hóa chính sách tương đối nhóm không cần đào tạo 13 Tăng cường lai: Khi phần thưởng thưa thớt, tốt hơn là nên dày đặc 14 NewtonBench: Đánh giá khám phá luật khoa học tổng quát trong các tác nhân LLM 15 ARTDECO: Hướng tới tái tạo 3D hiệu quả và độ trung thực cao tức thì với biểu diễn cảnh có cấu trúc 16 DeepPrune: Mở rộng song song không có sự dư thừa giữa các dấu vết 17 Lần thử đầu tiên quan trọng: Xem xét lại vai trò của phản tư trong các mô hình suy luận 18 LLM học cách lừa dối một cách vô ý: Sự sai lệch xuất hiện trong sự không trung thực từ các mẫu sai lệch đến tương tác người-AI thiên vị 19 UniMMVSR: Một khung đa phương thức thống nhất cho siêu phân giải video xếp tầng 20 NaViL: Suy nghĩ lại các thuộc tính mở rộng của các mô hình ngôn ngữ lớn đa phương thức gốc dưới các ràng buộc dữ liệu 21 CoMAS: Các hệ thống đa tác nhân đồng tiến hóa thông qua phần thưởng tương tác 22 PickStyle: Chuyển đổi kiểu video-sang-video với bộ điều hợp ngữ cảnh-kiểu 23 UNIDOC-BENCH: Một điểm chuẩn thống nhất cho RAG đa phương thức tập trung vào tài liệu 24 InstructX: Hướng tới chỉnh sửa hình ảnh thống nhất với hướng dẫn MLLM 25 LongRM: Tiết lộ và mở khóa ranh giới ngữ cảnh của mô hình hóa phần thưởng 26 Học trong công việc: Một tác nhân tự tiến hóa dựa trên kinh nghiệm cho các nhiệm vụ dài hạn 27 Tăng cường các mô hình khuếch tán bằng cách tối ưu hóa ưu tiên nhóm trực tiếp 28 Kiểm soát tạo video chuyển văn bản thành âm thanh thông qua điều kiện và tương tác phương thức nâng cao 29 Kích hoạt điều hòa entropy: Tăng cường kiểm soát liên tục, các mô hình ngôn ngữ lớn và phân loại hình ảnh với kích hoạt như 30 Truy xuất và củng cố bộ nhớ trong các mô hình ngôn ngữ lớn thông qua các token chức năng 31 Tái chế các điểm kiểm tra được đào tạo trước: Tăng trưởng trực giao của hỗn hợp chuyên gia để đào tạo trước mô hình ngôn ngữ lớn hiệu quả 32 GCPO: Khi độ tương phản thất bại, hãy chọn vàng 33 UP2You: Tái tạo nhanh chóng bản thân từ các bộ sưu tập ảnh không giới hạn 34 OmniRetarget: Tạo dữ liệu bảo toàn tương tác cho thao tác toàn thân hình người và tương tác cảnh 35. DexNDM: Thu hẹp khoảng cách thực tế cho thao tác xoay khéo léo trong tay thông qua mô hình động lực học thần kinh khớp. 36. A^2Search: Trả lời câu hỏi nhận biết sự mơ hồ với học tăng cường. 37. Học cách định tuyến LLM từ phản hồi Bandit: Một chính sách, nhiều sự đánh đổi. 38. Search-R3: Thống nhất suy luận và tạo nhúng trong các mô hình ngôn ngữ lớn. 39. R2RGEN: Tạo dữ liệu 3D từ thực tế đến thực tế để thao tác tổng quát hóa không gian. 40. Drive&Gen: Đồng đánh giá các mô hình lái xe đầu cuối và tạo video. 41. Vượt ra ngoài các giá trị ngoại lai: Một nghiên cứu về các bộ tối ưu hóa dưới lượng tử hóa. 42. SViM3D: Khuếch tán vật liệu video ổn định để tạo 3D từ một hình ảnh. 43. GyroSwin: Các mô hình thay thế 5D cho mô phỏng nhiễu loạn plasma Gyrokinetic. 44. Hướng tới chỉnh sửa 3D có thể mở rộng và nhất quán. 45. Sử dụng mạng trực tuyến nếu có thể: Hướng tới học tăng cường nhanh và ổn định. 46. Thành phần dữ liệu nhận biết độ trung thực để tổng quát hóa robot mạnh mẽ. 47. SciVideoBench: Đánh giá suy luận video khoa học trong các mô hình đa phương thức lớn. 48. Khuếch tán quy mô lớn thông qua tính nhất quán thời gian liên tục được điều hòa điểm số. 49. Vượt qua giới hạn lượt: Huấn luyện các tác nhân tìm kiếm sâu với cửa sổ ngữ cảnh động. 50. OpenRubrics: Hướng tới tạo Rubric tổng hợp có thể mở rộng để mô hình hóa phần thưởng và căn chỉnh LLM. 51. Tư duy bằng máy ảnh: Một mô hình đa phương thức thống nhất để hiểu và tạo lấy máy ảnh làm trung tâm. 52. D2E: Mở rộng đào tạo trước thị giác-hành động trên dữ liệu máy tính để chuyển sang AI thể hiện. 53. TAG: Hướng dẫn khuếch đại tiếp tuyến để lấy mẫu khuếch tán chống ảo giác. 54. Tối ưu hóa lời nhắc đa phương thức: Tại sao không tận dụng nhiều phương thức cho MLLM. 55. AutoPR: Hãy tự động hóa việc thăng tiến học thuật của bạn! 56. R-Horizon: Mô hình suy luận lớn của bạn thực sự có thể đi xa đến đâu về chiều rộng và chiều sâu? 57. Webscale-RL: Đường ống dữ liệu tự động để mở rộng dữ liệu RL đến mức đào tạo trước. 58. SpaceVista: Suy luận không gian trực quan mọi quy mô từ mm đến km. 59. StreamingVLM: Hiểu biết thời gian thực cho các luồng video vô hạn. 60. Đừng lãng phí sai lầm: Tận dụng các nhóm RL tiêu cực thông qua việc điều chỉnh trọng số độ tin cậy. 61. ARES: Suy luận thích ứng đa phương thức thông qua định hình Entropy cấp mã thông báo nhận biết độ khó. 62. KORMo: Mô hình suy luận mở tiếng Hàn cho mọi người. 63. DISCO: Đa dạng hóa sự cô đặc mẫu để đánh giá mô hình hiệu quả. 64. Cầu nối suy luận với học tập: Làm sáng tỏ ảo ảnh bằng cách sử dụng độ phức tạp ngoài tổng quát hóa phân phối. 65. Tiến độ.

Một cái nhìn chính thức về ngữ pháp phụ thuộc và ngữ pháp cấu trúc ngữ đoạn, với sự xem xét đặc biệt các hiện tượng trật tự từ.