NVIDIA đã công bố một loạt các bản cập nhật cho nền tảng phần mềm NVIDIA AI Enterprise của mình, bao gồm các tính năng mới cho NVIDIA NIM inference microservices, NVIDIA CUDA-X microservices và NVIDIA AI Workbench.
NVIDIA AI Enterprise là một bộ phần mềm được thiết kế để tăng tốc quá trình phát triển và triển khai AI. Nó cung cấp một bộ công cụ và thư viện toàn diện, bao gồm các khung AI phổ biến, trình tối ưu hóa hiệu suất và các công cụ quản lý.
Các bản cập nhật mới nhất cho NVIDIA AI Enterprise tập trung vào việc cải thiện hiệu suất, khả năng mở rộng và tính dễ sử dụng của nền tảng.
**NVIDIA NIM Inference Microservices**
NVIDIA NIM inference microservices là một bộ microservices được đóng gói sẵn, được thiết kế để đơn giản hóa việc triển khai các mô hình AI trong sản xuất. Các microservices này được tối ưu hóa cho hiệu suất và khả năng mở rộng, đồng thời hỗ trợ nhiều loại mô hình AI, bao gồm các mô hình ngôn ngữ lớn (LLM), mô hình thị giác máy tính và mô hình đề xuất.
Các bản cập nhật mới nhất cho NVIDIA NIM inference microservices bao gồm:
* **Hỗ trợ cho nhiều loại mô hình AI hơn:** NVIDIA NIM inference microservices hiện hỗ trợ nhiều loại mô hình AI hơn, bao gồm các mô hình từ các nhà cung cấp như Google, Meta và Microsoft.
* **Cải thiện hiệu suất:** Các microservices đã được tối ưu hóa để cải thiện hiệu suất, cho phép triển khai các mô hình AI nhanh hơn và hiệu quả hơn.
* **Khả năng mở rộng nâng cao:** Các microservices hiện có khả năng mở rộng cao hơn, cho phép các tổ chức dễ dàng mở rộng quy mô triển khai AI của mình khi nhu cầu tăng lên.
**NVIDIA CUDA-X Microservices**
NVIDIA CUDA-X microservices là một bộ microservices được thiết kế để tăng tốc quá trình phát triển và triển khai các ứng dụng AI. Các microservices này cung cấp một bộ công cụ và thư viện toàn diện, bao gồm các thư viện toán học, thư viện xử lý hình ảnh và thư viện xử lý tín hiệu.
Các bản cập nhật mới nhất cho NVIDIA CUDA-X microservices bao gồm:
* **Hỗ trợ cho nhiều loại GPU hơn:** NVIDIA CUDA-X microservices hiện hỗ trợ nhiều loại GPU hơn, bao gồm các GPU từ các nhà cung cấp như NVIDIA, AMD và Intel.
* **Cải thiện hiệu suất:** Các microservices đã được tối ưu hóa để cải thiện hiệu suất, cho phép phát triển và triển khai các ứng dụng AI nhanh hơn và hiệu quả hơn.
* **Khả năng mở rộng nâng cao:** Các microservices hiện có khả năng mở rộng cao hơn, cho phép các tổ chức dễ dàng mở rộng quy mô triển khai AI của mình khi nhu cầu tăng lên.
**NVIDIA AI Workbench**
NVIDIA AI Workbench là một nền tảng phát triển AI dựa trên web, được thiết kế để đơn giản hóa quá trình phát triển và triển khai các ứng dụng AI. Nền tảng này cung cấp một bộ công cụ và thư viện toàn diện, bao gồm các khung AI phổ biến, trình tối ưu hóa hiệu suất và các công cụ quản lý.
Các bản cập nhật mới nhất cho NVIDIA AI Workbench bao gồm:
* **Giao diện người dùng được cải thiện:** Giao diện người dùng đã được cải thiện để dễ sử dụng hơn, cho phép các nhà phát triển dễ dàng điều hướng và sử dụng nền tảng.
* **Hỗ trợ cho nhiều loại mô hình AI hơn:** NVIDIA AI Workbench hiện hỗ trợ nhiều loại mô hình AI hơn, bao gồm các mô hình từ các nhà cung cấp như Google, Meta và Microsoft.
* **Khả năng cộng tác nâng cao:** Nền tảng hiện có khả năng cộng tác nâng cao, cho phép nhiều nhà phát triển làm việc cùng nhau trên cùng một dự án.
Nhìn chung, các bản cập nhật mới nhất cho NVIDIA AI Enterprise cung cấp một bộ tính năng và cải tiến toàn diện, được thiết kế để tăng tốc quá trình phát triển và triển khai AI. Các bản cập nhật này sẽ giúp các tổ chức dễ dàng hơn trong việc tận dụng sức mạnh của AI để thúc đẩy đổi mới và đạt được các mục tiêu kinh doanh của mình.
Paperium
Đăng ngày 18/5
• Ban đầu được xuất bản tại paperium.net
Một khảo sát về phép biến đổi Hough, lý thuyết, kỹ thuật và ứng dụng
#ai
#deeplearning
#computerscience
#machinelearning
AI (Loạt 3078 phần)
1
Học tập của tác nhân thông qua kinh nghiệm ban đầu
2
MM-HELIX: Thúc đẩy suy luận phản xạ chuỗi dài đa phương thức bằng nền tảng toàn diện và tối ưu hóa chính sách lai thích ứng
...
3074 phần khác...
3
MemMamba: Suy nghĩ lại các mẫu bộ nhớ trong mô hình không gian trạng thái
4
UniVideo: Hiểu, tạo và chỉnh sửa video thống nhất
5
VideoCanvas: Hoàn thiện video thống nhất từ các bản vá không gian-thời gian tùy ý thông qua điều kiện trong ngữ cảnh
6
DreamOmni2: Chỉnh sửa và tạo đa phương thức dựa trên hướng dẫn
7
Từ cái gì đến tại sao: Một hệ thống đa tác nhân để suy luận điều kiện phản ứng hóa học dựa trên bằng chứng
8
Nhận thức siêu việt nâng cao các mô hình suy luận: Học tăng cường tự căn chỉnh
9
Khi suy nghĩ gặp sự thật: Suy luận có thể tái sử dụng cho các mô hình ngôn ngữ lớn (LLM) ngữ cảnh dài
10
Các token xác suất thấp duy trì khám phá trong học tăng cường với phần thưởng có thể xác minh
11
Điệu nhảy căn chỉnh: Cùng nhau huấn luyện các tác nhân để hợp tác vì sự an toàn
12
Tối ưu hóa chính sách tương đối nhóm không cần huấn luyện
13
Tăng cường lai: Khi phần thưởng thưa thớt, tốt hơn là nên dày đặc
14
NewtonBench: Đánh giá khả năng khám phá luật khoa học tổng quát trong các tác nhân LLM
15
ARTDECO: Hướng tới tái tạo 3D hiệu quả và độ trung thực cao tức thì với biểu diễn cảnh có cấu trúc
16
DeepPrune: Mở rộng song song không có sự dư thừa giữa các dấu vết
17
Lần thử đầu tiên quan trọng: Xem xét lại vai trò của sự phản ánh trong các mô hình suy luận
18
LLM học cách lừa dối một cách vô ý: Sự sai lệch bất ngờ trong sự không trung thực từ các mẫu sai lệch đến tương tác người-AI thiên vị
19
UniMMVSR: Một khung đa phương thức thống nhất cho siêu phân giải video xếp tầng
20
NaViL: Suy nghĩ lại các thuộc tính mở rộng của các mô hình ngôn ngữ lớn đa phương thức gốc dưới các ràng buộc dữ liệu
21
CoMAS: Các hệ thống đa tác nhân cùng phát triển thông qua phần thưởng tương tác
22
PickStyle: Chuyển đổi phong cách video sang video với bộ điều hợp phong cách ngữ cảnh
23
UNIDOC-BENCH: Một điểm chuẩn thống nhất cho RAG đa phương thức tập trung vào tài liệu
24
InstructX: Hướng tới chỉnh sửa hình ảnh thống nhất với hướng dẫn MLLM
25
LongRM: Tiết lộ và mở khóa ranh giới ngữ cảnh của mô hình hóa phần thưởng
26
Học trong công việc: Một tác nhân tự tiến hóa dựa trên kinh nghiệm cho các nhiệm vụ dài hạn
27
Tăng cường các mô hình khuếch tán bằng cách tối ưu hóa ưu tiên nhóm trực tiếp
28
Kiểm soát tạo video văn bản thành âm thanh thông qua điều kiện và tương tác phương thức nâng cao
29
Kích hoạt điều hòa entropy: Thúc đẩy kiểm soát liên tục, các mô hình ngôn ngữ lớn và phân loại hình ảnh với kích hoạt như
30
Truy xuất và củng cố bộ nhớ trong các mô hình ngôn ngữ lớn thông qua các token chức năng
31
Tái chế các điểm kiểm tra được huấn luyện trước: Tăng trưởng trực giao của hỗn hợp chuyên gia để huấn luyện trước mô hình ngôn ngữ lớn hiệu quả
32
GCPO: Khi độ tương phản thất bại, hãy chọn vàng
33
UP2You: Tái tạo nhanh chóng bản thân từ các bộ sưu tập ảnh không bị ràng buộc
34
OmniRetarget: Tạo dữ liệu bảo toàn tương tác cho thao tác di chuyển toàn thân hình người và tương tác cảnh
35
DexNDM: Thu hẹp khoảng cách thực tế cho vòng quay khéo léo trong tay thông qua mô hình động lực học thần kinh theo khớp
36. A^2Search: Trả lời câu hỏi nhận biết sự mơ hồ bằng học tăng cường.
37. Học cách định tuyến các mô hình ngôn ngữ lớn (LLM) từ phản hồi Bandit: Một chính sách, nhiều sự đánh đổi.
38. Search-R3: Thống nhất suy luận và tạo nhúng trong các mô hình ngôn ngữ lớn.
39. R2RGEN: Tạo dữ liệu 3D từ thực tế sang thực tế để thao tác tổng quát hóa không gian.
40. Drive&Gen: Đồng đánh giá các mô hình lái xe đầu cuối và tạo video.
41. Vượt ra ngoài các giá trị ngoại lệ: Nghiên cứu về các bộ tối ưu hóa trong lượng tử hóa.
42. SViM3D: Khuếch tán vật liệu video ổn định để tạo 3D từ một hình ảnh.
43. GyroSwin: Các mô hình thay thế 5D cho mô phỏng nhiễu loạn plasma Gyrokinetic.
44. Hướng tới chỉnh sửa 3D có thể mở rộng và nhất quán.
45. Sử dụng mạng trực tuyến nếu có thể: Hướng tới học tăng cường nhanh và ổn định.
46. Thành phần dữ liệu nhận biết độ trung thực để tổng quát hóa robot mạnh mẽ.
47. SciVideoBench: Đánh giá suy luận video khoa học trong các mô hình đa phương thức lớn.
48. Khuếch tán quy mô lớn thông qua tính nhất quán thời gian liên tục được điều chỉnh theo điểm số.
49. Vượt qua giới hạn lượt: Huấn luyện các tác nhân tìm kiếm sâu với cửa sổ ngữ cảnh động.
50. OpenRubrics: Hướng tới tạo tiêu chí tổng hợp có thể mở rộng để mô hình hóa phần thưởng và căn chỉnh LLM.
51. Tư duy bằng camera: Một mô hình đa phương thức thống nhất để hiểu và tạo lấy camera làm trung tâm.
52. D2E: Mở rộng đào tạo trước thị giác-hành động trên dữ liệu máy tính để chuyển sang AI thể hiện.
53. TAG: Hướng dẫn khuếch đại tiếp tuyến để lấy mẫu khuếch tán chống ảo giác.
54. Tối ưu hóa lời nhắc đa phương thức: Tại sao không tận dụng nhiều phương thức cho MLLM.
55. AutoPR: Hãy tự động hóa việc thăng tiến học thuật của bạn!
56. R-Horizon: Mô hình suy luận lớn của bạn thực sự có thể đi xa đến đâu về chiều rộng và chiều sâu?
57. Webscale-RL: Đường ống dữ liệu tự động để mở rộng dữ liệu RL đến cấp độ đào tạo trước.
58. SpaceVista: Suy luận không gian trực quan mọi quy mô từ mm đến km.
59. StreamingVLM: Hiểu biết thời gian thực cho các luồng video vô hạn.
60. Đừng lãng phí sai lầm: Tận dụng các nhóm RL tiêu cực thông qua việc điều chỉnh lại độ tin cậy.
61. ARES: Suy luận thích ứng đa phương thức thông qua định hình entropy cấp mã thông báo nhận biết độ khó.
62. KORMo: Mô hình suy luận mở tiếng Hàn cho mọi người.
63. DISCO: Đa dạng hóa việc cô đặc mẫu để đánh giá mô hình hiệu quả.
64. Kết nối suy luận với học tập: Làm sáng tỏ ảo ảnh bằng cách tổng quát hóa độ phức tạp ngoài phân phối.
65. Biến đổi Gaussian lũy tiến với lấy mẫu nhận biết tính dị hướng.
Nguồn tin: Dev.to Machine Learning — Tác giả: Paperium. Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.