Viettel huấn luyện một mô hình AI tiếng Việt quy mô lớn

10:55, 06/06/2026

Viettel AI phát triển VT-Super-120B-A12B - mô hình ngôn ngữ lớn tiếng Việt 120 tỷ tham số, hướng tới xây dựng các hệ thống AI am hiểu sâu dữ liệu, ngôn ngữ và tri thức tiếng Việt.

VT-Super-120B-A12B được xây dựng dựa trên kiến trúc mở NVIDIA Nemotron 3 Super.

Trung tâm Dịch vụ dữ liệu và Trí tuệ nhân tạo Viettel (Viettel AI) đang thúc đẩy phát triển AI chủ quyền tại Việt Nam, đồng thời ghi nhận kết quả rõ rệt về năng lực mô hình thông qua quá trình huấn luyện và tinh chỉnh trên các mô hình mở NVIDIA Nemotron.

Thông qua các bài kiểm tra, VT-Super-120B-A12B - mô hình ngôn ngữ lớn (Large Language Model - LLM) tiếng Việt do Viettel AI nghiên cứu và làm chủ đạt hiệu suất cao. Đây là kết quả của việc mô hình được huấn luyện trên dữ liệu bản địa và tối ưu cho các bài toán nghiệp vụ trong nước.

Đáng chú ý, VT-Super-120B-A12B tăng cường năng lực xử lý tiếng Việt mà không làm suy giảm hiệu năng tiếng Anh của mô hình gốc, đồng thời hạn chế hiện tượng quên kiến thức cũ (catastrophic forgetting) thường gặp trong quá trình huấn luyện và tinh chỉnh mô hình AI.

VT-Super-120B-A12B được xây dựng trên kiến trúc mở NVIDIA Nemotron 3 Super với quy mô 120 tỷ tham số, do đội ngũ kỹ sư Việt Nam trực tiếp huấn luyện, tinh chỉnh và tối ưu cho tiếng Việt. Khả năng xử lý ngữ cảnh dài của kiến trúc NVIDIA Nemotron cho phép mô hình duy trì mạch thông tin xuyên suốt giữa nhiều tài liệu, quy trình và hội thoại phức tạp trong cùng một tác vụ.

Đây là năng lực đặc biệt quan trọng với các bài toán vận hành đặc thù tại Việt Nam, nơi nhiều quy định và quy trình có thể thay đổi tùy theo loại hồ sơ, đối tượng liên quan hoặc bối cảnh thực thi cụ thể. Việc sở hữu một mô hình lõi có khả năng ghi nhớ và thích ứng linh hoạt với dữ liệu thực tế tạo tiền đề để Viettel AI tinh chỉnh LLM đạt độ chính xác cao, giải quyết triệt để việc tối ưu hóa ứng dụng AI cho từng tổ chức, doanh nghiệp Việt Nam.

Bên cạnh việc kế thừa năng lực từ kiến trúc NVIDIA Nemotron 3 Super, Viettel AI cũng xây dựng quy trình huấn luyện LLM dựa trên các nguồn dữ liệu mang tính bản địa như dữ liệu hành chính, nghiệp vụ doanh nghiệp, hội thoại thực tế và hệ thống văn bản chuyên ngành tại Việt Nam.

Quá trình này bao gồm nhiều giai đoạn huấn luyện; trong đó, giai đoạn tiếp tục tiền huấn luyện (continued pre-training) mở rộng năng lực ngôn ngữ và tri thức tiếng Việt trên kho dữ liệu quy mô lớn. Tiếp theo, mô hình được tinh chỉnh có giám sát (supervised fine-tuning) nhằm cải thiện khả năng suy luận, sau đó được học tăng cường (reinforcement learning) để nâng cao độ chính xác trong phản hồi và khả năng xử lý nghiệp vụ.

Trên nền tảng mô hình này, Viettel AI đang phát triển nền tảng AI Agent dành cho người Việt với khả năng tự thực hiện chuỗi tác vụ trong cùng một không gian làm việc. Trong đó, Trợ lý AI Pháp luật là một trong những ứng dụng đầu tiên, được kỳ vọng sẽ sở hữu khả năng hỗ trợ phân tích hồ sơ, đối chiếu quy định, tổng hợp dữ liệu và đề xuất giải pháp xử lý theo bài toán cụ thể của người dùng, với chất lượng được nâng cao đáng kể so với các phiên bản trước đây.

Theo Nhân Dân


Ý kiến bạn đọc


Cùng chuyên mục
Hệ sinh thái UAV “Make in Vietnam” ghi dấu ấn tại Japan Drone Expo 2026
Tại Triển lãm quốc tế Japan Drone Expo 2026 diễn ra từ ngày 3-5/6 tại Chiba (Nhật Bản), các doanh nghiệp công nghệ Việt Nam đã giới thiệu nhiều sản phẩm, giải pháp UAV "Make in Vietnam" do chính đội ngũ kỹ sư trong nước nghiên cứu, phát triển và sản xuất.
06/06/2026
Chuyển đổi số cấp xã phải lấy người dân làm trung tâm
Sau khi vận hành mô hình chính quyền địa phương hai cấp, cấp xã được xác định là mắt xích quan trọng trong triển khai chuyển đổi số, trực tiếp cung cấp dịch vụ số và phục vụ người dân, doanh nghiệp.
06/06/2026
Tỷ phú Eric Schmidt, cựu Chủ tịch, Tổng Giám đốc Tập đoàn Google cùng đoàn chuyên gia AI quốc tế trao đổi về tương lai AI Việt Nam
Chuyến thăm và làm việc của ông Eric Schmidt và các chuyên gia là một dấu mốc quan trọng trong quá trình tăng cường kết nối và hợp tác giữa Việt Nam với các tổng công trình sư, doanh nghiệp công nghệ hàng đầu thế giới trong lĩnh vực AI.
06/06/2026
Ký kết Chương trình hợp tác giữa Hội đồng Lý luận Trung ương với Viện Hàn lâm Khoa học xã hội Việt Nam
Chiều 5/6, tại Hà Nội, đã diễn ra buổi làm việc và ký kết chương trình hợp tác giữa Viện Hàn lâm Khoa học xã hội Việt Nam và Hội đồng Lý luận Trung ương.
06/06/2026