Nghiên cứu AI trên dữ liệu Việt - nền tảng cho chủ quyền công nghệ
Trong khuôn khổ chuyến thăm cấp Nhà nước giữa hai quốc gia Việt Nam và Bulgaria, Tập đoàn VNPT đã chia sẻ chiến lược phát triển và năng lực làm chủ các công nghệ chiến lược, đặc biệt là trí tuệ nhân tạo.
Tại chương trình làm việc của Đoàn đại biểu cấp cao Việt Nam tại Cộng hòa Bulgaria nhằm mở rộng không gian hợp tác chiến lược giữa hai nước, ông Huỳnh Quang Liêm, Tổng Giám đốc Tập đoàn VNPT đã chia sẻ về chiến lược làm chủ các công nghệ lõi.
AI chuyên biệt cho Việt Nam bắt đầu từ dữ liệu Việt
Theo ông Huỳnh Quang Liêm, VNPT đang chuyển đổi mạnh mẽ từ nhà cung cấp dịch vụ viễn thông truyền thống sang doanh nghiệp công nghệ số, trong đó, AI “Make in Vietnam” trên nền dữ liệu Việt được xem là trọng tâm đầu tư để khẳng định năng lực tự chủ và chủ quyền AI của Việt Nam.

Tổng Giám đốc Tập đoàn VNPT Huỳnh Quang Liêm chia sẻ về chiến lược làm chủ công nghệ lõi, ngày 23-10. Ảnh: VNPT
Ông Liêm cũng dẫn chứng về những cột mốc phát triển khoa học công nghệ trong lĩnh vực AI của VNPT, điển hình trong thời gian qua với các dự án nghiên cứu được công bố tại những hội nghị hàng đầu thế giới về AI như MICCAI, EMNLP, ICASSP…
Đây là một trong những nền tảng để VNPT phát triển hệ sinh thái “Make in Vietnam” phục vụ hàng chục triệu người Việt, với quy mô xử lý hàng tỷ lượt yêu cầu người dùng.

VNPT chọn cách tiếp cận “từ nghiên cứu đến triển khai” tạo nền móng phát triển AI có chủ quyền cho Việt Nam. Ảnh: VNPT
Trong y tế, việc chẩn đoán sai hay chậm có thể gây ảnh hưởng đến chất lượng điều trị, chi phí và tâm lý người bệnh. Các bệnh như ung thư tuyến giáp thường tiến triển âm thầm, trong khi số lượng bác sĩ chuyên khoa và thiết bị chẩn đoán ở Việt Nam, đặc biệt là các cơ sở y tế tuyến dưới, còn hạn chế. Chính từ thực tiễn đó, nhóm kỹ sư VNPT phối hợp cùng các bác sĩ Bệnh viện Nội tiết trung ương tiến hành nghiên cứu phát triển AI hỗ trợ chẩn đoán ung thư tuyến giáp từ hình ảnh siêu âm chuyên biệt cho Việt Nam.
Từ ngày 23 đến 27-9-2025, hội nghị MICCAI 2025 đã diễn ra tại Hàn Quốc. Đây là hội nghị quốc tế hàng đầu về AI và thị giác máy tính trong y học, tập trung vào sử dụng công nghệ AI để phân tích hình ảnh y khoa. Nhiều nghiên cứu khoa học đã được công bố tại đây. Nghiên cứu của VNPT tập trung vào ứng dụng AI trong chẩn đoán ung thư tuyến giáp, được thực hiện với dữ liệu từ gần 10.000 người bệnh tại ba miền đất nước trong suốt 4 năm. Bộ dữ liệu được gắn nhãn bởi chính các chuyên gia, bác sĩ đầu ngành, xác thực bằng mô bệnh học và chuẩn hóa định dạng nhằm bảo đảm độ tin cậy lâm sàng.
Nghiên cứu này đóng vai trò nền tảng cho việc phát triển các hệ thống hỗ trợ chẩn đoán tự động phù hợp với đặc thù dân số và điều kiện y tế trong nước, giúp nâng cao độ chính xác, rút ngắn thời gian chẩn đoán, giảm tải cho bác sĩ, đồng thời mở rộng khả năng tiếp cận dịch vụ y tế chất lượng cao đến các tuyến cơ sở. Với quy mô lớn và độ chuẩn hóa cao, dự án là nguồn dữ liệu huấn luyện và đánh giá quan trọng cho các mô hình AI trong chẩn đoán hình ảnh y khoa, giúp nâng cao độ chính xác trong phát hiện và phân loại tổn thương tuyến giáp tại Việt Nam.
Đưa tiếng Việt lên bản đồ AI xử lý ngôn ngữ toàn cầu
Trong khi các ngôn ngữ phổ biến như tiếng Anh hay tiếng Trung sở hữu nguồn dữ liệu phong phú, tiếng Việt vẫn nằm trong nhóm ngôn ngữ có tài nguyên hạn chế, khiến việc phát triển các mô hình AI ngôn ngữ trở nên thách thức hơn. Vì thiếu dữ liệu chuẩn hóa, nhiều hệ thống chatbot, hay trợ lý ảo hiện nay vẫn cho trải nghiệm chưa hiểu đúng ngữ cảnh, diễn đạt gượng gạo và thiếu tự nhiên khi giao tiếp bằng tiếng Việt. Trước thực tế đó, các kỹ sư AI của VNPT đã tập trung nghiên cứu và phát triển các mô hình ngôn ngữ và cảm xúc tiếng Việt.

Kỹ sư AI của VNPT công bố nghiên cứu AI xử lý giọng nói tại ICASSP 2025 tại Ấn Độ. Ảnh: VNPT
Các nghiên cứu này cũng được đội ngũ công bố tại hội nghị EMNLP 2025 diễn ra từ ngày 4 đến 9-11-2025 tại Trung Quốc, hội nghị AI hạng A* của thế giới về xử lý ngôn ngữ tự nhiên (NLP).
Các công trình này ứng dụng những kỹ thuật học máy tiên tiến trong phát triển mô hình ngôn ngữ lớn (LLM) và AI tạo sinh (Generative AI), nhằm nâng cao khả năng hiểu ngữ cảnh, cảm xúc và sắc thái tiếng Việt của các mô hình AI, vốn là những yếu tố phức tạp và ít được mô hình hóa trong các bộ ngữ liệu quốc tế. Nhờ đó, ngôn ngữ Việt ngày càng hiện diện rõ nét hơn trong cộng đồng nghiên cứu NLP toàn cầu, mở ra khả năng xây dựng mô hình ngôn ngữ mạnh, giàu bản sắc và phù hợp với người Việt.
Trước đó, tại một hội nghị về AI xử lý giọng nói tại Ấn Độ vào tháng 4-2025, nhóm nghiên cứu của VNPT đã giới thiệu dự án nghiên cứu công nghệ chuyển đổi giọng nói (voice conversion), kết hợp phương pháp học đối kháng miền (domain adversarial training), một kỹ thuật giúp mô hình học cách giữ ổn định các đặc trưng giọng nói tiếng Việt ngay cả khi dữ liệu huấn luyện còn ít, hoặc đến từ nhiều nguồn khác nhau. Nhờ đó, hệ thống có thể tạo ra giọng nói tự nhiên, gần với con người hơn, đồng thời tùy chỉnh linh hoạt theo từng người dùng để mang lại trải nghiệm giao tiếp thân thiện, cá nhân hóa hơn.
Khi được áp dụng trong thực tế, công nghệ này sẽ khắc phục hạn chế lớn mà nhiều hệ thống hiện nay đang gặp phải, đó là giọng nói AI còn đơn điệu, thiếu cảm xúc và mang tính “máy móc”, giúp người dùng cảm thấy gần gũi và tin cậy hơn khi tương tác với AI.
Những công trình nghiên cứu được công bố tại các hội nghị quốc tế của đội ngũ khoa học Việt Nam, trong đó có VNPT, cho thấy năng lực nghiên cứu trong nước đang từng bước tiệm cận chuẩn mực toàn cầu. Quan trọng hơn, đây là bước đi khởi đầu cho mục tiêu lớn hơn của quốc gia: Hình thành năng lực làm chủ công nghệ AI có chủ quyền, dựa trên dữ liệu, ngôn ngữ và tri thức của chính người Việt.
Theo Hanoimoi.vn










Ý kiến bạn đọc