Nghiên cứu AI trên dữ liệu Việt - nền tảng cho chủ quyền công nghệ

09:25, 27/10/2025

Trong khuôn khổ chuyến thăm cấp Nhà nước giữa hai quốc gia Việt Nam và Bulgaria, Tập đoàn VNPT đã chia sẻ chiến lược phát triển và năng lực làm chủ các công nghệ chiến lược, đặc biệt là trí tuệ nhân tạo.

Tại chương trình làm việc của Đoàn đại biểu cấp cao Việt Nam tại Cộng hòa Bulgaria nhằm mở rộng không gian hợp tác chiến lược giữa hai nước, ông Huỳnh Quang Liêm, Tổng Giám đốc Tập đoàn VNPT đã chia sẻ về chiến lược làm chủ các công nghệ lõi.

AI chuyên biệt cho Việt Nam bắt đầu từ dữ liệu Việt

Theo ông Huỳnh Quang Liêm, VNPT đang chuyển đổi mạnh mẽ từ nhà cung cấp dịch vụ viễn thông truyền thống sang doanh nghiệp công nghệ số, trong đó, AI “Make in Vietnam” trên nền dữ liệu Việt được xem là trọng tâm đầu tư để khẳng định năng lực tự chủ và chủ quyền AI của Việt Nam.

anh-1.jpeg

Tổng Giám đốc Tập đoàn VNPT Huỳnh Quang Liêm chia sẻ về chiến lược làm chủ công nghệ lõi, ngày 23-10. Ảnh: VNPT

Ông Liêm cũng dẫn chứng về những cột mốc phát triển khoa học công nghệ trong lĩnh vực AI của VNPT, điển hình trong thời gian qua với các dự án nghiên cứu được công bố tại những hội nghị hàng đầu thế giới về AI như MICCAI, EMNLP, ICASSP…

Đây là một trong những nền tảng để VNPT phát triển hệ sinh thái “Make in Vietnam” phục vụ hàng chục triệu người Việt, với quy mô xử lý hàng tỷ lượt yêu cầu người dùng.

anh-3.jpeg

VNPT chọn cách tiếp cận “từ nghiên cứu đến triển khai” tạo nền móng phát triển AI có chủ quyền cho Việt Nam. Ảnh: VNPT

Trong y tế, việc chẩn đoán sai hay chậm có thể gây ảnh hưởng đến chất lượng điều trị, chi phí và tâm lý người bệnh. Các bệnh như ung thư tuyến giáp thường tiến triển âm thầm, trong khi số lượng bác sĩ chuyên khoa và thiết bị chẩn đoán ở Việt Nam, đặc biệt là các cơ sở y tế tuyến dưới, còn hạn chế. Chính từ thực tiễn đó, nhóm kỹ sư VNPT phối hợp cùng các bác sĩ Bệnh viện Nội tiết trung ương tiến hành nghiên cứu phát triển AI hỗ trợ chẩn đoán ung thư tuyến giáp từ hình ảnh siêu âm chuyên biệt cho Việt Nam.

Từ ngày 23 đến 27-9-2025, hội nghị MICCAI 2025 đã diễn ra tại Hàn Quốc. Đây là hội nghị quốc tế hàng đầu về AI và thị giác máy tính trong y học, tập trung vào sử dụng công nghệ AI để phân tích hình ảnh y khoa. Nhiều nghiên cứu khoa học đã được công bố tại đây. Nghiên cứu của VNPT tập trung vào ứng dụng AI trong chẩn đoán ung thư tuyến giáp, được thực hiện với dữ liệu từ gần 10.000 người bệnh tại ba miền đất nước trong suốt 4 năm. Bộ dữ liệu được gắn nhãn bởi chính các chuyên gia, bác sĩ đầu ngành, xác thực bằng mô bệnh học và chuẩn hóa định dạng nhằm bảo đảm độ tin cậy lâm sàng.

Nghiên cứu này đóng vai trò nền tảng cho việc phát triển các hệ thống hỗ trợ chẩn đoán tự động phù hợp với đặc thù dân số và điều kiện y tế trong nước, giúp nâng cao độ chính xác, rút ngắn thời gian chẩn đoán, giảm tải cho bác sĩ, đồng thời mở rộng khả năng tiếp cận dịch vụ y tế chất lượng cao đến các tuyến cơ sở. Với quy mô lớn và độ chuẩn hóa cao, dự án là nguồn dữ liệu huấn luyện và đánh giá quan trọng cho các mô hình AI trong chẩn đoán hình ảnh y khoa, giúp nâng cao độ chính xác trong phát hiện và phân loại tổn thương tuyến giáp tại Việt Nam.

Đưa tiếng Việt lên bản đồ AI xử lý ngôn ngữ toàn cầu

Trong khi các ngôn ngữ phổ biến như tiếng Anh hay tiếng Trung sở hữu nguồn dữ liệu phong phú, tiếng Việt vẫn nằm trong nhóm ngôn ngữ có tài nguyên hạn chế, khiến việc phát triển các mô hình AI ngôn ngữ trở nên thách thức hơn. Vì thiếu dữ liệu chuẩn hóa, nhiều hệ thống chatbot, hay trợ lý ảo hiện nay vẫn cho trải nghiệm chưa hiểu đúng ngữ cảnh, diễn đạt gượng gạo và thiếu tự nhiên khi giao tiếp bằng tiếng Việt. Trước thực tế đó, các kỹ sư AI của VNPT đã tập trung nghiên cứu và phát triển các mô hình ngôn ngữ và cảm xúc tiếng Việt.

anh-3-vnpt.jpeg

Kỹ sư AI của VNPT công bố nghiên cứu AI xử lý giọng nói tại ICASSP 2025 tại Ấn Độ. Ảnh: VNPT

Các nghiên cứu này cũng được đội ngũ công bố tại hội nghị EMNLP 2025 diễn ra từ ngày 4 đến 9-11-2025 tại Trung Quốc, hội nghị AI hạng A* của thế giới về xử lý ngôn ngữ tự nhiên (NLP).

Các công trình này ứng dụng những kỹ thuật học máy tiên tiến trong phát triển mô hình ngôn ngữ lớn (LLM) và AI tạo sinh (Generative AI), nhằm nâng cao khả năng hiểu ngữ cảnh, cảm xúc và sắc thái tiếng Việt của các mô hình AI, vốn là những yếu tố phức tạp và ít được mô hình hóa trong các bộ ngữ liệu quốc tế. Nhờ đó, ngôn ngữ Việt ngày càng hiện diện rõ nét hơn trong cộng đồng nghiên cứu NLP toàn cầu, mở ra khả năng xây dựng mô hình ngôn ngữ mạnh, giàu bản sắc và phù hợp với người Việt.

Trước đó, tại một hội nghị về AI xử lý giọng nói tại Ấn Độ vào tháng 4-2025, nhóm nghiên cứu của VNPT đã giới thiệu dự án nghiên cứu công nghệ chuyển đổi giọng nói (voice conversion), kết hợp phương pháp học đối kháng miền (domain adversarial training), một kỹ thuật giúp mô hình học cách giữ ổn định các đặc trưng giọng nói tiếng Việt ngay cả khi dữ liệu huấn luyện còn ít, hoặc đến từ nhiều nguồn khác nhau. Nhờ đó, hệ thống có thể tạo ra giọng nói tự nhiên, gần với con người hơn, đồng thời tùy chỉnh linh hoạt theo từng người dùng để mang lại trải nghiệm giao tiếp thân thiện, cá nhân hóa hơn.

Khi được áp dụng trong thực tế, công nghệ này sẽ khắc phục hạn chế lớn mà nhiều hệ thống hiện nay đang gặp phải, đó là giọng nói AI còn đơn điệu, thiếu cảm xúc và mang tính “máy móc”, giúp người dùng cảm thấy gần gũi và tin cậy hơn khi tương tác với AI.

Những công trình nghiên cứu được công bố tại các hội nghị quốc tế của đội ngũ khoa học Việt Nam, trong đó có VNPT, cho thấy năng lực nghiên cứu trong nước đang từng bước tiệm cận chuẩn mực toàn cầu. Quan trọng hơn, đây là bước đi khởi đầu cho mục tiêu lớn hơn của quốc gia: Hình thành năng lực làm chủ công nghệ AI có chủ quyền, dựa trên dữ liệu, ngôn ngữ và tri thức của chính người Việt.

Theo Hanoimoi.vn


Ý kiến bạn đọc


Cùng chuyên mục
Hoàn thiện hành lang pháp lý cho khoa học, công nghệ và đổi mới sáng tạo
Trong tháng 10-2025, Chính phủ đã ban hành 5 nghị định hướng dẫn thi hành Luật Khoa học, công nghệ và đổi mới sáng tạo (gọi tắt là Luật).
27/10/2025
Gây tiếng vang toàn cầu, Toyota Hilux âm thầm ghi điểm trong lòng khách Việt
Với hơn 27 triệu xe đã được bán ra trên toàn cầu, lọt top 10 xe bán chạy nhất thế giới năm 2024, Toyota Hilux cũng là lựa chọn đáng tin cậy và định vị chất riêng trong lòng khách hàng Việt.
27/10/2025
Tro than nông nghiệp - Hướng đi mới thu giữ CO 2 bền vững
Trong bối cảnh biến đổi khí hậu và ô nhiễm môi trường gia tăng, nhóm nghiên cứu hợp tác giữa Đại học Khoa học và Công nghệ Hà Nội (Viện Hàn lâm Khoa học và Công nghệ Việt Nam) và Học viện Kỹ thuật Kyushu (Nhật Bản) đã tìm ra cách “hồi sinh” tro than thải, phụ phẩm của quá trình khí hóa sinh khối, thành vật liệu hấp phụ CO2 hiệu quả, giá rẻ và thân thiện môi trường.
27/10/2025
Viettel Money - hệ sinh thái tài chính toàn diện phục vụ người dân
Ra mắt từ ngày 1-12-2021, Viettel Money do Tổng Công ty Dịch vụ số Viettel (Tập đoàn Viettel) phát triển, mang sứ mệnh phổ cập tài chính số, tiến tới kiến tạo xã hội số cho người Việt.
27/10/2025