Sáng 26/11/2022, Câu lạc bộ Xử lý ngôn ngữ và tiếng nói tiếng Việt (VLSP) và Hội Tin học Việt Nam đã tổ chức hội thảo, tổng kết cuộc thi và trao giải cho các đội xuất sắc trong VLSP 2022. Theo đó, đội Speech World đến từ VinBigData đã xuất sắc giành giải nhất với mô hình dữ liệu chuyển đổi văn bản của cuộc thi tổng hợp tiếng nói có cảm xúc. Tổng hợp tiếng nói có cảm xúc (Emotional Speech Synthesis ESS) là hướng nghiên cứu cho phép tái tạo lại giọng nói của con người theo biểu cảm cảm xúc nhất định. Hướng nghiên cứu mở ra những ứng dụng có yêu cầu cao như thuyết minh/lồng tiếng phim, trợ lý ảo, kể chuyện.
Anh Nguyễn Văn Thịnh, đội trưởng Speech World thuộc VinBigData cho biết: “Nhóm nghiên cứu đưa ra mô hình sử dụng AI chuyển đổi văn bản thành tiếng nói có cảm xúc, ứng dụng trong phát triển trợ lý ảo, giúp đọc truyện, thuyết minh phim. Bắt đầu phát triển từ 2021, nhóm cải tiến và phát triển mô hình riêng phù hợp với giọng nói và ngôn ngữ của tiếng Việt. Hiện công nghệ đã được hoàn thiện và bắt đầu chuyển giao đưa vào sản phẩm phẩm ứng dụng thực tế”.
Nhiều giải pháp, công nghệ khác cũng đã được chia sẻ trong cuộc thi về xử lý văn bản như phân tích cú pháp thành phần, tóm tắt đa văn bản, dịch máy Trung – Việt. Đặc biệt, phòng Natural language processing (NLP) của VinBigData đã đạt được những thành tích ấn tượng như Top 2 hạng mục Dịch Trung-Việt, Top 2 hạng mục Phân tích cú pháp Tiếng Việt. Tại sự kiện các nhà nghiên cứu và chuyên gia trong lĩnh vực nghiên cứu về xử lý tiếng nói và ngôn ngữ tiếng Việt cũng chia sẻ và thảo luận các kết quả nghiên cứu mới cũng như các giải pháp công nghệ ứng dụng trong lĩnh vực.