Vừa qua, công trình nghiên cứu của đội ngũ Xử lý ngôn ngữ và tiếng nói VinBigdata đã chính thức được Hiệp hội IEEE chấp thuận trình bày tại Hội nghị uy tín thế giới về xử lý âm thanh, tiếng nói và tín hiệu (ICASSP) năm 2021, tổ chức vào tháng 6 tại Toronto, Canada.
Cụ thể, công trình có tên “How to make text-to-speech system pronounce “Voldemort”: An experimental approach of Foreign word phonemization in Vietnamese”. Tại đây, các nhà khoa học của VinBigdata tìm lời giải cho một trong những thử thách lớn nhất mà hệ thống tổng hợp tiếng nói gặp phải, đó là đọc các từ ngữ tiếng nước ngoài, chẳng hạn như tên riêng, thuật ngữ kỹ thuật, tiêu đề tác phẩm hoặc trích dẫn. Bài báo khoa học đi sâu vào trường hợp của tiếng Việt.
Dựa trên việc phân tích cách sử dụng các từ nước ngoài trong ngôn ngữ của Việt Nam, nhiều phương án kỹ thuật khác nhau được được đề xuất để huấn luyện các mô hình chuyển đổi Tự vị ra Âm vị (grapheme-to-phoneme – G2P). Kết quả của nghiên cứu được kì vọng sẽ tạo cơ sở cho các công trình khác trong tương lai về cải thiện tính năng chuyển văn bản thành giọng nói tiếng Việt trên nhiều domain khác nhau. Chi tiết nghiên cứu sẽ được công bố tại Hội nghị ICASSP vào tháng 6 tới đây.
Công trình là thành quả nghiên cứu của nhóm các nhà khoa học hàng đầu tại VinBigdata: TS. Nguyễn Kim Anh (ĐH Stuttgart, Đức), TS. Mạc Đăng Khoa (ĐH Grenoble, Pháp), TS. Nguyễn Văn Huy (Viện Hàn lâm KH&CN Việt Nam), Nguyễn Đình Nghị (Chuyên viên Xử lý ngôn ngữ). Hiện tại, nhóm các nhà khoa học đang cùng đội ngũ hơn 50 chuyên gia, chuyên viên phòng Xử lý ngôn ngữ và tiếng nói nghiên cứu và phát triển các sản phẩm ứng dụng trực tiếp vào đời sống như: Nhận dạng tiếng nói, tổng hợp tiếng nói, chatbot, voicebot, trợ lí ảo, hệ thống phân tích ngữ nghĩa và dịch máy tự động,….
Thành tựu mới nhất này sẽ góp phần giúp VinBigdata tiếp tục cải thiện, nâng cao chất lượng và độ chính xác của phần mềm AI, từ đó ứng dụng vào các sản phẩm, giải pháp thuộc hệ sinh thái Công nghệ – Công nghiệp – Thương mại dịch vụ của Tập đoàn Vingroup. Đây là một trong những nền tảng để công nghệ Việt được phục vụ trực tiếp cho người Việt, giúp nâng cao trải nghiệm người dùng và thay đổi cách thức vận hành một số tác vụ trong cuộc sống.
Trước đó, đội ngũ Xử lý ngôn ngữ và tiếng nói VinBigdata đã đạt được nhiều kết quả nổi bật, bao gồm: xếp thứ 01 thị trường về công nghệ tự động sửa lỗi nhập liệu tiếng Việt; mô hình nhận dạng tiếng nói tiếng Việt có độ chính xác 90%, cao hơn Google; Công nghệ tự động chỉnh sửa lỗi văn bản, tài liệu (Error Correction) có độ chính xác 88%, cao hơn Samsung, Google, Laban…,
IEEE – Institute of Electrical and Electronics Engineers là hiệp hội chuyên gia kỹ thuật lớn nhất thế giới với hơn 423.000 thành viên tại hơn 160 quốc gia. Được thành lập từ năm 1884, bởi các chuyên gia về điện tử tại New York, Mỹ, đến nay, IEEE tiếp tục kiên trì theo đuổi sứ mệnh thúc đẩy tiến bộ công nghệ vì lợi ích của cả nhân loại. Hội nghị quốc tế về xử lý âm thanh, tiếng nói và tín hiệu (ICASSP) là một trong những hoạt động thường niên của hiệp hội IEEE, nhằm bàn luận về các bài toán và ứng dụng của xử lý tín hiệu. Năm 2021, lần thứ 46 được tổ chức, hội nghị sẽ trao đổi và công bố những nghiên cứu khoa học tiêu biểu thuộc nhiều chủ đề, như xử lý tín hiệu bằng học máy, xử lý tín hiệu phục vụ dữ liệu lớn, xử lý ngôn ngữ và tiếng nói,….