Ngày 6/10 vừa qua, TS. Nguyễn Quý Hà, Giám đốc Điều hành Viện Nghiên cứu Dữ liệu lớn Vingroup, Giám đốc Khối công nghệ Phân tích hình ảnh VinBigdata đã chia sẻ về tiềm năng của mô hình ngôn ngữ lớn tiếng Việt, trong khuôn khổ sự kiện Generative AI Innovation Showcase được tổ chức bởi Amazon Web Service Vietnam.
Cụ thể, TS. Nguyễn Quý Hà góp mặt tại tọa đàm “Harnessing Generative AI for Transformative Business Solutions”, cùng với các chuyên gia hàng đầu đến từ các doanh nghiệp lớn như Ather Labs, FE Credit, Amazon Web Service, thảo luận về giá trị của AI tạo sinh, đặc biệt là mô hình ngôn ngữ lớn, đối với sự tăng trưởng của doanh nghiệp trong thời kỳ số.
Từ góc nhìn của chuyên gia từng dẫn dắt nhiều dự án tầm cỡ về AI và Khoa học Dữ liệu, tiến sĩ cho biết để xây dựng được mô hình ngôn ngữ lớn, cần sự đầu tư đáng kể trong việc phát triển tập dữ liệu và mô hình công nghệ. Đặc biệt, dữ liệu đào tạo phải đáp ứng cả quy mô, sự đa dạng, đáng tin cậy và được chuẩn hóa.
Nhìn nhận những hạn chế của mô hình ngôn ngữ tiếng nước ngoài khi áp dụng tại thị trường Việt Nam, TS. Nguyễn Quý Hà nhấn mạnh sự cần thiết phải xây dựng mô hình dành riêng cho người dùng và doanh nghiệp Việt. Việc làm chủ mô hình ngôn ngữ lớn tiếng Việt sẽ giúp đảm bảo tính chính xác, bản địa hóa về mặt thông tin, an ninh dữ liệu và cắt giảm chi phí duy trì hạ tầng tính toán.
Đây cũng chính là động lực để VinBigdata xây dựng thành công mô hình ngôn ngữ lớn tiếng Việt vào tháng 8/2023 vừa qua. Tiến sĩ Hà gợi mở thêm, mô hình đang được nghiên cứu tích hợp vào các giải pháp hỗ trợ doanh nghiệp đột phá hiệu quả chăm sóc khách hàng và đẩy nhanh tốc độ chuyển đổi số.
Dự kiến tháng 12 năm 2023, VinBigdata sẽ ra mắt ViGPT hay còn gọi là ChatGPT phiên bản tiếng Việt để chia sẻ rộng rãi với cộng đồng, đồng thời ra mắt VinBase 2.0 phiên bản dành cho doanh nghiệp cung cấp các giải pháp như Generative AI Chatbot, Generative AI Callbot, Trợ lý ảo ViVi…