Ngày 8/12/2023 vừa qua, TS. Đặng Trần Thái (Trưởng phòng Xử lý ngôn ngữ tự nhiên, VinBigdata) đã có bài trình bày về “Con đường làm chủ AI tạo sinh & Ứng dụng thực tiễn tại Việt Nam”, trong khuôn khổ sự kiện Vietnam Web Summit do TopDev tổ chức.
Cụ thể, từ góc nhìn của chuyên gia nghiên cứu và phát triển mô hình ngôn ngữ lớn (LLM) tiếng Việt tại VinBigdata, TS. Đặng Trần Thái đã gợi mở nhiều vấn đề thiết thực từ kỹ thuật đến ứng dụng công nghệ AI tạo sinh trong doanh nghiệp.
Theo đó, tiến sĩ trình bày các kỹ thuật tinh chỉnh LLM, bao gồm: Tinh chỉnh có giám sát (Supervised Fine Tuning) và Học tăng cường (Reinforcement Learning). Ngoài ra, nhìn nhận một số hạn chế của các LLM hiện nay như thông tin chưa cập nhật hay tình trạng ảo giác, đại diện VinBigdata cũng cho biết Việt Nam cần nỗ lực làm chủ công nghệ này và tạo ra các giải pháp đặc thù, được tối ưu cho người dùng và doanh nghiệp trong nước.
Chia sẻ kinh nghiệm của VinBigdata, TS. Thái gợi ý, để làm chủ LLM, cần 3 yếu tố căn bản gồm:
- Công nghệ làm sạch dữ liệu văn bản để huấn luyện mô hình ngôn ngữ lớn
- Các phương pháp tạo dữ liệu có nhãn để tinh chỉnh mô hình ngôn ngữ lớn
- Kỹ thuật cải tiến mô hình tạo sinh
Sở hữu các yếu tố này và phát triển thành công LLM sẽ tạo ra đòn bẩy để tăng trưởng kinh tế, làm thay đổi thói quen làm việc và tương tác của mọi người, cũng như tối ưu hóa mọi chu trình kinh doanh, vận hành của doanh nghiệp.
Là hội nghị thường niên về Công nghệ hàng đầu Việt Nam, Vietnam Web Summit 2023 quy tụ hàng chục diễn giả uy tín đến từ các tổ chức, doanh nghiệp hàng đầu trong nước và quốc tế như Intel, AlphaSense (Phần Lan), Alibaba Cloud, Metro Digital,….