Những năm gần đây, cộng đồng công nghệ chứng kiến sự bùng nổ mạnh mẽ của các Mô hình Ngôn ngữ lớn (LLMs) như GPT, Llama, Gemini, hay gần đây nhất là DeepSeek. Nhiều mô hình đã dần trở nên quen thuộc với người dùng Việt Nam, được sử dụng hàng ngày trong các tác vụ công việc và đời sống. Tuy nhiên, với sự phát triển nhanh chóng của công nghệ, một khái niệm mới đang dần nổi lên và thu hút sự chú ý: Mô hình Ngôn ngữ Thị giác (Vision Language Model – VLM).
Mô hình Ngôn ngữ Thị giác VLM không chỉ phát triển trên nền tảng của Mô hình Ngôn ngữ lớn mà còn mở rộng khả năng ứng dụng, hỗ trợ doanh nghiệp trong xử lý và phân tích dữ liệu trực quan và cải thiện trải nghiệm khách hàng. Công nghệ này đang thúc đẩy các bước tiến đột phá trong việc tự động hóa các quy trình, tiết kiệm nguồn lực và nâng cao lợi thế cạnh tranh của các doanh nghiệp trong thời đại số.
Vậy, cụ thể: Mô hình Ngôn ngữ Thị giác VLM là gì và đâu là sự khác biệt so với Mô hình Ngôn ngữ lớn LLM? Mô hình Ngôn ngữ Thị giác VLM có những ưu điểm nổi bật gì so với Mô hình Thị giác máy tính truyền thống? VLM có thể được ứng dụng như thế nào để tối ưu hoạt động vận hành, kinh doanh của doanh nghiệp? Những giải pháp ứng dụng VLM mà VinBigdata đang phát triển và triển khai cho doanh nghiệp?
Cùng theo dõi Webinar “Mô hình Ngôn ngữ thị giác – Đón đầu xu thế, bứt tốc kinh doanh” để giải đáp các câu hỏi trên. Webinar có sự tham gia của các chuyên gia đến từ VinBigdata:
- TS. Nguyễn Quý Hà – Giám đốc Khối Công nghệ Phân tích hình ảnh, VinBigdata
- ThS. Phan Lê – Giám đốc Tư vấn và Triển khai, VinBigdata