Trong FriData tuần trước, chúng ta đã tìm hiểu về cách các ông lớn trên thế giới tận dụng dữ liệu nhằm “sản sinh” ra hàng tỷ USD. Vậy còn tại Việt Nam, “mỏ vàng” này đang được sử dụng như thế nào? Liệu Việt Nam có đứng trước bài toán “chảy máu” dữ liệu? FriData tuần này sẽ cùng bạn trả lời tất cả những câu hỏi trên!
“Chảy máu” dữ liệu & “dòng chảy” dữ liệu xuyên biên giới
“Chảy máu dữ liệu” (hay còn gọi là data bleed) xảy ra khi không có sự minh bạch trong việc sử dụng dữ liệu, quá trình truyền dữ liệu diễn ra mà không có sự cho phép rõ ràng nào của người dùng.
Hiện nay, sự gia tăng số hóa trong các tổ chức, doanh nghiệp được thúc đẩy bởi các công nghệ như điện toán đám mây và phân tích dữ liệu lớn. Điều này khiến dữ liệu càng trở nên quan trọng không chỉ đối với ngành công nghệ thông tin mà còn đối với các ngành công nghiệp truyền thống. Các tổ chức ngày càng dựa vào dữ liệu để phục vụ một số mục đích, bao gồm giám sát hệ thống sản xuất, quản lý lực lượng lao động toàn cầu, giám sát chuỗi cung ứng,… Các công ty thu thập và phân tích dữ liệu cá nhân để hiểu rõ hơn về sở thích và mức độ sẵn sàng chi trả của khách hàng, đồng thời điều chỉnh các sản phẩm và dịch vụ của họ cho phù hợp. Như vậy có thể thấy, thương mại quốc tế có sự tham gia của người tiêu dùng sẽ không thể diễn ra nếu không có việc thu thập và dòng chảy của dữ liệu cá nhân qua biên giới — chẳng hạn như tên, địa chỉ, thông tin thanh toán, v.v.
Bên cạnh những lợi ích đến từ việc chia sẻ dữ liệu xuyên biên giới, hàng chục quốc gia — trong mọi giai đoạn phát triển — đã dựng lên các rào cản đối với các luồng dữ liệu này, chẳng hạn như yêu cầu giới hạn dữ liệu chỉ trong biên giới quốc gia (data residency) hay bản địa hóa dữ liệu (data localization). Rào cản trên đồng nghĩa với việc áp dụng các chính sách hạn chế nhằm khiến việc chuyển dữ liệu trở nên khó khả thi, ví dụ: yêu cầu các công ty lưu trữ bản sao dữ liệu hay xử lý dữ liệu cục bộ và ủy quyền sự đồng ý của cá nhân hoặc chính phủ đối với việc chuyển dữ liệu.
Chính sách cắt giảm các luồng dữ liệu hoặc làm cho các luồng dữ liệu đó trở nên khó khăn hoặc tốn kém hơn sẽ khiến các công ty nước ngoài gặp bất lợi. Về bản chất, những chiến thuật này cấu thành “chủ nghĩa bảo vệ dữ liệu” vì chúng đẩy các đối thủ cạnh tranh nước ngoài ra khỏi thị trường nội địa.
Thách thức của Việt Nam khi đứng trước “dòng chảy” dữ liệu xuyên biên giới
“Dữ liệu là tài sản chiến lược của cơ quan, tổ chức, là nguồn tài nguyên mới để phát triển kinh tế, trích xuất ra giá trị mới nhưng 80% tài nguyên dữ liệu lại đang ở nước ngoài” Thứ trưởng Bộ Thông tin & Truyền thông Phạm Đức Long cho biết tại sự kiện Ngày Internet Việt Nam 2021 (Internet Day 2021) với chủ đề “Phục hồi và bứt phá trong kỷ nguyên dữ liệu hóa”.
Trước đó, nhằm bảo vệ dữ liệu trong nước, Việt Nam đã ban hành một số chính sách “bản địa hóa dữ liệu”, chủ yếu nhắm vào các dịch vụ số. Ví dụ, Việt Nam cấm truy cập trực tiếp vào Internet thông qua các ISP nước ngoài và yêu cầu các ISP trong nước phải lưu trữ thông tin truyền trên Internet trong ít nhất 15 ngày. Vào tháng 1/2016, Việt Nam đã đưa ra dự thảo quy định — Dự thảo Nghị định sửa đổi Nghị định 72 — cho các dịch vụ hàng đầu (như WhatsApp và Skype) bao gồm yêu cầu bắt buộc bản địa hóa dữ liệu. Năm 2013, Việt Nam đã ban hành luật — Nghị định 72 — về quản lý, cung cấp và sử dụng dịch vụ Internet và thông tin trực tuyến, yêu cầu nhiều công ty trực tuyến (như mạng xã hội, nhà cung cấp trò chơi trực tuyến và trang web thông tin tổng hợp) phải có ít nhất một máy chủ tại Việt Nam “phục vụ công tác kiểm tra, lưu trữ và cung cấp thông tin theo yêu cầu của cơ quan quản lý nhà nước có thẩm quyền”. Năm 2008, Việt Nam ban hành luật – Nghị định 90 – chống spam (email và tin nhắn văn bản không mong muốn) buộc các công ty quảng cáo có liên quan tham gia vào các hoạt động này chỉ được gửi email và tin nhắn từ các máy chủ tại Việt Nam.
Tuy nhiên, nghiên cứu của Quỹ Công nghệ thông tin & Đổi mới sáng tạo Hoa Kỳ cho thấy bản địa hóa dữ liệu và các rào cản khác đối với dòng chảy dữ liệu ra nước ngoài cũng tác động tiêu cực đến nền kinh tế Việt Nam. Cùng với các nước như Brazil, Trung Quốc, Ấn Độ, Indonesia và Hàn Quốc, Việt Nam chịu sụt giảm GDP từ 0,7 đến 1,7% bởi tác động của các rào cản dữ liệu xuyên quốc gia.
Cơ hội cho dữ liệu trong nước
Bên cạnh việc xây dựng các rào cản ngăn dữ liệu chảy ra nước ngoài, Việt Nam cũng tập trung vào phát triển cơ sở và hạ tầng dữ liệu trong nước. Theo nghiên cứu của ResearchAndMarkets năm 2021, Việt Nam đã lọt vào danh sách 10 thị trường mới nổi về trung tâm dữ liệu trên toàn cầu. ResearchAndMarkets nhận xét Việt Nam có tốc độ tăng trưởng ấn tượng, năng lực cung cấp dịch vụ đạt tiêu chuẩn quốc tế, số lượng tổ chức, doanh nghiệp lớn.
Thị trường trung tâm dữ liệu Việt Nam đạt 858 triệu USD vào 2020 và được dự báo sẽ phát triển với tốc độ tăng trưởng kép hàng năm trên 14,64% cho đến năm 2026. Báo cáo cho biết, sự tăng trưởng trong thị trường trung tâm dữ liệu Việt Nam được thúc đẩy bởi các dự án và sáng kiến của chính phủ.
Yêu cầu bản địa hóa dữ liệu theo Luật An ninh mạng, cộng với nhu cầu về tốc độ xử lý tốt hơn để hỗ trợ người dùng Việt Nam là những động lực chính, được dự đoán sẽ nâng cao nhu cầu về các trung tâm dữ liệu trong nước.
Hơn nữa, thị trường trung tâm dữ liệu Việt Nam được thúc đẩy bởi sự dịch chuyển dữ liệu doanh nghiệp sang nền tảng đám mây. Ngoài ra, việc áp dụng ngày càng nhiều các giải pháp dữ liệu lớn, IoT và các giải pháp dựa trên đám mây dự kiến sẽ tác động tích cực đến sự tăng trưởng của thị trường đến năm 2026.
Thêm vào đó, sự đầu tư của các doanh nghiệp trong nước đối với dữ liệu thuần Việt vừa giúp bảo vệ dữ liệu Việt Nam trước các tổ chức nước ngoài, vừa nâng cao sức cạnh tranh đối với các sản phẩm, giải pháp công nghệ “Make in Vietnam”. Xuất phát từ những “bài toán nếu người Việt không làm thì ai làm”, VinBigData sở hữu thế mạnh đặc biệt về hạ tầng dữ liệu lớn thuộc đa ngành nghề và đặc trưng cho người Việt như:
- 10,000+ giờ phân tích dữ liệu ngôn ngữ tự nhiên đa lĩnh vực
- Dữ liệu giải trình tự toàn bộ 1000 hệ gene người Việt, với nền tảng hạ tầng 3.500+ Terabyte
- Hàng triệu dữ liệu hình ảnh y tế thu thập từ các bệnh viện khắp Việt Nam
Cùng với năng lực phân tích, tính toán, xử lý dữ liệu lớn, đây là tiền đề để phát triển thành công các giải pháp công nghệ “am hiểu” thói quen của người tiêu dùng Việt Nam, phục vụ đắc lực cho cộng đồng Việt và tạo ra lợi thế cạnh tranh so với các sản phẩm công nghệ cùng loại trên thị trường trong nước và quốc tế.