Các hệ thống Camera giám sát thông minh (Smart Camera) đang có xu thế được triển khai rộng rãi ở nhiều địa điểm trên thế giới, đặc biệt ở các cơ sở hạ tầng công cộng hay trung tâm mua sắm. Chúng được sử dụng với nhiều mục đích khác nhau như theo dõi lượng ra vào của khách hàng, kiểm tra gian hàng, giám sát an ninh,…
Tiềm năng thị trường của Camera thông minh ngày càng được mở rộng bởi những tiến bộ công nghệ thông tin và trí tuệ nhân tạo. Giờ đây chúng được xử lý bằng các thuật toán tiên tiến và có khả năng thực hiện nhiều tác vụ chuyên sâu như: Phân tích và phát hiện đối tượng, nhận diện khuôn mặt, thống kê lưu lượng khách hàng,… Bài viết dưới đây cung cấp một số công nghệ điển hình sử dụng trong các Hệ thống Camera thông minh để mang tới các tính năng đột phá.
Công nghệ nhận diện và xác thực khuôn mặt (Face Recognition & Identification) trong camera thông minh
Hệ thống nhận dạng khuôn mặt hoạt động bằng cách ghi lại hình ảnh hai chiều hoặc ba chiều của đối tượng trên camera, tùy vào từng trường hợp cụ thể. Những dữ liệu hình ảnh này được lưu trữ trên máy chủ và tiến hành so sánh với thông tin liên quan trong cơ sở dữ liệu trong thời gian thực. Trong thuật toán sử dụng những phân tích toán học và sinh trắc học liên quan đến hình ảnh. Nhờ sử dụng trí tuệ nhân tạo (AI) và công nghệ học máy, hệ thống nhận dạng khuôn mặt có thể hoạt động với các tiêu chuẩn an toàn và độ tin cậy cao nhất.
Quy trình của công nghệ này có thể bao gồm những bước như sau:
- Tiến hành thu lại dữ liệu hình ảnh khuôn mặt từ camera (có thể là ảnh chụp tĩnh hoặc video động). Tuy nhiên các dữ liệu hình ảnh khi đối tượng nhìn về phía camera sẽ mang lại tính chính xác cao hơn.
- Phần mềm nhận dạng khuôn mặt tiến hành đọc hình dạng khuôn mặt của đối tượng. Các yếu tố chính được quan tâm bao gồm khoảng cách giữa hai mắt và khoảng cách từ trán đến cằm. Phần mềm xác định điểm mốc trên khuôn mặt, đây là chìa khóa để phân biệt khuôn mặt của các đối tượng khác nhau.
- Điểm mốc để nhận diện trên khuôn mặt của đối tượng bạn được đưa vào các thuật toán và mô hình để so sánh với cơ sở dữ liệu về các khuôn mặt có sẵn.
- Trả ra kết quả sau khi khớp khuôn mặt của đối tượng trong camera với dữ liệu khuôn mặt sẵn có trong cơ sở dữ liệu của hệ thống nhận dạng khuôn mặt.
Công nghệ chống giả mạo khuôn mặt (Face Anti-Spoofing – FAS) trong camera thông minh
Nhiều khi các hệ thống nhận diện khuôn mặt thường bị tấn công bởi các thủ thuật gian lận khác nhau, chẳng hạn như hình ảnh, video giả mạo, mặt nạ 3D và trang điểm. Công nghệ chống giả mạo khuôn mặt (FAS) đóng một vai trò quan trọng trong việc bảo mật và đảm bảo an toàn. Với thuật toán phát hiện thông minh, FAS giúp hệ thống nhận dạng khuôn mặt bảo mật tốt hơn và thu hút nhiều sự chú ý hơn từ các ngành công nghiệp khác nhau.
Một số kĩ thuật thường được áp dụng trong FAS hiện nay:
Sử dụng các tính năng học sâu (Deep Learning Features) với Mạng nơ-ron tích chập (Convolutional Neural Network – CNN)
Ở đây coi các vấn đề về chống giả mạo như một bài toán phân loại nhị phân, sử dụng huấn luyện CNN để nhận ra đâu là dữ liệu hình ảnh thật và đâu là dữ liệu hình ảnh giả mạo. Tuy nhiên, nó chỉ hoạt động với một số bộ dữ liệu nhất định trong các điều kiện cụ thể, chẳng hạn như chất lượng máy ảnh, môi trường, ánh sáng, v.v. Nếu bất kỳ điều nào trong số đó bị thay đổi – CNN sẽ không còn trả ra kết quả chính xác. Vì vậy, phương pháp này chỉ khả thi trong các trường hợp sử dụng hạn chế.
Kỹ thuật phản ứng thách thức
Kỹ thuật này sử dụng các hành động đặc trưng của con người, và coi chúng là những thách thức. Hệ thống hoạt động để xác minh rằng những thách thức đó xảy ra trong một chuỗi video được cung cấp. Hệ thống phản hồi dựa trên một loạt các thách thức đã xác định được để xác thực danh tính của một cá nhân.
Những thách thức này có thể bao gồm: Các trạng thái cười, nét mặt buồn bã hay hạnh phúc, chuyển động phần đầu.
Mặc dù mang đến nhiều hiệu quả trong việc nhận biết giả mạo nhưng phương pháp này lại yêu cầu đa dạng hơn về bộ dữ liệu đầu vào và trong một số trường hợp gây ảnh hưởng tới trải nghiệm người dùng.
Công nghệ nhận diện cảm xúc khuôn mặt trong camera thông minh
Đây là một bài toán phân lớp tương đối tiêu chuẩn, đã được nghiên cứu trong một thời gian khá dài. Một hệ thống nhận diện cảm xúc khuôn mặt thường được triển khai gồm 3 bước.
Nhận ảnh và tiền xử lý
Ảnh khuôn mặt được lấy từ nguồn dữ liệu tĩnh (chẳng hạn như từ file, database), hoặc động (từ livestream, webcam, camera,…), nguồn dữ liệu này có thể trải qua một số bước tiền xử lý nhằm tăng chất lượng hình ảnh để giúp việc phát hiện cảm xúc trở nên hiệu quả hơn.
Trích xuất các đặc trưng
Bước rất quan trọng, đặc biệt với các phương pháp truyền thống, các đặc trưng khuôn mặt được tính toán dựa trên các thuật toán có sẵn, kết quả thường là một vector đặc trưng làm đầu vào cho bước sau.
Phân lớp và nhận diện cảm xúc
Đây là một bài toán phân lớp điển hình, rất nhiều các thuật toán có thể áp dụng trong bước này như KNN (K-Nearest Neighbors), SVM (Support Vector Machine), LDA (Linear Discriminant Analysis), HMM (Hidden Markov Model),…
Các mạng học sâu được ứng dụng rộng rãi vào bài toán phát hiện cảm xúc khuôn mặt, đặc biệt các loại mạng phù hợp với việc xử lý dữ liệu hình ảnh như CNN (Convolutional Neural Network), DBN (Deep Belief Network), DAE (Deep Autoencoder).
Một số công nghệ bổ trợ khác trong camera thông minh
Ngoài ra nhờ cơ sở hạ tầng dữ liệu lớn, trí tuệ nhân tạo (AI) cùng các mô hình và thuật toán tiên tiến, ngày nay còn có nhiều công nghệ hiện đại như: Công nghệ nhận dạng độ tuổi giới tính, nhận dạng khách hàng VIP, ngăn chặn tội phạm,…
Đây đều là những sự phát triển từ hệ thống nhận diện khuôn mặt (Face Recognition). Hệ thống nhận diện khuôn mặt cho phép lưu trữ thông tin cá nhân của tất cả các đối tượng. Ngay khi nhận diện được đối tượng ra vào tòa nhà, cửa hàng, hệ thống sẽ tiến hành xử lý, phân tích độ tuổi và giới tính, trích xuất thông tin. Ngoài ra hệ thống còn tiến hành nhận diện đối tượng đáng ngờ (dựa vào cơ sở dữ liệu tội phạm), sau đó có thể báo ngay thông tin cho nhân viên bán hàng, nhà quản lý và nhân viên an ninh để có phương án xử lý kịp thời. Sử dụng nhận dạng khuôn mặt đã được chứng minh là giảm tới 91% hành vi bạo lực tại cửa hàng. Công nghệ nhận diện khuôn mặt cũng có thể xác định được hình ảnh khách hàng VIP và mã số ID của họ sau đó thông báo cho nhân viên để họ sẵn sàng tiếp đón và giúp đỡ.
Các hệ thống Camera thông minh ngày nay không chỉ giúp cho các doanh nghiệp có thể đảm bảo an ninh, thực hiện giám sát, mà còn góp phần thu thập thông tin khách hàng, tiền xử lý dữ liệu, phát hiện khách hàng VIP, khách hàng trung thành và cải thiện các phương án kinh doanh. Camera thông minh sẽ còn phát triển nhiều hơn nữa trong tương lai, khi ứng dụng của trí tuệ nhân tạo (AI) và các thuật toán học sâu (Deep Learning) đang được nghiên cứu và cải tiến từng ngày.
Hiện tại, giải pháp Camera thông minh là một trong những sản phẩm mũi nhọn tại VinBigData – Vizone. Được phát triển dựa trên trí tuệ nhân tạo (AI) và các công nghệ lõi hàng đầu, Vizone có 4 dòng sản phẩm đã được phát triển để giải quyết các bài toán khác nhau của khách hàng, với độ chính xác cao (trên 90%); được phát triển từ hơn 1.000.000 giờ dữ liệu hình ảnh được thu thập và phân tích
Tìm hiểu thêm về Vizone tại đây!
Tư liệu tham khảo: Towards Data Science