Khám phá Liquid Neural Networks trong thị giác máy tính

Nghiên cứu và ứng dụng trí tuệ nhân tạo (AI) thường liên quan đến việc xây dựng và đào tạo mạng thần kinh sâu (deep neural networks). Trước khi liquid neural networks xuất hiện, tất cả các hệ thống học sâu này đều có chung một nhược điểm: chúng học một ánh xạ cố định từ dữ liệu đầu vào đến dự đoán đầu ra, do đó, không thể đáp ứng với sự thay đổi của môi trường.

Hơn nữa, hầu hết các mô hình học sâu đều độc lập và không phụ thuộc vào ngữ cảnh. Ví dụ: khi áp dụng mô hình phân loại hoặc phát hiện đối tượng cho video, video sẽ được xử lý từng khung hình mà không dựa vào ngữ cảnh xung quanh.

Để khắc phục hạn chế này, các kỹ sư AI thường thu thập những bộ dữ liệu quy mô lớn, mang tính đại diện và thực hiện quá trình học chủ động (active learning) nhằm liên tục cải thiện hệ thống thông qua các chu kỳ đào tạo lại khi phát hiện những trường hợp mới.

Quy trình học chủ động. Nguồn ảnh: Towards Data Science

Tuy nhiên, quy trình trên đòi hỏi phải tiến hành gán nhãn, đào tạo và triển khai lại, do đó, tốn nhiều thời gian và nguồn lực. Trong tình huống này, còn gì tuyệt vời hơn là một mô hình biết học cách thích ứng với những tình huống mới?

Đây là lúc Liquid Neural Network xuất hiện. FriData sẽ cùng bạn khám phá “bí mật” đằng sau sự ưu việt của Liquid Neural Network trong thị giác máy tính nhé!

Thiết kế của Liquid Neural Network 

Liquid Neural Network là một dạng recurrent neural network (mạng thần kinh hồi quy – RNN) xử lý dữ liệu theo chuỗi thời gian. RNN đã chứng minh được hiệu suất mạnh mẽ và khả năng dự đoán dựa trên các chuỗi như luồng văn bản hoặc chuỗi thời gian của các phép đo khoa học.

Kiến trúc mạng thần kinh hồi quy. Nguồn ảnh: Towards Data Science

RNN vượt quá hiệu suất của các mạng thần kinh truyền thẳng (feedforward neural networks) thông thường khi dữ liệu đầu vào là một chuỗi. Bởi lẽ, RNN có thể theo dõi thông tin liên quan ở các phần khác nhau của chuỗi một cách hiệu quả.

Liquid Neural Network được xây dựng dựa trên RNN bằng cách tạo các trạng thái ẩn thay đổi theo hằng số thời gian trong chuỗi thời gian. Ở mỗi bước, Liquid Neural Network tính toán cả kết quả dự đoán cũng như sự hình thành trạng thái ẩn tiếp theo phát triển theo thời gian.

Thuật toán Liquid Neural Network. Nguồn ảnh: Towards Data Science

Tiềm năng của Liquid Neural Network 

Liquid Neural Network được chứng minh là cải thiện mô hình chuỗi thời gian ứng dụng ở nhiều lĩnh vực khác nhau, chẳng hạn theo dõi cử chỉ, hoạt động của con người, sự thay đổi của hệ thống giao thông, năng lượng, ôzôn. Những kết quả ban đầu hứa hẹn tiềm năng triển khai Liquid Neural Network trong thực tế.

Mục tiêu dài hạn của Liquid Neural Network là hình thành một hệ thống linh hoạt theo bối cảnh và thời gian, cuối cùng thậm chí không cần phải cải tiến liên tục thông qua học chủ động.

Liquid Neural Network tác động đến thị giác máy tính như thế nào?

Về lâu dài, các kiến trúc như Liquid Neural Network có thể cải thiện đáng kể khả năng đào tạo các mô hình thích ứng (resilient models) trong xử lý video, khiến chúng trở nên linh hoạt hơn trước các biến đổi của môi trường.

Tuy nhiên, tác động của Liquid Neural Network đối với thị giác máy tính còn là một chặng đường dài. Các thử nghiệm ban đầu trong kho lưu trữ Liquid Neural Network đều dựa trên chuỗi thời gian, không dựa trên hình ảnh và video.

Processed files: 1. Vectorial velocity of left hand (x coordinate) 2. Vectorial velocity of left hand (y coordinate) 3. Vectorial velocity of left hand (z coordinate) 4. Vectorial velocity of right hand (x coordinate) 5. Vectorial velocity of right hand (y coordinate) 6. Vectorial velocity of right hand (z coordinate) 7. Vectorial velocity of left wrist (x coordinate) 8. Vectorial velocity of left wrist (y coordinate)

Ví dụ về dữ liệu chuỗi thời gian trong Liquid Neural Network 

Như vậy, Liquid Neural Network là một bước đột phá mới trong RNN, tạo ra một mô hình áp dụng linh hoạt theo thời gian. Tuy nhiên, nghiên cứu đang được tiến hành và có thể sẽ mất một thời gian trước khi chúng ta thấy được tác động của các mạng này đối với lĩnh vực thị giác máy tính.

Bình luận

Địa chỉ email của bạn sẽ không được công bố. Các trường bắt buộc được đánh dấu

Bài viết liên quan

    Cảm ơn bạn đã quan tâm và ủng hộ.

    File hiện tại không thể tải xuống
    Vui lòng liên hệ hỗ trợ.

    VinOCR eKYC
    Chọn ảnh từ máy của bạn

    Chọn ảnh demo dưới đây hoặc tải ảnh lên từ máy của bạn

    Tải lên ảnh CMND/CCCD/Hộ chiếu,...

    your image
    Chọn ảnh khác
    Tiến hành xử lý
    Thông tin đã được xử lý
    Mức độ tin cậy: 0%
    • -
    • -
    • -
    • -
    • -
    • -
    • -
    • -
    • -
    • -
    • -
    • -
    • -
    Xác thực thông tin thẻ CMND/CCCD

    Vui lòng sử dụng giấy tờ thật. Hãy đảm bảo ảnh chụp không bị mờ hoặc bóng, thông tin hiển thị rõ ràng, dễ đọc.

    your image
    Chọn ảnh khác

    Ảnh mặt trước CMND/CCCD

    your image
    Chọn ảnh khác

    Ảnh mặt sau CMND/CCCD

    your image
    Chọn ảnh khác

    Ảnh chân dung

    This site is registered on wpml.org as a development site.