Phân biệt cơ bản giữa thị giác máy tính và xử lý hình ảnh

phan-biet-co-ban-thi-giac-may-tinh-va-xu-ly-hinh-anh

Mắt người có từ sáu đến bảy triệu tế bào hình nón, chứa một trong ba loại protein nhạy cảm với màu sắc được gọi là opsin. Khi các photon ánh sáng chạm vào các opsins này, chúng sẽ thay đổi hình dạng, kích hoạt một dòng chảy tạo ra các tín hiệu điện hóa, từ đó truyền các tin nhắn đến não để xử lý. 

Toàn bộ quá trình này là một hiện tượng rất phức tạp, và việc tạo ra một cỗ máy để giải thích điều này ở cấp độ giống như con người luôn là một thách thức. Đó cũng là động lực cốt lõi đằng sau hệ thống thị giác máy hiện đại, nhằm mô phỏng thị giác của con người để nhận dạng các mẫu, khuôn mặt và kết xuất hình ảnh 2D từ thế giới 3D thành 3D.

Có rất nhiều khái niệm và thuật ngữ giữa xử lý hình ảnh và thị giác máy tính thường bị hiểu nhầm và đang được sử dụng thay thế cho nhau. Trong bài viết này, VinBigData đưa ra một cái nhìn tổng quan ngắn gọn về hai lĩnh vực này, và giải thích chúng khác nhau như thế nào ở mức cơ bản.

Xử lý hình ảnh

Xử lý hình ảnh kỹ thuật số đã được tiên phong nghiên cứu tại Phòng thí nghiệm Sức đẩy Phản lực của NASA vào cuối những năm 1960, nhằm chuyển đổi tín hiệu tương tự từ tàu vũ trụ Ranger sang hình ảnh kỹ thuật số với sự cải tiến của máy tính. Giờ đây, xử lý hình ảnh kỹ thuật số có rất nhiều ứng dụng, đặc biệt chú trọng vào y học. Các ứng dụng nổi tiếng của công nghệ này bao gồm quét và siêu âm có hỗ trợ máy tính (CAT).

Xử lý hình ảnh chủ yếu liên quan đến việc sử dụng và áp dụng các hàm toán học và các phép biến đổi đối với hình ảnh. Hiểu đơn giản, nó có nghĩa là một thuật toán thực hiện một số biến đổi trên ảnh như làm mịn, làm sắc nét, tương phản, kéo giãn ảnh.

Đối với máy tính, một hình ảnh được xem là tín hiệu hai chiều, được tạo thành từ các hàng và cột pixel. Đầu vào của một dạng ảnh này đôi khi có thể được chuyển đổi thành dạng ảnh khác. Ví dụ, Hình ảnh Cộng hưởng Từ (MRI), ghi lại sự kích thích của các ion và biến nó thành hình ảnh trực quan.

Dưới đây là một ví dụ về làm mịn ảnh bằng Python:

Đối với tín hiệu một chiều, hình ảnh cũng có thể được lọc bằng nhiều bộ lọc bỏ qua phần trăm (LPF), bộ lọc cắt đi phần cao (HPF), v.v. Bộ lọc LPF giúp loại bỏ nhiễu hoặc làm mờ hình ảnh, trong khi bộ lọc HPF giúp tìm độ sắc nét trong hình ảnh.

Loại biến đổi sử dụng ma trận này khá phổ biến trong các thuật toán học máy như mạng nơ-ron tích chập (CNN). Trong đó bộ lọc được chuyển đổi trên một hình ảnh (một ma trận khác của các giá trị pixel) để phát hiện độ sắc nét hoặc cường độ màu.

Một số kỹ thuật được sử dụng trong xử lý hình ảnh kỹ thuật số bao gồm: 

  • Mô hình Markov ẩn 
  • Chỉnh sửa và phục hồi hình ảnh 
  • Lọc tuyến tính và lọc song phương 
  • Mạng nơron thần kinh (Neural networks)

Thị giác máy tính (Computer Vision)

Thị giác máy tính đến từ việc mô hình hóa quá trình xử lý hình ảnh bằng cách sử dụng các kỹ thuật của học máy. Thị giác máy tính áp dụng học máy để nhận dạng các mẫu nhằm giải thích và “phiên dịch” hình ảnh. Điều này cũng giống như quá trình suy luận trực quan của thị giác con người, chúng ta có thể phân biệt giữa các đối tượng, phân loại chúng, sắp xếp chúng theo kích thước của chúng, v.v. Thị giác máy tính, giống như xử lý hình ảnh, lấy hình ảnh làm đầu vào và đưa ra đầu ra dưới dạng thông tin về kích thước, cường độ màu, v.v.

Hệ thống không người lái của Tesla phát hiện vật thể trong tình huống sương mù. Nguồn: Bloomberg.

Dưới đây là các yếu tố của một hệ thống thị giác máy tiêu chuẩn:

  • Máy ảnh 
  • Thiết bị chiếu sáng 
  • Ống kính 
  • Phần mềm xử lý hình ảnh 
  • Các thuật toán học máy để nhận dạng mẫu 
  • Màn hình hiển thị hoặc một cánh tay robot để thực hiện một chỉ dẫn thu được từ việc giải thích hình ảnh.

Chẳng hạn, một máy quay video gắn trên ô tô không người lái phải phát hiện những người phía trước và phân biệt họ với các phương tiện và các đặc điểm khác biệt khác, sẽ cần dùng thị giác máy tính để thực hiện tác vụ này. Hoặc thị giác máy tính có thể giúp đo khoảng cách mà một người chơi quần vợt bao phủ trong một trận đấu dựa trên bản đồ nhiệt.

Bản đồ nhiệt về chuyển động của người chơi trong một trận tennis. Nguồn: Hawk-Eye.

Từ ví dụ trên, có thể nói thông tin mang tính thời gian thực đóng một vai trò quan trọng trong thị giác máy tính, giống như cách bộ mắt con người nhận diện và tìm hiểu về thế giới. 

Mục tiêu cuối cùng ở đây là sử dụng máy tính để mô phỏng thị giác của con người, bao gồm học tập và có thể đưa ra suy luận và thực hiện hành động dựa trên đầu vào trực quan.

Kết luận

Xử lý hình ảnh là một tập hợp con của thị giác máy tính. Hệ thống thị giác máy tính sử dụng các thuật toán xử lý hình ảnh để thử nghiệm và thực hiện mô phỏng tầm nhìn ở quy mô con người. Ví dụ, nếu mục tiêu là nâng cao hình ảnh để sử dụng sau này, thì điều này có thể được gọi là xử lý hình ảnh. Và nếu mục đích là để nhận ra các vật thể, khuyết tật để lái xe số tự động, thì nó có thể được gọi là thị giác máy tính.

Bài viết liên quan

    Cảm ơn bạn đã quan tâm và ủng hộ.

    File hiện tại không thể tải xuống
    Vui lòng liên hệ hỗ trợ.

    VinOCR eKYC

    Chọn ảnh từ máy của bạn

    Chọn ảnh demo dưới đây hoặc tải ảnh lên từ máy của bạn

    Tải lên ảnh CMND/CCCD/Hộ chiếu,...

    your image
    Chọn ảnh khác
    Tiến hành xử lý

    Thông tin đã được xử lý

    Mức độ tin cậy: 0%

    • -
    • -
    • -
    • -
    • -
    • -
    • -
    • -
    • -
    • -
    • -
    • -
    • -

    Xác thực thông tin thẻ CMND/CCCD

    Vui lòng sử dụng giấy tờ thật. Hãy đảm bảo ảnh chụp không bị mờ hoặc bóng, thông tin hiển thị rõ ràng, dễ đọc.

    your image
    Chọn ảnh khác

    Ảnh mặt trước CMND/CCCD

    your image
    Chọn ảnh khác

    Ảnh mặt sau CMND/CCCD

    your image
    Chọn ảnh khác

    Ảnh chân dung

    This site is registered on wpml.org as a development site.