Làm thế nào để khắc phục các bộ dữ liệu ảnh y tế quy mô nhỏ?

Việc đào tạo mạng nơ-ron thường yêu cầu một lượng lớn dữ liệu. Càng nhiều dữ liệu hình ảnh y tế được đưa vào huấn luyện thì mô hình càng có khả năng nhận ra các biểu hiện khác nhau của bệnh. Ví dụ, để phát triển một mô hình tự động phân loại khối u não trên ảnh cộng hưởng từ (MRI), một bộ dữ liệu đào tạo lý tưởng sẽ bao gồm hình ảnh của khối u ở nhiều kích thước và trong các vùng giải phẫu khác nhau của não. Tuy nhiên, thực tế rất khó để có được một bộ dữ liệu ảnh não đa dạng như vậy. Điều này xảy ra tương tự với nhiều bộ dữ liệu ảnh y tế khác.

Khó khăn khi xây dựng bộ dữ liệu ảnh y tế

Hiện nay, vì nhiều lý do khác nhau mà việc tiếp cận hoặc xây dựng các bộ dữ liệu ảnh y tế quy mô lớn là không hề dễ dàng. Nguyên nhân thứ nhất đến từ quá trình dán nhãn và chuẩn hóa dữ liệu. Để các mô hình học máy có thể đưa ra chẩn đoán bệnh một cách chính xác, bộ dữ liệu cần được chú giải bởi đội ngũ chuyên gia y khoa giàu kinh nghiệm. Tuy nhiên, việc dán nhãn thủ công tốn nhiều thời gian. Chính vì thế, hầu hết các bộ dữ liệu chuẩn hoá, có dãn nhãn bởi chuyên gia hình ảnh y tế đều có quy mô nhỏ.

Thứ hai, thách thức đến từ những hạn chế trong việc chia sẻ dữ liệu lâm sàng. Thực tế, các bộ dữ liệu hình ảnh y khoa điển hình có dán nhãn bởi chuyên gia y tế hiếm khi vượt quá quy mô 500-1000 bệnh nhân. 

07 cách để tăng cường dữ liệu hình ảnh y tế

Tăng cường hình ảnh (image augmentation) là phương pháp phổ biến giúp khắc phục tình trạng các bộ dữ liệu hình ảnh y tế có quy mô nhỏ, không đủ đáp ứng yêu cầu đào tạo mô hình học sâu. Nói một cách đơn giản, tăng cường hình ảnh có nghĩa là áp dụng các thay đổi ngẫu nhiên, từ đó làm tăng lượng biến đổi trong bộ dữ liệu. Ví dụ: nếu tổng bộ dữ liệu bao gồm 100 ảnh MRI não, sau khi áp dụng 3 thay đổi ngẫu nhiên cho mỗi ảnh, kết quả thu được sẽ là 400 hình ảnh y tế có sẵn để đào tạo.

1. Tịnh tiến hình ảnh (Translating medical images): Một trong những thao tác đơn giản nhất là tịnh tiến hình ảnh, tức là thay đổi vùng quan tâm (region of interest – ROI), đối với trung tâm của dữ liệu hình ảnh đào tạo.

2. Xoay hình ảnh (Rotating medical images): Xoay các hình ảnh đào tạo theo một góc ngẫu nhiên. Bằng cách này, hình ảnh tăng cường có thể gần giống với các ca chụp được thực hiện dưới một góc nhỏ hơn.

3. Lật hình ảnh (Flipping medical images): Nhiều cấu trúc giải phẫu có tính đối xứng – ví dụ như não và thận. Phép lật ngẫu nhiên là phương pháp lý tưởng để tăng cường những hình ảnh y tế có chứa các cấu trúc đối xứng này, từ đó, phản chiếu thông tin của ảnh theo chiều ngang hoặc chiều dọc. Đây cũng là phương pháp giúp mô hình hạn chế việc bỏ sót các tổn thương nằm ở một trong hai phía của cùng một cơ quan.

Với 03 kỹ thuật xoay/lật/tịnh tiến, các hình dạng trong ảnh không thay đổi và hình ảnh chỉ bị dịch chuyển so với vị trí ban đầu. Điều này giúp bảo tồn tốt các đặc điểm của hình ảnh gốc. 

Ví dụ về tăng cường dữ liệu ảnh y tế
Ví dụ về các thao tác tịnh tiến, xoay, lật hình ảnh y tế. Nguồn ảnh: Quantib

4. Kéo giãn hình ảnh (Stretching medical images): Các cấu trúc giải phẫu giống nhau có thể biểu hiện khác nhau giữa các lần chụp. Việc tăng cường hình ảnh dưới dạng phóng to và thu nhỏ ngẫu nhiên có khả năng bổ sung thêm bất biến cho các phiên bản này. Nếu tỷ lệ giữa tăng chiều ngang và chiều dọc không được giữ cố định, hình ảnh sẽ bị kéo giãn, do đó tạo ra nhiều phiên bản biến đổi hơn nữa. Lưu ý là không thêm các phần tăng cường không có khả năng xảy ra trong ca chụp gốc. 

5. Xén hình ảnh (Shearing medical images): Giả sử không kéo giãn hình ảnh chỉ theo một hướng, nhưng tiến hành thay đổi như sau: lấy phần trên cùng của ảnh và di chuyển nó sang bên phải; đồng thời lấy phần dưới cùng của ảnh và di chuyển nó sang bên trái. Bằng cách này, ta đã kéo giãn hình ảnh theo hai hướng ngược nhau cùng một lúc. Đây được gọi là thao tác cắt xén. 

Tăng cường hình ảnh y tế bằng cách kéo giãn
Ví dụ về thao tác kéo giãn và xén hình ảnh. Nguồn ảnh: Quantib

6. Biến dạng đàn hồi của hình ảnh (Elastic deformation of medical images): 5 kỹ thuật đã thảo luận ở trên được gọi là tăng cường tuyến tính (linear augmentation). Một trong những dạng tăng cường khắc nghiệt hơn là biến dạng đàn hồi. Nó tương tự kéo giãn hình ảnh, tuy nhiên, với nhiều tùy chọn đa dạng hơn, gần giống như việc nhào một quả bóng. Cần cẩn thận khi áp dụng kỹ thuật này vì nó rất dễ dẫn đến tình trạng hầu như không thể nhận ra dữ liệu ảnh đào tạo.

Biến dạng đàn hồi của hình ảnh y khoa
Ví dụ về biến dạng đàn hồi của hình ảnh y khoa. Nguồn ảnh: Quantib

7. Tăng độ tương phản của hình ảnh (Contrast augmentation of medical images): Hình ảnh y tế thu được từ các thiết bị khác nhau có thể khác nhau về cường độ. Để đảm bảo rằng mô hình hoạt động tốt trên các ảnh không đồng nhất như vậy, các phép tăng độ tương phản thường được áp dụng cho dữ liệu đào tạo. Cụ thể, các kỹ sư AI sẽ tiến hành một số thay đổi ngẫu nhiên trên biểu đồ các giá trị cường độ mức xám.

Tăng độ tương phản của hình ảnh y khoa
Ví dụ về tăng độ tương phản của hình ảnh y khoa. Nguồn ảnh: Quantib

Làm thế nào để áp dụng hiệu quả các kỹ thuật tăng cường hình ảnh y tế?

Sau khi chỉ ra một số phương pháp tăng cường dữ liệu hình ảnh y tế phổ biến hiện nay, câu hỏi đặt ra là làm thế nào để áp dụng các kỹ thuật này một cách tốt nhất. Cách tiếp cận đơn giản nhất là mở rộng tập dữ liệu ban đầu bằng cách thêm một số phần bổ sung cho mỗi hình ảnh y tế. Tuy nhiên, vẫn có khả năng mạng nơ-ron, trong một số trường hợp, bắt đầu nhận ra các đặc điểm riêng của tập dữ liệu, dẫn đến tình trạng “overfitting” (Khi mô hình có thể học và dự đoán tốt trên tập dữ liệu huấn luyện nhưng lại không tốt trên các tập dữ liệu kiểm thử). Do đó, một cách tiếp cận khác, phức tạp hơn là sử dụng một bộ tạo (generator) – thuật toán cụ thể để tạo ra các hình ảnh tăng cường một cách nhanh chóng. Trong quá trình huấn luyện, thuật toán này sẽ chuyển từng dữ liệu ảnh vào mạng, nhưng mỗi ảnh đều được tăng cường trước đó bằng một trong bảy kỹ thuật đã phân tích. Bằng cách ngẫu nhiên hóa loại và mức độ tăng cường cho mỗi mẫu, thuật toán cung cấp cho mạng nơ-ron các kết hợp tăng cường dữ liệu hoàn toàn khác so với việc thao tác thủ công. Điều này thậm chí còn giúp mô hình có nhiều dữ liệu đào tạo đa dạng hơn, từ đó thường cải thiện hiệu suất thuật toán.

Tăng cường dữ liệu ảnh y tế liệu có phải phương pháp tối ưu?

Thực tế, tồn tại nhiều ý kiến khác nhau xung quanh việc các hình ảnh y tế đã trải qua phép tăng cường có nhất thiết phải giống với dữ liệu gốc không. Một số quan điểm cho rằng việc tăng cường hình ảnh giúp mạng nơ-ron tìm hiểu tốt hơn các đặc điểm chung, chẳng hạn như hình dạng và đường cong thể hiện ranh giới của các cấu trúc giải phẫu, thay vì tập trung quá nhiều vào đặc điểm cụ thể của từng hình ảnh riêng lẻ. Đặc biệt, các lớp đầu tiên của mạng nơ-ron thường tìm kiếm những đặc điểm cơ bản của ảnh, những đặc điểm này vẫn được bảo toàn ngay cả khi thực hiện các phép tăng cường. Nói chung, tăng cường tuyến tính là một cách tiếp cận an toàn hơn, vì nó tốt hơn trong việc bảo tồn các đặc điểm của hình ảnh gốc. 

Cuối cùng, mặc dù các kỹ thuật tăng cường rất hữu ích trong việc cải thiện quy mô tập dữ liệu một cách nhân tạo, song, yếu tố quan trọng và tối ưu hơn cả vẫn là các bộ dữ liệu hình ảnh y tế được chú giải chính xác.

Bắt nguồn từ thực tế này, VinBigdata phát triển VinDr Lab, chia sẻ cùng cộng đồng các bộ dữ liệu X-quang lồng ngực (VinDr-CXR), X-quang cột sống (VinDr-SpineXR) và cung xương sườn (VinDr-RibCXR) quy mô khoảng 29,000 ảnh. Bộ dữ liệu ảnh y tế được thu thập tại các hệ thống bệnh viện cả trong nước, thể hiện các đặc điểm sinh lý, giải phẫu của người Việt, đồng thời được dán nhãn bởi đội ngũ bác sĩ chẩn đoán hình ảnh giàu kinh nghiệm. Tháng 10 tới đây, VinDr Lab sẽ được bổ sung bộ dữ liệu X-quang nhi (quy mô khoảng 5,000 ảnh), phục vụ cộng đồng cùng truy cập, tham khảo và nghiên cứu.

Công cụ hỗ trợ chẩn đoán nâng cao được tích hợp trên VinDr PACS
Công cụ hỗ trợ chẩn đoán nâng cao được tích hợp trên VinDr PACS

Bên cạnh VinDr Lab, VinDr PACS – Giải pháp quản lý ảnh y tế thông minh cũng đang được mở để cộng đồng trải nghiệm trực tuyến. VinDr PACS hỗ trợ đọc ảnh DICOM, với đa dạng các thao tác xử lý, dán nhãn dữ liệu hình ảnh y tế, đồng thời, giúp các bác sĩ có thể xem toàn bộ thông tin DICOM về ca chụp. Đặc biệt, hệ thống tích hợp 3D và công cụ chẩn đoán nâng cao (CAD). Giải pháp có thể phát hiện và khoanh vùng tổn thương trên 7 loại ảnh: X-quang lồng ngựcX-quang tuyến vú, X-quang cột sống, CT lồng ngực, CT gan mật, CT não và MRI não, với tổng cộng gần 70 loại bất thường phổ biến. 

Chế độ xem 3D trên VinDr PACS
Đối với tính năng đọc ảnh DICOM, VinDr PACS hỗ trợ chế độ xem 3D giúp định vị chính xác vùng tổn thương

Qua đó, VinBigdata kỳ vọng từng bước tháo gỡ những khó khăn của cộng đồng nghiên cứu AI trong và ngoài nước đối với việc tiếp cận và xây dựng các bộ dữ liệu ảnh y tế quy mô lớn và được chuẩn hóa. Nếu quan tâm, bạn cũng có thể tìm hiểu và trải nghiệm toàn bộ hệ sinh thái VinDr tại đây.

Nguồn tham khảo: Quantib

Bình luận

Địa chỉ email của bạn sẽ không được công bố. Các trường bắt buộc được đánh dấu

Bài viết liên quan

    Cảm ơn bạn đã quan tâm và ủng hộ.

    File hiện tại không thể tải xuống
    Vui lòng liên hệ hỗ trợ.

    VinOCR eKYC
    Chọn ảnh từ máy của bạn

    Chọn ảnh demo dưới đây hoặc tải ảnh lên từ máy của bạn

    Tải lên ảnh CMND/CCCD/Hộ chiếu,...

    your image
    Chọn ảnh khác
    Tiến hành xử lý
    Thông tin đã được xử lý
    Mức độ tin cậy: 0%
    • -
    • -
    • -
    • -
    • -
    • -
    • -
    • -
    • -
    • -
    • -
    • -
    • -
    Xác thực thông tin thẻ CMND/CCCD

    Vui lòng sử dụng giấy tờ thật. Hãy đảm bảo ảnh chụp không bị mờ hoặc bóng, thông tin hiển thị rõ ràng, dễ đọc.

    your image
    Chọn ảnh khác

    Ảnh mặt trước CMND/CCCD

    your image
    Chọn ảnh khác

    Ảnh mặt sau CMND/CCCD

    your image
    Chọn ảnh khác

    Ảnh chân dung

    This site is registered on wpml.org as a development site.