Tổng quan về hệ thống hiểu ngôn ngữ tự nhiên (NLU)

hệ thống hiểu ngôn ngữ tự nhiên

Hiểu ngôn ngữ là một nhóm các kỹ thuật trong xử lý ngôn ngữ tự nhiên, sử dụng các thuật toán để trích xuất các thông tin cần thiết từ đầu vào là các câu được trình bày dưới dạng văn bản hoặc giọng nói. Hệ thống hiểu ngôn ngữ tự nhiên (Natural Language Understanding – NLU) thường được ứng dụng để tạo ra các bot hỗ trợ trò chuyện và tương tác với người dùng mà không cần có sự giám sát. 

Vậy một hệ thống NLU hoạt động như thế nào và điểm khác biệt của NLU so với NLP và NLG là gì? Bài viết dưới đây sẽ giải đáp những câu hỏi đó và cung cấp cái nhìn tổng quan nhất về một hệ thống NLU. 

Phương thức hoạt động của hệ thống hiểu ngôn ngữ tự nhiên (NLU)

Các hệ thống NLU sử dụng các mô hình và thuật toán để trích xuất và phân tích thông tin từ một câu. Hay nói cách khác, đầu vào của hệ thống này là một tập các câu hoặc đoạn văn bản và đầu ra là một tập dữ liệu có cấu trúc trong đó chứa các giá trị tương ứng với các trường thông tin mà hệ thống muốn trích xuất. Về cơ bản, một hệ thống NLU thường có 2 thành phần chính đó là nhận dạng ý định và nhận dạng thực thể.

Nhận dạng ý định là quá trình xác định mục đích giao tiếp của người dùng thông qua câu nói của họ. Đây là bước đầu tiên và quan trọng nhất của NLU vì bước này xác định ý nghĩa của thông tin người dùng đưa ra.

Nhận dạng thực thể là một khái niệm trong NLU tập trung vào việc xác định các thực thể trong một thông điệp, sau đó trích xuất thông tin quan trọng nhất về các thực thể đó. Có hai loại thực thể: thực thể được đặt tên và thực thể số. Các thực thể được đặt tên ví dụ như tên người, tên địa điểm, tên tổ chức được hệ thống xác định và phân loại theo các loại đã được định nghĩa trước. Các thực thể số bao gồm số, đơn vị tiền tệ và tỷ lệ phần trăm, v.v..

Ví dụ: yêu cầu cho một chuyến đi cắm trại trên đảo Vancouver vào ngày 18 tháng 8 có thể được chia nhỏ như sau: vé phà [ý định] / nhu cầu: đặt trước lô đất cắm trại [ý định] / Đảo Vancouver [địa điểm] / 18 tháng 8 [ngày ].

So sánh hệ thống hiểu ngôn ngữ (NLU) với xử lý ngôn ngữ tự nhiên (NLP) và tạo ngôn ngữ tự nhiên (NLG) 

Hệ thống hiểu ngôn ngữ (NLU) là một tập hợp con của xử lý ngôn ngữ tự nhiên (Natural Language Processing – NLP). Mục đích của NLP là phân tích và xử lý thông tin từ một tài liệu nhất định, còn mục đích của NLU là khả năng thực hiện một cuộc hội thoại với máy tính bằng ngôn ngữ tự nhiên.

Mặc dù cả NLU và NLP đều được phát triển để hiểu ngôn ngữ tự nhiên của con người nhưng điểm khác biệt là NLU được sử dụng để hiểu ý định của từng cá nhân thông qua cách họ giao tiếp. Ngoài việc hiểu các từ và giải thích nghĩa, NLU cũng được lập trình để hiểu ý nghĩa đối thoại kể cả trong trường hợp người dùng gặp lỗi giao tiếp, chẳng hạn như phát âm sai hoặc các chữ cái và từ bị chuyển đổi.

Một tập hợp con khác của NLP là tạo ngôn ngữ tự nhiên (Natural Language Generation – NLG). NLG cho phép máy tính tự động tạo ra văn bản ngôn ngữ tự nhiên, bắt chước cách con người giao tiếp – một sự khác biệt so với những loại văn bản máy móc truyền thống.

Nội dung do máy tính tạo ra thường thiếu tính linh hoạt, cảm xúc và tính cách trong khi nội dung do con người tạo ra vô cùng thú vị và hấp dẫn. Tuy nhiên, với NLG, máy tính có thể tạo ra văn bản giống con người theo cách mô phỏng những câu mà con người viết. Điều này được thực hiện bằng cách xác định chủ đề chính của tài liệu đầu vào, sau đó sử dụng NLP để phân tích và tạo ra văn bản mang hơi hướng tương tự.

Ví dụ: sử dụng NLG, máy tính có thể tự động tạo một bài báo dựa trên một tập hợp dữ liệu được thu thập về một sự kiện cụ thể hoặc tạo ra một lá thư bán hàng về một sản phẩm cụ thể dựa trên các thuộc tính của sản phẩm đã được cung cấp.

Ứng dụng của hệ thống hiểu ngôn ngữ NLU 

Hệ thống tổng đài tự động (IVR) và định tuyến tin nhắn. 

Hệ thống tổng đài tự động (Interactive Voice Response – IVR) được sử dụng để tự phục vụ và định tuyến cuộc gọi. Các tính năng NLP và NLU mở rộng khả năng của IVR bằng cách hỗ trợ người dùng tương tác với hệ thống điện thoại thông qua giọng nói. Hệ thống xử lý tiếng nói của người dùng, chuyển đổi các từ thành văn bản, sau đó phân tích cấu trúc ngữ pháp của câu để xác định ý định giao tiếp của người dùng.

Hỗ trợ khách hàng thông qua trợ lý cá nhân thông minh. 

NLU là công nghệ đằng sau chatbot hay voicebot, các chương trình máy tính có thể trò chuyện với con người bằng ngôn ngữ tự nhiên thông qua văn bản hoặc giọng nói. Những trợ lý cá nhân thông minh này đang trở thành xu hướng và cải thiện trải nghiệm khách hàng cho doanh nghiệp. 

Dịch máy. 

Học máy (Machine Learning – ML) là một nhánh của trí tuệ nhân tạo cho phép máy tính học và thay đổi hành vi dựa trên dữ liệu đào tạo. Các thuật toán học máy cũng được sử dụng để tạo văn bản ngôn ngữ tự nhiên. Trong trường hợp dịch thuật, một thuật toán học máy sẽ phân tích hàng triệu trang văn bản – chẳng hạn như hợp đồng hoặc tài liệu tài chính – để tìm hiểu cách dịch chúng sang một ngôn ngữ khác. Càng phân tích nhiều tài liệu thì bản dịch càng chính xác. 

Thu thập dữ liệu. 

Thu thập dữ liệu là quá trình thu thập và ghi lại thông tin về một đối tượng, con người hoặc sự kiện. Ví dụ: nếu một công ty thương mại điện tử sử dụng NLU, nó có thể yêu cầu khách hàng nhập thông tin giao hàng và thanh toán của họ bằng lời nói. Phần mềm sẽ hiểu ý khách hàng và ghi nhận thông tin tự động vào hệ thống.

Các giao diện hội thoại. 

Nhiều thiết bị được kích hoạt bằng giọng nói – như loa thông minh, điện thoại thông minh – cho phép người dùng giao tiếp và yêu cầu các thiết bị thực hiện tác vụ thông qua lời nói. Bằng cách sử dụng NLU, các giao diện trò chuyện có thể hiểu và phản hồi với người dùng bằng cách phân đoạn các từ và câu, nhận dạng ngữ pháp và sử dụng kiến ​​thức ngữ nghĩa để suy ra ý định.

Trên đây chỉ là một trong số rất nhiều những ứng dụng hữu ích của hệ thống hiểu ngôn ngữ (NLU). Trong kỷ nguyên giọng nói, NLU ngày càng trở nên gần gũi và quen thuộc với cuộc sống của con người, thông qua các hệ thống điều khiển bằng giọng nói của các thiết bị thông minh. Cuộc sống sẽ trở nên dễ dàng, thuận tiện và đầy màu sắc. 

Hiểu ngôn ngữ là một trong những kỹ thuật được VinBigData ứng dụng để phát triển trợ lý ảo dành riêng cho người Việt ViVi. Trợ lý ảo ViVi hiện đang được tích hợp trên ô tô điện thông minh VF e34, với lợi thế nổi bật về công nghệ giọng nói tiếng Việt, tính bản địa hóa và ngôn ngữ vùng miền. Hệ thống Hiểu ngôn ngữ tự nhiên (NLU) sau thời gian triển khai trên VF e34 đã ghi nhận những kết quả vượt trội. Điển hình, nhận diện chính xác ý định người dùng hơn 90% với tốc độ xử lý dưới 100 ms.
Tìm hiểu thêm về ViVi: Tại đây

Tài liệu tham khảo: Tech Target 

Bài viết liên quan

    Cảm ơn bạn đã quan tâm và ủng hộ.

    File hiện tại không thể tải xuống
    Vui lòng liên hệ hỗ trợ.

    VinOCR eKYC

    Chọn ảnh từ máy của bạn

    Chọn ảnh demo dưới đây hoặc tải ảnh lên từ máy của bạn

    Tải lên ảnh CMND/CCCD/Hộ chiếu,...

    your image
    Chọn ảnh khác
    Tiến hành xử lý

    Thông tin đã được xử lý

    Mức độ tin cậy: 0%

    • -
    • -
    • -
    • -
    • -
    • -
    • -
    • -
    • -
    • -
    • -
    • -
    • -

    Xác thực thông tin thẻ CMND/CCCD

    Vui lòng sử dụng giấy tờ thật. Hãy đảm bảo ảnh chụp không bị mờ hoặc bóng, thông tin hiển thị rõ ràng, dễ đọc.

    your image
    Chọn ảnh khác

    Ảnh mặt trước CMND/CCCD

    your image
    Chọn ảnh khác

    Ảnh mặt sau CMND/CCCD

    your image
    Chọn ảnh khác

    Ảnh chân dung

    This site is registered on wpml.org as a development site.