Luận Án Tiến Sĩ Nghiên Cứu Phương Pháp Chuẩn Hoá Văn Bản Và Nhận Dạng Thực Thể Định Danh Trong Nhận Dạng Tiếng Nói

Discussion in 'Chuyên Ngành Khoa Học Máy Tính' started by quanh.bv, Jun 24, 2024.

  1. quanh.bv

    quanh.bv Administrator Quản Trị Viên

    upload_2024-6-24_3-37-22.png
    Nghiên Cứu Phương Pháp Chuẩn Hoá Văn Bản Và Nhận Dạng Thực Thể Định Danh Trong Nhận Dạng Tiếng Nói Tiếng Việt
    1 - Xây dựng các bộ dữ liệu ban đầu phục vụ cho thực nghiệm các mô hình chuẩn hoá và nhận dạng thực thể định danh cho văn bản đầu ra của hệ thống ASR tiếng Việt.
    2 - hiết kế mô hình Transformer Encoder – CRF cho bài toán khôi phục viết hoa và dấu câu cho văn bản đầu ra của ASR tiếng Việt. Đề xuất cách phân chia, hợp nhất các đoạn chồng lấn, giúp các từ xung quanh đoạn cắt có nhiều ngữ cảnh để nhận dạng chính xác.
    3 - Đề xuất mô hình biểu diễn ngôn ngữ tiền huấn luyện cho văn bản tiếng Việt với tên gọi ViBERT dựa theo kiến trúc RoBERTa, giúp tăng hiệu quả áp dụng các thuật toán học sâu trong XLNNTN tiếng Việt.
    4 - Xây dựng mô hình đường ống cho bài toán NER tiếng nói tiếng Việt. Nghiên cứu cho thấy tác động hiệu quả của mô hình ViBERT khi áp dụng cho nhiệm vụ NER trên văn bản đầu ra của ASR tiếng Việt. Đồng thời nghiên cứu cũng chứng tỏ được việc kết hợp mô hình CaPu vào chuẩn hóa văn bản đầu vào cho mô hình NER giúp cải thiện đáng kể hiệu suất của mô hình.
    Thiết kế mô hình E2E giải quyết bài toán NER cho tiếng nói tiếng Việt kết hợp các kỹ thuật chia sẻ tham số, kỹ thuật huấn luyện đa tác vụ. Bên cạnh việc cho thấy đạt hiệu suất tương đương mô hình đường ống, mô hình E2E còn có ưu thế trong triển khai trong thực tiễn.
    • Luận án tiến sĩ tin học
    • Chuyên ngành Khoa học máy tính
    • Người hướng dẫn: PGS.TS. Lương Chi Mai, TS. Nguyễn Thị Minh Huyền
    • Tác giả: Nguyễn Thị Thu Hiền
    • Số trang: 124
    • File PDF-TRUE
    • Ngôn ngữ: Tiếng Việt
    • Học viện Khoa học và Công nghệ 2023
    Link Download
    https://luanvan.moet.gov.vn/?page=1.3&view=42538
    https://drive.google.com/file/d/1WCbXBdhmPkf6gZeDv31UBJRX7jcSxSro
    https://drive.google.com/drive/folders/1yLBzZ1rSQoNjmWeJTM6cEZ3WGQHg04L1
     

Share This Page