Luận Văn Thạc Sĩ Phát Triển Công Cụ Gióng Hàng Văn Bản Song Ngữ

Discussion in 'Chuyên Ngành Cơ Sở Toán Học Cho Tin Học' started by quanh.bv, Feb 4, 2018.

  1. quanh.bv

    quanh.bv Administrator Quản Trị Viên

    [​IMG]
    Phát Triển Công Cụ Gióng Hàng Văn Bản Song Ngữ
    Xử lý ngôn ngữ tự nhiên (XLNNTN) là một lĩnh vực đang phát triển mạnh mẽ. Theo tổ chức MarketsAndMarkets tổng giá trị của thị trường XLNNTN trên toàn thế giới sẽ tăng từ 7,63 tỉ đô la vào năm 2016 đến 16,07 tỷ đô-la vào năm 20211 . Các lĩnh vực nhỏ hơn trong XLNNTN hết sức đa dạng. Trong đó, dịch máy là lĩnh vực xuất hiện đầu tiên và là một trong những lĩnh vực khó nhất của XLNNTN. Để xây dựng được một hệ thống dịch máy tốt cần có một kho dữ liệu song ngữ lớn. Sau khi thu thập được kho ngữ liệu ấy, cần phải tiến hành gióng hàng nó. Gióng hàng có nghĩa là đặt tương ứng một khối văn bản với bản dịch của nó ở ngôn ngữ khác. Khối văn bản có nhiều mức như mức văn bản, mức đoạn văn, mức câu, mức cụm từ, mức từ. Trong đó gióng hàng mức câu đóng vai trò rất quan trọng. Những thuật toán và hệ thống gióng hàng mức câu đầu tiên ra đời vào những năm cuối thập kỷ 1980 và đầu 1990 ban đầu dành cho các cặp ngôn ngữ châu Âu như tiếng Anh, tiếng Pháp, tiếng Đức và mở rộng dần cho nhiều ngôn ngữ khác như tiếng Trung Quốc, tiếng Nhật Bản, tiếng Hàn. Các công trình rất đa dạng về cách tiếp cận và chất lượng càng ngày càng tốt hơn.
    • Luận văn thạc sĩ toán học
    • Chuyên ngành cơ sở toán cho tin học
    • Người hướng dẫn khoa học: TS. Nguyễn Thị Minh Huyền
    • Tác giả: Nguyễn Minh Hải
    • Số trang: 63
    • Kiểu file: PDF
    • Ngôn ngữ: Tiếng Việt
    • Đại học Quốc gia 2016
    Link Download
    http://dlib.vnu.edu.vn/iii/cpro/DigitalItemViewPage.external?lang=vie&sp=1068228
    https://drive.google.com/drive/folders/1yLBzZ1rSQoNjmWeJTM6cEZ3WGQHg04L1
     

Share This Page