Luận Văn Thạc Sĩ Phân Đoạn Từ Tiếng Việt

Discussion in 'Chuyên Ngành Công Nghệ Thông Tin' started by nhandanglv123, Mar 8, 2020.

  1. nhandanglv123

    nhandanglv123 Moderator

    [​IMG]
    Phân Đoạn Từ Tiếng Việt
    Không giống như tiếng Anh, phân đoạn từ trong ngôn ngữ tiếng Việt, cũng như hầu hết các ngôn ngữ ở châu Á, là một công việc hết sức phức tạp.Vì bản thân ngôn ngữ không có những dấu hiệu rõ ràng để phân cách các từ với nhau, chẳng hạn như khoảng trắng. Đã có rất nhiều nghiên cứu với nhiều hướng tiếp cận khác nhau về công việc này. Tuy nhiên theo khảo sát, đại đa số các nghiên cứu đều xuất phát từ ba hướng tiếp cận chính: hướng tiếp cận dựa trên từ điển, hướng tiếp cận dựa trên mô hình thống kê và hướng tiếp cận lai. Rất nhiều nghiên cứu đã chọn hướng tiếp cận dựa trên từ điển vì tính đơn giản của nó. Hướng tiếp cận này thường sử dụng từ điển kết hợp với một số thuật toán so khớp như: Maximum matching (MM), Longest matching (LM), v.v... để phân đoạn từ. Tuy nhiên hướng tiếp cận này thường gây ra nhiều nhập nhằng khi phân đoạn và không thể phân đoạn đúng cho các từ không có trong từ điển.
    • Luận văn thạc sĩ tin học
    • Chuyên ngành Công nghệ thông tin
    • Người hướng dẫn: TS. Nguyễn Chí Hiếu
    • Tác giả: Lê Minh Hiếu
    • Số trang: 69
    • Kiểu file: PDF
    • Ngôn ngữ: Tiếng Việt
    • Đại Học Công Nghệ TP. Hồ Chí Minh 2015
    Link Download
    http://data.lib.hutech.edu.vn/Bookdetails.aspx?id=99976
    https://drive.google.com/uc?id=1aYPp1gwLCrw9YdzsLo4I7TenHDlkrz65
    https://drive.google.com/drive/folders/1yLBzZ1rSQoNjmWeJTM6cEZ3WGQHg04L1
     

Share This Page