Phân Đoạn Từ Tiếng ViệtKhông giống như tiếng Anh, phân đoạn từ trong ngôn ngữ tiếng Việt, cũng như hầu hết các ngôn ngữ ở châu Á, là một công việc hết sức phức tạp.Vì bản thân ngôn ngữ không có những dấu hiệu rõ ràng để phân cách các từ với nhau, chẳng hạn như khoảng trắng. Đã có rất nhiều nghiên cứu với nhiều hướng tiếp cận khác nhau về công việc này. Tuy nhiên theo khảo sát, đại đa số các nghiên cứu đều xuất phát từ ba hướng tiếp cận chính: hướng tiếp cận dựa trên từ điển, hướng tiếp cận dựa trên mô hình thống kê và hướng tiếp cận lai. Rất nhiều nghiên cứu đã chọn hướng tiếp cận dựa trên từ điển vì tính đơn giản của nó. Hướng tiếp cận này thường sử dụng từ điển kết hợp với một số thuật toán so khớp như: Maximum matching (MM), Longest matching (LM), v.v... để phân đoạn từ. Tuy nhiên hướng tiếp cận này thường gây ra nhiều nhập nhằng khi phân đoạn và không thể phân đoạn đúng cho các từ không có trong từ điển. Luận văn thạc sĩ tin học Chuyên ngành Công nghệ thông tin Người hướng dẫn: TS. Nguyễn Chí Hiếu Tác giả: Lê Minh Hiếu Số trang: 69 Kiểu file: PDF Ngôn ngữ: Tiếng Việt Đại Học Công Nghệ TP. Hồ Chí Minh 2015 Link Download http://data.lib.hutech.edu.vn/Bookdetails.aspx?id=99976 https://drive.google.com/uc?id=1aYPp1gwLCrw9YdzsLo4I7TenHDlkrz65https://drive.google.com/drive/folders/1yLBzZ1rSQoNjmWeJTM6cEZ3WGQHg04L1