Luận Văn Thạc Sĩ Xây Dựng Hệ Thống Trích Chọn Tên Riêng Cho Văn Bản Tiếng Việt Bằng Phương Pháp Học Thống Kê

Discussion in 'Chuyên Ngành Công Nghệ Thông Tin' started by nhandang123, Aug 8, 2016.

  1. nhandang123

    nhandang123 Guest

    [​IMG]
    Xây Dựng Hệ Thống Trích Chọn Tên Riêng Cho Văn Bản Tiếng Việt Bằng Phương Pháp Học Thống Kê
    Trong luận văn này, tôi trình bày một số giải pháp cho bài toán trích chọn tên riêng cho các văn bản tiếng Việt trên môi trường Web . Sau khi xem xét các hướng tiếp câṇ khác nhau, tôi chọn phương pháp tiếp câṇ hoc̣ thống kê để tiến hành xây dựng hệ trích chọn tên riêng cho Văn bản tiếng Việt. Ưu điểm của phương pháp học thống kê là: dễ thu thập dữ liệu, dễ mô tả đối tượng trích chọn, và có hiệu năng phù hợp với yêu cầu đặt ra cho luận văn. Mô tả khái quát bài toán và cách thức xây dựng hệ trích chọn thông tin. Trình bày khái niệm, cách thức và các ưu nhược điểm của các phương pháp học thống kê như: HMMs, CRFs và perceptron, đồng thời xây dựng hệ trích chọn tên riêng cho văn bản tiếng Việt vào CRFs và thuật toán percenptron; Mô tả cách thức xây dựng một hệ trích chọn tên riêng trong văn bản tiếng Việt sử dụng công cụ CRF++ của Taku Kudo và đưa ra một số kết qủa thực nghiệm mô hình xây dựng được.
    • Luận văn thạc sĩ
    • Chuyên ngành Công nghệ thông tin
    • Người hướng dẫn khoa học: TS. Nguyễn Lê Minh
    • Tác giả: Nguyễn Thị Quyên
    • Số trang: 92
    • Kiểu file: PDF
    • Ngôn ngữ: Tiếng Việt
    • Đại học Quốc gia Hà Nội 2007
    Link Download
    http://dlib.vnu.edu.vn/iii/cpro/DigitalItemViewPage.external?lang=vie&sp=1007881
    https://drive.google.com/drive/folders/1yLBzZ1rSQoNjmWeJTM6cEZ3WGQHg04L1
     
    Last edited by a moderator: Sep 25, 2017

Share This Page