Luận Văn Thạc Sĩ Nghiên Cứu Cải Tiến Một Số Phương Pháp Phân Loại Văn Bản Tự Động Và Áp Dụng Trong Xử Lý Văn Bản

Discussion in 'Chuyên Ngành Công Nghệ Phần Mềm' started by nhandang123, Aug 1, 2016.

 1. nhandang123

  nhandang123 Guest

  [​IMG]
  Nghiên Cứu Cải Tiến Một Số Phương Pháp Phân Loại Văn Bản Tự Động Và Áp Dụng Trong Xử Lý Văn Bản Tiếng Việt
  Tổng quan về phân loại văn bản (PLVB), các bước chính trong bài toán PLVB và một số phương pháp lựa chọn thuộc tính trong PLVB. Vấn đề biểu diễn văn bản trong PLVB dưới dạng vector thuộc tính và một số phương pháp giảm kích thước của không gian thuộc tính như sử dụng danh sách từ dừng, tìm gốc của từ, vấn đề trọng số và các phương pháp lựa chọn thuộc tính. Tìm hiểu các phương pháp PLVB truyền thống. Áp dụng trong PLVB tiếng Việt, đặc điểm của tiếng Việt, so sánh với các ngôn ngữ khác, thực nghiệm và kết quả thực nghiệm cho bài toán phân loại tiếng Việt. Ứng dụng phân cụm và PLVB để nâng cao độ chính xác với tập dữ liệu có nhãn nhỏ, các thuật toán tiêu biểu của phương pháp này. Trình bày việc sử dụng thuộc tính là các nhóm xâu con chính vào PLVB để tránh việc phân đoạn từ trong PLVB nhằm nâng cao độ chính xác. Giới thiệu về cài đặt các chương trình và công cụ hỗ trợ.
  • Luận văn thạc sĩ Công nghệ thông tin
  • Chuyên ngành Công nghệ phần mềm
  • Người hướng dẫn khoa học: PGS. TS. Nguyễn Ngọc Bình
  • Tác giả: Lưu Trường Huy
  • Số trang: 119
  • Kiểu file: PDF
  • Ngôn ngữ: Tiếng Việt
  • Trường Đại học Công nghệ. Đại học Quốc gia Hà Nội 2008
  Link Download
  http://dlib.vnu.edu.vn/iii/cpro/DigitalItemViewPage.external?lang=vie&sp=1002796
  https://drive.google.com/drive/folders/1yLBzZ1rSQoNjmWeJTM6cEZ3WGQHg04L1
   
  Last edited by a moderator: Aug 29, 2017

Share This Page