Luận Văn Thạc Sĩ Các Phương Pháp Xác Định Mối Quan Hệ Đa Nhãn Và Ứng Dụng Trong Phân Lớp Đa Nhãn Tiếng Việt

Discussion in 'Chuyên Ngành Hệ Thống Thông Tin' started by nhandang123, Aug 16, 2016.

  1. nhandang123

    nhandang123 Guest

    [​IMG]
    Các Phương Pháp Xác Định Mối Quan Hệ Đa Nhãn Và Ứng Dụng Trong Phân Lớp Đa Nhãn Tiếng Việt
    Ngày nay với sự bùng nổ của thông tin điện tử cùng với đó nhu cầu phân loại văn bản điện tử, tìm kiếm thông tin yêu thích trên mạng gia tăng, việc gán nhãn thông tin bằng tay gặp nhiều khó khăn và tốn kém thời gian. Do vậy sự ra đời của phân lớp văn bản được xem như một chìa khóa quan trọng để giải quyết vấn đề này. Bài toán phân lớp văn bản là việc gán tên các chủ đề (tên lớp/nhãn lớp) đã được xác định trước, vào các văn bản dựa trên nội dung của chúng. Nếu mỗi văn bản chỉ thuộc vào một nhãn thì bài toán được gọi là bài toán phân lớp đơn nhãn đơn thể hiện. Tuy nhiên, trong thực tế, dữ liệu đa nhãn gặp nhiều trong thực tế hơn là dữ liệu đơn nhãn. Ví dụ, một văn bản có thể thuộc nhiều chủ đề như phần mềm, bản quyền, ăn cắp bản quyền…Trong trường hợp đó, bài toán được gọi là bài toán phân lớp đa nhãn. Với số lượng văn bản trên internet, cùng với số lượng các chủ đề (nhãn) gia tăng nhanh chóng. Bài toán phân lớp đa nhãn đặt ra hai thách thức: (1) số lượng nhãn lớn và các nhãn có mối liên hệ với nhau, (2) dữ liệu có kích thước vô cùng lớn.
    • Luận văn thạc sĩ Công nghệ thông tin
    • Chuyên ngành Hệ thống thông tin
    • Người hướng dẫn khoa học: TS. Nguyễn Cẩm Tú
    • Tác giả: Đỗ Thị Nương
    • Số trang: 55
    • Kiểu file: PDF
    • Ngôn ngữ: Tiếng Việt
    • Đại học Quốc gia Hà Nội 2015
    Link Download
    http://dlib.vnu.edu.vn/iii/cpro/DigitalItemViewPage.external?lang=vie&sp=1060707
    https://drive.google.com/drive/folders/1yLBzZ1rSQoNjmWeJTM6cEZ3WGQHg04L1
     
    Last edited by a moderator: Sep 12, 2017

Share This Page