Luận Văn Thạc Sĩ Rút Trích Tri Thức Ngữ Nghĩa Từ Tên Thể Loại Wikipedia

Discussion in 'Chuyên Ngành Công Nghệ Thông Tin' started by nhandanglv123, Mar 4, 2020.

  1. nhandanglv123

    nhandanglv123 Moderator

    [​IMG]
    Rút Trích Tri Thức Ngữ Nghĩa Từ Tên Thể Loại Wikipedia
    Hệ thống Wikipedia miễn phí, được mở rộng và cập nhật thường xuyên. Hiện nay, trên thế giới đã có một số công trình nghiên cứu khai thác dữ liệu từ hệ thống bách khoa toàn thư này. Tuy nhiên, các công trình nghiên cứu về Wikipedia chủ yếu là phân tích nội dung các trang bài viết. Một số nhóm nghiên cứu rút trích thông tin từ infobox – là bảng được định dạng cố định ở góc trên bên phải của bài viết, bảng này trình bày tóm tắt nội dung chính của bài viết; một số công trình khác thì nghiên cứu về hệ thống phân loại thể loại của Wikipedia (Wikipedia Category Network - viết tắt là WCN). Việc khảo sát Wikipedia cho thấy hệ thống phân loại trong Wikipedia có nhiều mối liên hệ, là nguồn dữ liệu ngữ nghĩa tiềm năng cho nghiên cứu của luận văn. Do vậy, luận văn tập trung vào việc nghiên cứu đề xuất một phương pháp để trích xuất thông tin hữu ích từ Wikipedia thông qua các đặc trưng ngữ nghĩa từ hệ thống tên thể loại của Wikipedia. Luận văn thực hiện với cách tiếp cận xử lý dữ liệu ít hơn: chỉ xử lý tên thể loại và tiêu đề bài viết mà không cần phải xử lý các trang bài viết. Luận văn còn đề xuất đề xuất mô hình mở rộng truy vấn dựa vào phương pháp trích rút đặc trưng ngữ nghĩa để mở rộng và cải thiện các kết quả truy vấn.
    • Luận văn thạc sĩ tin học
    • Chuyên ngành Công nghệ thông tin
    • Người hướng dẫn: TS. Nguyễn Chánh Thành TS. Lê Mạnh Hải
    • Tác giả: Nguyễn Thị Hồng Mỹ
    • Số trang: 63
    • Kiểu file: PDF
    • Ngôn ngữ: Tiếng Việt
    • Đại Học Công Nghệ TP. Hồ Chí Minh 2015
    Link Download
    http://data.lib.hutech.edu.vn/Bookdetails.aspx?id=101428
    https://drive.google.com/uc?id=1tdN9h0P_ljz1Gl2I6ckeVD5oaWIp7A0D
    https://drive.google.com/drive/folders/1yLBzZ1rSQoNjmWeJTM6cEZ3WGQHg04L1
     

Share This Page