Luận Văn Thạc Sĩ Phân Cụm Tập Kết Quả Tìm Kiếm Web Theo Cách Tiếp Cận Phân Tích Ngữ Nghĩa Tiềm Ẩn Và Fisher Kernel

Discussion in 'Chuyên Ngành Công Nghệ Thông Tin' started by nhandang123, Aug 6, 2016.

  1. nhandang123

    nhandang123 Guest

    [​IMG]
    Phân Cụm Tập Kết Quả Tìm Kiếm Web Theo Cách Tiếp Cận Phân Tích Ngữ Nghĩa Tiềm Ẩn Và Fisher Kernel
    Hiện nay khai thác và tìm kiếm thông tin trên Internet là vấn đề được rất nhiều nhà nghiên cứu quan tâm. Chúng ta đều biết, khối lượng thông tin trên Web khổng lồ, câu hỏi truy vấn của người sử dụng thường ít chính xác, nên số kết quả trả về từ các máy tìm kiếm có thể lên đến hàng trăm hay hàng ngàn tài liệu. Do đó, tìm được chính xác tài liệu mình quan tâm là rất khó và đôi lúc là không thể. Một trong những cách tiếp cận để giải quyết vấn đề này là sử dụng kĩ thuật phân cụm tài liệu theo chủ đề tạo nên cách biểu diễn kết quả tìm kiếm Web cô động và rõ ràng. Trong luận văn này tôi xin mạnh dạn đề xuất giải thuật Phân cụm kết quả tìm kiếm Web theo cách tiếp cận phân tích ngữ nghĩa tiềm ẩn (Latent Semantic Analysis) và Fisher Kernel. Tư tưởng chính của giải thuật là, trước tiên phân tích ngữ nghĩa tiềm ẩn bên trong tập kết quả để tìm ra các khái niệm bao hàm trong đó, sau đó phân cụm tập kết quả theo tư tưởng giải thuật phân cụm K-means sử dụng hàm độ đo tương tự Fisher Kernel để nhóm các kết quả theo khái niệm chúng mô tả. Giải thuật được cài đặt trên mô hình Carrot2.
    • Luận văn thạc sĩ
    • Chuyên ngành Công nghệ thông tin
    • Người hướng dẫn khoa học: PGS. TS. Vũ Đức Thi
    • Tác giả: Nguyễn Thị Ngọc Thanh
    • Số trang: 83
    • Kiểu file: PDF
    • Ngôn ngữ: Tiếng Việt
    • Đại học Quốc gia Hà Nội 2006
    Link Download
    http://dlib.vnu.edu.vn/iii/cpro/DigitalItemViewPage.external?lang=vie&sp=1007791
    https://drive.google.com/drive/folders/1yLBzZ1rSQoNjmWeJTM6cEZ3WGQHg04L1
     
    Last edited by a moderator: Sep 22, 2017

Share This Page