Luận Văn Thạc Sĩ Phương Pháp Phân Cụm Tài Liệu Web Và Áp Dụng Vào Máy Tìm Kiếm

Discussion in 'Chuyên Ngành Công Nghệ Thông Tin' started by nhandang123, Aug 8, 2016.

  1. nhandang123

    nhandang123 Guest

    [​IMG]
    Phương Pháp Phân Cụm Tài Liệu Web Và Áp Dụng Vào Máy Tìm Kiếm
    World Wide Web là một kho thông tin khổng lồ với tiềm năng được coi là không có giới hạn. Khai phá Web là vấn đề nghiên cứu thời sự trong thời gian gần đây, đã thu hút nhiều nhóm nhà khoa học trên thế giới tiến hành nghiên cứu, đề xuất các mô hình, phương pháp mới nhằm tạo ra các công cụ hiệu quả hỗ trợ người dùng trong việc tổng hợp thông tin và tìm kiếm tri thức từ tập hợp các trang Web khổng lồ trên Internet. Phân cụm tài liệu Web là một bài toán điển hình trong khai phá Web, nhằm phân hoạch tập văn bản thành các tập con có tính chất chung, trong đó bài toán phân cụm các trang Web là kết quả trả về từ máy tìm kiếm là rất hữu dụng [4-6, 8-15, 18, 19, 22, 24]. Như đã biết, tập hợp các trang Web đáp ứng một câu hỏi trả về từ máy tìm kiếm nói chung là rất lớn, vì vậy, thuật toán phân cụm văn bản ở đây cần có được một tính chất rất quan trọng là tính "tăng" theo nghĩa thuật toán phân cụm không phải thực hiện chỉ trên toàn bộ tập dữ liệu mà có thể được thực hiện theo cách từ bộ phận dữ liệu tới toàn bộ dữ liệu [4, 6, 11, 14, 15, 24]. Điều đó cho phép thuật toán tiến hành ngay trong giai đoạn máy tìm kiếm đưa các trang web kết quả về.
    • Luận văn thạc sĩ
    • Chuyên ngành Công nghệ thông tin
    • Người hướng dẫn khoa học: PGS. TS. Hà Quang Thụy
    • Tác giả: Nguyễn Thị Thu Hằng
    • Số trang: 90
    • Kiểu file: PDF
    • Ngôn ngữ: Tiếng Việt
    • Đại học Quốc gia Hà Nội 2007
    Link Download
    http://dlib.vnu.edu.vn/iii/cpro/DigitalItemViewPage.external?lang=vie&sp=1007884
    https://drive.google.com/drive/folders/1yLBzZ1rSQoNjmWeJTM6cEZ3WGQHg04L1
     
    Last edited by a moderator: Sep 25, 2017

Share This Page