Luận Văn Thạc Sĩ Nghiên Cứu Và Ứng Dụng Hadoop Để Khai Thác Tập Phổ Biến

Discussion in 'Chuyên Ngành Công Nghệ Thông Tin' started by nhandanglv123, Mar 7, 2020.

  1. nhandanglv123

    nhandanglv123 Moderator

    [​IMG]
    Nghiên Cứu Và Ứng Dụng Hadoop Để Khai Thác Tập Phổ Biến
    Khai thác dữ liệu là khả năng phát hiện ra những mẫu dữ liệu chưa biết trước đó trong các tập dữ liệu lớn. Nó đã thu hút rất nhiều sự chú ý của cả cộng đồng nghiên cứu và thương mại cho việc tìm kiếm thông tin thú vị ẩn trong các tập dữ liệu lớn. Một trong những lĩnh vực quan trọng nhất của khai thác dữ liệu là khai thác luật kết hợp; Nhiệm vụ của nó là tìm tất cả các tập con của các tập thường xuyên xuất hiện và mối quan hệ giữa chúng bằng cách sử dụng hai bước chính: tìm kiếm tập phổ biến và tạo ra các luật kết hợp. Apriori [2] là thuật toán có uy tín nhất cho việc tìm kiếm tập phổ biến từ một tập dữ liệu giao dịch; Tuy nhiên, nó cần phải duyệt qua tập dữ liệu nhiều lần và tạo ra rất nhiều tập ứng viên. Thật không may, khi kích thước tập dữ liệu rất lớn, cả hai bước trên phải sử dụng bộ nhớ và chi phí tính toán cao.
    • Luận văn thạc sĩ tin học
    • Chuyên ngành Công nghệ thông tin
    • Người hướng dẫn: PGS. TS. Lê Hoài Bắc
    • Tác giả: Nguyễn Đình Tuân
    • Số trang: 114
    • Kiểu file: PDF
    • Ngôn ngữ: Tiếng Việt
    • Đại Học Công Nghệ TP. Hồ Chí Minh 2014
    Link Download
    http://data.lib.hutech.edu.vn/Bookdetails.aspx?id=100083
    https://drive.google.com/uc?id=1jZCdEYcpFbtlU9SfPImRaw4TU0dn7HiH
    https://drive.google.com/drive/folders/1yLBzZ1rSQoNjmWeJTM6cEZ3WGQHg04L1
     

Share This Page