Luận Văn Thạc Sĩ Khai Thác Tập Mục Hữu Ích Cao Trên Cơ Sở Dữ Liệu Tăng Trưởng

Discussion in 'Chuyên Ngành Kỹ Thuật Công Nghệ' started by admin, Jan 16, 2017.

  1. admin

    admin Thư Viện Sách Việt Staff Member Quản Trị Viên

    [​IMG]
    Khai thác dữ liệu là quá trình khám phá thông tin tìm ẩn và các mối liên hệ lẫn nhau có trong các cơ sở dữ liệu lớn. Khai thác dữ liệu truyền thống là thường dạng tĩnh và xử lý dữ liệu được thực hiện hàng loạt. Nhưng trên thực tế, cơ sở dữ liệu thường xuyên biến động do đó cách này không hiệu quả gây lãng phí khi một lượng nhỏ dữ liệu được thêm vào cơ sở dữ liệu lớn. Do đó, Hong và các đồng sự [11] đã đề xuất ra khái niệm tập gần phổ biến để khai thác tập phổ biến trên cơ sở dữ liệu tăng trưởng. Tác giả đã xử dụng hai ngưỡng phổ biến đó là: ngưỡng phổ biến trên (tương đương với ngưỡng phổ biến tối thiểu, minSup) và ngưỡng phổ biến dưới để giảm số lần duyệt lại cơ sở dữ liệu gốc. Thuật toán Pre-HUI là thuật toán khai thác tập mục hữu ích cáo trên cơ sở dữ liệu tăng trưởng được đề xuất vào năm 2014 [7]. Luận văn đề xuất thuật toán khai thác tập mục hữu ích cao trên cơ sở dữ liệu trưởng dựa trên cấu trúc cây WIT (Weighted Itemset-Tidset tree) bằng cách tỉa những ứng viên có độ hữu ích thấp và cải tiến bước sinh tập ứng viên trước khi sử dụng phương pháp khai thác dữ liệu được đề xuất. Do đó, thuật toán mới này sẽ cải thiện tốt hơn về thời gian và bộ nhớ sử dụng trong quá trình khai thác tập mục hữu ích cao.
    • Luận văn thạc sĩ khoa học
    • Chuyên ngành khoa học máy tính
    • Tác giả: Võ Thiện Khoa
    • Người hướng dẫn: PGS. TS. Võ Đình Bảy
    • 84 Trang
    • File PDF
    • Trường ĐH Quốc Tế Hồng Bàng 2015
    Link Download
    http://graduate.hbu.edu.vn/Resources/Docs/SubDomain/graduate/LUAN VAN KHOA HOC MAY TINH/Luan van.pdf
    http://sachviet.edu.vn/threads/dvd-ebook-luan-van-cntt-chuyen-nganh-khoa-hoc-may-tinh.59165/
    https://drive.google.com/drive/folders/1yLBzZ1rSQoNjmWeJTM6cEZ3WGQHg04L1
     

Share This Page