Luận Văn Thạc Sĩ Khai Thác K-Mẫu Tuần Tự Phổ Biến Dựa Trên Roaring Bitmap

Discussion in 'Chuyên Ngành Công Nghệ Thông Tin' started by nhandanglv123, Nov 5, 2019.

  1. nhandanglv123

    nhandanglv123 Moderator

    [​IMG]
    Khai Thác K-Mẫu Tuần Tự Phổ Biến Dựa Trên Roaring Bitmap
    Khai thác mẫu tuần tự là một phần quan trọng của khai thác dữ liệu với các ứng dụng rộng rãi. Tuy nhiên, việc tinh chỉnh thông số minsup trong các thuật toán khai thác mẫu tuần tự để tạo ra đủ số mẫu mong muốn là rất khó khăn và tốn thời gian. Để giải quyết vấn đề này, người ta đã đề xuất xác định lại vấn đề khai thác mẫu tuần tự như là khai thác k mẫu tuần tự phổ biến, với k là số mẫu tuần tự được tìm ra (được trả về) và được thiết lập bởi người dùng. Thuật toán tốt nhất hiện nay để giả quyết vấn đề này là TKS (Top-K Sequential pattern mining) [15]. Tuy nhiên, thuật toán này sử dụng bit vector có kích thước cố định cho mỗi item trong CSDL chuỗi (có chiều dài bằng tổng số itemset trong CSDL), do đó nó sử dụng nhiều bộ nhớ để lưu trữ và tiêu tốn nhiều thời gian để thực thi các phép giao bit vector. Để cải tiến thuật toán, luận văn này đề xuất sử dụng Roaring bitmap [16] thay thế cho bit vector có kích thước cố định trong TKS nhằm mục đích làm giảm bộ nhớ được sử dụng và giảm thời gian thực thi các phép giao bit vector.
    • Luận văn thạc sĩ tin học
    • Chuyên ngành Công nghệ thông tin
    • Người hướng dẫn: PGS. TS. Lê Hoài Bắc
    • Tác giả: Lê Hữu Nhơn
    • Số trang: 76
    • Kiểu file: PDF
    • Ngôn ngữ: Tiếng Việt
    • Đại Học Công Nghệ TP. Hồ Chí Minh 2015
    Link Download
    http://data.lib.hutech.edu.vn/Bookdetails.aspx?id=101453
    https://drive.google.com/uc?id=1uvwGXA-CY0mWqNaiwG0VbXU8FdXVq0V7
    https://drive.google.com/drive/folders/1yLBzZ1rSQoNjmWeJTM6cEZ3WGQHg04L1
     

Share This Page