Khai Thác Dữ Liệu Với Mẫu Kích Thước LớnKhai thác tập phổ biến là một trong những vấn đề cốt lõi trong khai thác dữ liệu. Nhiều thuật toán đã được xây dựng để hỗ trợ quá trình khai thác tập phổ biến trong các cơ sở dữ liệu thương mại truyền thống như thuật toán Apriori, thuật toán cải tiến Apriori (Apriori-TID), thuật toán FP-Growth, thuật toán IT-Tree, .v.v. Với cơ sở dữ liệu dạng này thường bao gồm rất nhiều giao tác nhưng mỗi giao tác lại gồm ít phần tử. Trong thực tế có các cơ sở dữ liệu đặc biệt như: số item rất lớn, giao tác không nhiều dẫn đến việc khai thác theo phương pháp truyền thống thường gặp hạn chế về không gian lưu trữ cũng như hiệu năng tính toán do số lượng các ứng viên xuất hiện trong quá trình khai thác tăng theo cấp độ hàm mũ, dữ liệu được xuất ra dư thừa nhưng không có đủ thông tin phù hợp để khai thác,.v.v. Luận văn thạc sĩ tin học Chuyên ngành Công nghệ thông tin Người hướng dẫn: TS. Bùi Đức Minh Tác giả: Lê Đình Thâm Số trang: 68 Kiểu file: PDF Ngôn ngữ: Tiếng Việt Đại Học Công Nghệ TP. Hồ Chí Minh 2016 Link Download http://data.lib.hutech.edu.vn/Bookdetails.aspx?id=110063 https://drive.google.com/uc?id=1G9U59x8afx-jMBQjYXQXdrcReK_VJ2-Jhttps://drive.google.com/drive/folders/1yLBzZ1rSQoNjmWeJTM6cEZ3WGQHg04L1