Khai Thác Tập Phổ Biến Đóng Liên Giao DịchViệc khai thác các tập liên giao dịch từ những cơ sở dữ liệu lớn là một công việc khai thác dữ liệu phổ biến, khai thác các tập trên một số giao dịch trong cơ sở dữ liệu giao dịch. Đã có nhiều thuật toán đề xuất cho công việc này, tuy nhiên vẫn tốn kém về mặt tính toán. Để giải quyết vấn đề trên, trong luận văn này, đề xuất một thuật toán hiệu quả được gọi là DIC-Miner để khai thác các tập phổ biến đóng liên giao dịch. Thuật toán đề xuất bao gồm bốn giai đoạn. Đầu tiên, thuật toán quét cơ sở dữ liệu một lần để tìm tất cả các tập phổ biến có độ dài bằng 1 cùng với tidset của chúng. Giai đoạn thứ hai, thuật toán sẽ sinh ra tất cả các tập ứng viên có độ dài bằng 1 với các giá trị span khác nhau và sắp xếp tăng dần theo độ hỗ trợ. Giai đoạn tiếp theo, dựa vào các đối tượng được tìm thấy trong giai đoạn 1 và 2, thuật toán tìm tất cả các tập phổ biến có độ dài bằng 2 được lưu với diffset. Trong giai đoạn 4, thuật toán sử dụng diffset và kỹ thuật duyệt theo chiều sâu DFS (Depth-First-Search) để tìm tất cả các tập phổ biến đóng liên giao dịch (FITIs). Luận văn thạc sĩ tin học Chuyên ngành Công nghệ thông tin Người hướng dẫn: PGS. TS. Võ Đình Bảy Tác giả: Mai Chính Hữu Số trang: 58 Kiểu file: PDF Ngôn ngữ: Tiếng Việt Đại Học Công Nghệ TP. Hồ Chí Minh 2017 Link Download http://data.lib.hutech.edu.vn/Bookdetails.aspx?id=120975 https://drive.google.com/uc?id=1FxUc97jBQ45kJ4Sy9zFBPeZ0RFQMruu7https://drive.google.com/drive/folders/1yLBzZ1rSQoNjmWeJTM6cEZ3WGQHg04L1