Nghiên Cứu Và Ứng Dụng Hadoop Để Khai Thác Tập Phổ BiếnKhai thác dữ liệu là khả năng phát hiện ra những mẫu dữ liệu chưa biết trước đó trong các tập dữ liệu lớn. Nó đã thu hút rất nhiều sự chú ý của cả cộng đồng nghiên cứu và thương mại cho việc tìm kiếm thông tin thú vị ẩn trong các tập dữ liệu lớn. Một trong những lĩnh vực quan trọng nhất của khai thác dữ liệu là khai thác luật kết hợp; Nhiệm vụ của nó là tìm tất cả các tập con của các tập thường xuyên xuất hiện và mối quan hệ giữa chúng bằng cách sử dụng hai bước chính: tìm kiếm tập phổ biến và tạo ra các luật kết hợp. Apriori [2] là thuật toán có uy tín nhất cho việc tìm kiếm tập phổ biến từ một tập dữ liệu giao dịch; Tuy nhiên, nó cần phải duyệt qua tập dữ liệu nhiều lần và tạo ra rất nhiều tập ứng viên. Thật không may, khi kích thước tập dữ liệu rất lớn, cả hai bước trên phải sử dụng bộ nhớ và chi phí tính toán cao. Luận văn thạc sĩ tin học Chuyên ngành Công nghệ thông tin Người hướng dẫn: PGS. TS. Lê Hoài Bắc Tác giả: Nguyễn Đình Tuân Số trang: 114 Kiểu file: PDF Ngôn ngữ: Tiếng Việt Đại Học Công Nghệ TP. Hồ Chí Minh 2014 Link Download http://data.lib.hutech.edu.vn/Bookdetails.aspx?id=100083 https://drive.google.com/uc?id=1jZCdEYcpFbtlU9SfPImRaw4TU0dn7HiHhttps://drive.google.com/drive/folders/1yLBzZ1rSQoNjmWeJTM6cEZ3WGQHg04L1