Sử Dụng Cây Quyết Định Để Phân Loại Dữ Liệu NhiễuSự phát triển của công nghệ thông tin và các ứng dụng của nó đã tạo ra những cơ sở dữ liệu rất lớn. Việc khai thác các thông tin hữu ích từ các cơ sở dữ liệu này hết sức quan trọng. Khai phá dữ liệu có thể áp dụng trong nhiều lĩnh vực như: phân tích dữ liệu tài chính, công nghệ bán hàng, công nghệ viễn thông, phân tích dữ liệu sinh học, phân tích dữ liệu sinh học, ….. Tuy nhiên trong thực tế do đầu vào, do quá trình vận hành, xử lý mà các kho dữ liệu này đều có độ nhiễu nhất định. Dữ liệu nhiễu là dữ liệu bị mất, thiếu thuộc tính, hay không đồng nhất …Ứng dụng càng lớn, thời gian vận hành ứng dụng càng lâu thì dữ liệu càng dễ bị nhiễu. Dữ liệu bị nhiễu có thể do nhiều nguyên nhân như: lỗi vận hành của phần cứng, lỗi của các thiết bị nhập liệu, các thiết bị quét dữ liệu, lỗi do lập trình, lỗi do người nhập liệu, vận hành. Luận văn thạc sĩ tin học Chuyên ngành Công nghệ thông tin Người hướng dẫn: PGS. TS. Lê Hoài Bắc Tác giả: Lại Đức Hùng Số trang: 70 Kiểu file: PDF Ngôn ngữ: Tiếng Việt Đại Học Công Nghệ TP. Hồ Chí Minh 2015 Link Download http://data.lib.hutech.edu.vn/Bookdetails.aspx?id=102186 https://drive.google.com/uc?id=1ChuSZ1NETsy2-BYP_Vt7C3RKbk94SFsZhttps://drive.google.com/drive/folders/1yLBzZ1rSQoNjmWeJTM6cEZ3WGQHg04L1