Luận Văn Thạc Sĩ Phân Cụm Dữ Liệu Định Danh Với Số Chiều Cao

Discussion in 'Chuyên Ngành Công Nghệ Phần Mềm' started by nhandang123, Aug 3, 2016.

  1. nhandang123

    nhandang123 Guest

    [​IMG]
    Phân Cụm Dữ Liệu Định Danh Với Số Chiều Cao
    Phân cụm dữ liệu nhằm chia tập dữ liệu thành nhiều cụm, trong đó các phần tử trong một cụm giống nhau nhiều hơn các phần tử khác cụm, là một phần quan trọng trong phân tích thống kê nhiều chiều và học máy không giám sát. Bài toán này có nhiều ứng dụng trong các lĩnh vực khác nhau như: gian lận tài chính, chẩn đoán trong y tế, xử lý hình ảnh, tìm kiếm thông tin, tin sinh học. Những thuật toán phân cụm đầu tiên làm việc với các đặc trưng số như là một phần của thống kê toán [15]. Cùng với sự phát triển của ứng dụng công nghệ thông tin, khối lượng dữ liệu tăng nhanh đòi hỏi phát triển các kỹ thuật khám phá tri thức trên các dạng dữ liệu khác nhau trên dữ liệu lớn với độ phức tạp thấp. Mặt khác các kỹ thuật khám phá tri thức thường phải làm việc với dữ liệu quan hệ nhiều chiều với các thuộc tính giá trị định danh [16]. Trong trường hợp đó việc phân dữ liệu thành các nhóm con có độ tương tự cao trong mỗi nhóm để xử lý sẽ giảm đáng kể thời gian chạy cho các thuật toán và tăng chất lượng của kỹ thuật khám phá tri thức.
    • Luận văn thạc sĩ Công nghệ thông tin
    • Chuyên ngành Công nghệ phần mềm
    • Người hướng dẫn khoa học: PGS. TS. Hoàng Xuân Huấn
    • Tác giả: Phan Thị Luân
    • Số trang: 91
    • Kiểu file: PDF
    • Ngôn ngữ: Tiếng Việt
    • Trường Đại học Công nghệ. Đại học Quốc gia Hà Nội 2013
    Link Download
    http://dlib.vnu.edu.vn/iii/cpro/DigitalItemViewPage.external?lang=vie&sp=1045772
    https://drive.google.com/drive/folders/1yLBzZ1rSQoNjmWeJTM6cEZ3WGQHg04L1
     
    Last edited by a moderator: Aug 31, 2017

Share This Page