Luận Văn Thạc Sĩ Nghiên Cứu Ứng Dụng Kỹ Thuật Boostmetric Nhằm Tăng Hiệu Quả Phân Lớp Dữ Liệu Lớn

Discussion in 'Chuyên Ngành Hệ Thống Thông Tin' started by nhandang123, Aug 15, 2016.

  1. nhandang123

    nhandang123 Guest

    [​IMG]
    Nghiên Cứu Ứng Dụng Kỹ Thuật Boostmetric Nhằm Tăng Hiệu Quả Phân Lớp Dữ Liệu Lớn
    Ngày nay, cuộc cách mạng về khoa học và công nghệ đã có những bước phát triển vượt bậc, đánh dấu những mốc son đáng tự hào trong nền văn minh của thế giới đương đại. Cùng với sự phát triển này, một lượng dữ liệu ngày càng lớn và vô cùng phong phú đã được tạo ra. Lượng dữ liệu rất lớn, nhưng thông tin chứa trong nó thì rất ít, nên đòi hỏi phải có các kỹ thuật mới để khai thác thông tin, khai phá dữ liệu ra đời nhằm đáp ứng các yêu cầu đó. Phân lớp dữ liệu là một trong các hướng nghiên cứu của khai phá dữ liệu. Phân lớp dữ liệu là kỹ thuật dựa trên tập huấn luyện và những giá trị hay là nhãn của lớp trong một thuộc tính phân lớp và sử dụng nó trong việc phân lớp dữ liệu mới. Thuật toán k láng giềng gần nhất (kNN) là một trong những kỹ thuật cơ bản, đơn giản và trực giác nhất trong lĩnh vực Phân tích thống kê. Bộ phân lớp dựa trên thuật toán kNN là một bộ học lười (lazy learner), không cần thực hiện quá trình học cho mô hình. Nó cần sử dụng tất cả các đối tượng dữ liệu trong tập tham chiếu để ra quyết định gán nhãn lớp cho một quan sát mới. Mặc dù rất đơn giản, nhưng thuật toán kNN đã cho kết quả tốt trong nhiều ứng dụng thực tế.
    • Luận văn thạc sĩ Công nghệ thông tin
    • Chuyên ngành Hệ thống thông tin
    • Người hướng dẫn khoa học: PGS. TS. Nguyễn Hà Nam
    • Tác giả: Nguyễn Thanh Tịnh
    • Số trang: 56
    • Kiểu file: DOC
    • Ngôn ngữ: Tiếng Việt
    • Đại học Quốc gia Hà Nội 2014
    Link Download
    http://dlib.vnu.edu.vn/iii/cpro/DigitalItemViewPage.external?lang=vie&sp=1057059
    https://drive.google.com/drive/folders/1yLBzZ1rSQoNjmWeJTM6cEZ3WGQHg04L1
     
    Last edited by a moderator: Sep 10, 2017

Share This Page