Luận Án Tiến Sĩ Nghiên Cứu Giải Thuật Học Củng Cố Trong Điều Khiển Thích Nghi Bền Vững Cho Hệ Phi Tuyến

Discussion in 'Chuyên Ngành Kỹ Thuật Công Nghệ' started by quanh.bv, Sep 23, 2016.

  1. quanh.bv

    quanh.bv Guest

    [​IMG]
    Nghiên Cứu Giải Thuật Học Củng Cố Trong Điều Khiển Thích Nghi Bền Vững Cho Hệ Phi Tuyến
    Học củng cố (Reinforcement Learning (RL)) thuộc lớp phương pháp học máy (Machine Learning) [62], [95] dùng để giải bài toán tối ưu bằng cách liên tục điều chỉnh hành động của tác tử (Agent). Lý thuyết RL hình thành dựa trên sự quan sát và nghiên cứu thuộc tính và hành vi của động vật khi tương tác với môi trường để thích nghi và tồn tại. Các giải thuật điều khiển dựa vào RL mô phỏng bản năng của động vật. Đó là biết học hỏi từ sai lầm, biết tự dạy chính mình, biết sử dụng thông tin trực tiếp từ môi trường cũng như thông tin đã đánh giá trong quá khứ để củng cố, điều chỉnh hành vi nhằm liên tục cải thiện chất lượng tương tác, tối ưu hóa mục tiêu nào đó theo thời gian
    • Luận án tiến sĩ kỹ thuật
    • Chuyên ngành tự động hóa
    • Người hướng dẫn khoa học: TS. Nguyễn Thiện Thành và TS. Hoàng Minh Trí
    • Tác giả: Nguyễn Tấn Lũy
    • Số trang: 167
    • Kiểu file: PDF
    • Ngôn ngữ: Tiếng Việt
    • Đại học Bách khoa T.P. Hồ Chí Minh 2015
    Link Download
    http://tracuu.thuvientphcm.gov.vn:8081/Overview/3399/3961/4/0/0/0/

    https://drive.google.com/drive/folders/1yLBzZ1rSQoNjmWeJTM6cEZ3WGQHg04L1
     

Share This Page