Luận Văn Thạc Sĩ Ứng Dụng Phương Pháp Học Tăng Cường Vào Huấn Luyện Cân Bằng Con Lắc Ngược

Discussion in 'Chuyên Ngành Khoa Học Máy Tính' started by quanh.bv, Feb 14, 2024.

  1. quanh.bv

    quanh.bv Administrator Quản Trị Viên

    upload_2024-2-14_16-45-4.png
    Trong ngành khoa học máy tính, học tăng cường (Reinforcement Learning - RL) là một lĩnh vực con của học máy, nghiên cứu cách thức một tác tử (agent) trong một môi trường nên chọn thực hiện các hành động nào để cực đại hóa khoản thưởng (reward) về lâu dài. Các thuật toán RL cố tìm ra một chính sách ánh xạ các trạng thái của thế giới thực tới các hành động mà tác tử nên chọn trong các trạng thái đó. Khác với học có giám sát, trong RL không có các cặp dữ liệu vào/kết quả đúng, các hành động gần tối ưu cũng không được đánh giá đúng sai một cách tường minh. Hơn nữa, ở đây hoạt động trực tuyến được quan tâm, trong đó có việc tìm kiếm sự cân bằng giữa khai phá (hành động chưa thử) và khai thác (tri thức hiện có). RL đặc biệt thích hợp cho các bài toán có sự được mất giữa các khoản thưởng ngắn hạn và dài hạn. RL đã được áp dụng thành công cho nhiều bài toán, trong đó có điều khiển robot, điều vận thang máy, viễn thông, các trò chơi như cờ vua...
    • Luận văn thạc sĩ tin học
    • Chuyên ngành Khoa học máy tính
    • Người hướng dẫn: TS. Đặng Việt Hùng
    • Tác giả: Phan Văn Sơn
    • Số trang: 94
    • Kiểu file: PDF-TRUE
    • Ngôn ngữ: Tiếng Việt
    • Đại học Duy Tân 2017
    Link Download
    https://drive.google.com/file/d/1utHcwDRNzLqRx2d9VwXJecheG4SwhauD
    https://drive.google.com/drive/folders/1yLBzZ1rSQoNjmWeJTM6cEZ3WGQHg04L1
     

Share This Page