Luận Văn Thạc Sĩ Ứng Dụng Phương Pháp Học Tăng Cường Vào Huấn Luyện Cân Bằng Con Lắc Ngược

quanh.bv · Feb 14, 2024

Trong ngành khoa học máy tính, học tăng cường (Reinforcement Learning - RL) là một lĩnh vực con của học máy, nghiên cứu cách thức một tác tử (agent) trong một môi trường nên chọn thực hiện các hành động nào để cực đại hóa khoản thưởng (reward) về lâu dài. Các thuật toán RL cố tìm ra một chính sách ánh xạ các trạng thái của thế giới thực tới các hành động mà tác tử nên chọn trong các trạng thái đó. Khác với học có giám sát, trong RL không có các cặp dữ liệu vào/kết quả đúng, các hành động gần tối ưu cũng không được đánh giá đúng sai một cách tường minh. Hơn nữa, ở đây hoạt động trực tuyến được quan tâm, trong đó có việc tìm kiếm sự cân bằng giữa khai phá (hành động chưa thử) và khai thác (tri thức hiện có). RL đặc biệt thích hợp cho các bài toán có sự được mất giữa các khoản thưởng ngắn hạn và dài hạn. RL đã được áp dụng thành công cho nhiều bài toán, trong đó có điều khiển robot, điều vận thang máy, viễn thông, các trò chơi như cờ vua...

Luận văn thạc sĩ tin học

Chuyên ngành Khoa học máy tính

Người hướng dẫn: TS. Đặng Việt Hùng

Tác giả: Phan Văn Sơn

Số trang: 94

Kiểu file: PDF-TRUE

Ngôn ngữ: Tiếng Việt

Đại học Duy Tân 2017

Link Download
https://drive.google.com/file/d/1utHcwDRNzLqRx2d9VwXJecheG4SwhauD
https://drive.google.com/drive/folders/1yLBzZ1rSQoNjmWeJTM6cEZ3WGQHg04L1

Log in or Sign up

Luận Văn Thạc Sĩ Ứng Dụng Phương Pháp Học Tăng Cường Vào Huấn Luyện Cân Bằng Con Lắc Ngược

quanh.bv Administrator Quản Trị Viên

Zalo/Viber: 0944625325 | buihuuhanh@gmail.com

Share This Page

Our Links

Log in or Sign up

Luận Văn Thạc Sĩ Ứng Dụng Phương Pháp Học Tăng Cường Vào Huấn Luyện Cân Bằng Con Lắc Ngược

quanh.bv Administrator Quản Trị Viên

Zalo/Viber: 0944625325 | buihuuhanh@gmail.com

Share This Page

Useful Searches