Làm Giàu Đặc Trưng Cho Bài Toán Phân Lớp Truy VấnTrong đó hướng nghiên cứu phân lớp câu truy vấn của người sử dụng đang được sự quan tâm của nhiều nhà khoa học, nhiều nhóm nghiên cứu. Ví dụ: chủ đề của cuộc thi thường niên năm 2005 của Hội nghị về Khai phá kiến thức và dữ liệu của ACM (The ACM Conference on Knowledge and Data Discovery – KDD), được gọi tắt là KDD Cup 2005 [22], là về phân lớp truy vấn. Sự phân lớp các câu truy vấn của người sử dụng sẽ làm tăng tính hiệu quả và tăng hiệu năng của các máy tìm kiếm. Về cơ bản bài toán phân lớp truy vấn (query classification) có thể coi là một trường hợp đặc biệt của bài toán phân lớp văn bản (text classification) khi văn bản rất ngắn (thường dưới 10 từ, độ dài trung bình của một câu truy vấn là từ 2,0 đến 2,6 từ [4]). Tuy vậy bài toán phân lớp truy vấn có những đặc điểm riêng và kết quả trả về thường không được chính xác như bài toán phân lớp văn bản. Thách thức lớn nhất của bài toán phân lớp truy vấn là số lượng từ trong câu truy vấn của người sử dụng quá ít nên độ tập trung của các từ trong các lớp rất thấp và lượng thông tin trong câu truy vấn không nhiều. Luận văn thạc sĩ Công nghệ thông tin Chuyên ngành Hệ thống thông tin Người hướng dẫn khoa học: TS. Nguyễn Trí Thành Tác giả: Nguyễn Thành Trung Số trang: 49 Kiểu file: PDF Ngôn ngữ: Tiếng Việt Đại học Quốc gia Hà Nội 2011 Link Download http://dlib.vnu.edu.vn/iii/cpro/DigitalItemViewPage.external?lang=vie&sp=1003156https://drive.google.com/drive/folders/1yLBzZ1rSQoNjmWeJTM6cEZ3WGQHg04L1