Trong thời đại bùng nổ thông tin như hiện nay, văn bản trên internet xuất hiện ngày càng nhiều. Vì vậy mà việc phân tích ngôn ngữ tự động trở nên vô cùng cần thiết. Và để có thể phân tích tự động, ta cần có hệ thống nhãn ngôn ngữ hình thức. Từ những năm 1955, Noam Chomsky đã quan tâm đến việc hệ thống hóa phân tích ngôn ngữ tự động. Từ đó đến nay, việc phân tích cú pháp ngôn ngữ và tiến hành hệ thống hóa chúng luôn là những vấn đề được nhiều nhà khoa học trên thế giới quan tâm, tìm hiểu. Những nghiên cứu trong lĩnh vực này đã đạt được nhiều thành tựu và được ứng dụng trong đời sống như chữa lỗi văn bản, nhận dạng chữ viết, dịch máy… Một trong những kết quả nghiên cứu đó phải kể đến là xây dựng ngân hàng ngữ liệu và hệ thống hóa phân tích ngôn ngữ tự động của các ngôn ngữ như tiếng Anh (Penn Treebank), tiếng Hoa (Chinese Treebank)... Việc xây dựng treebank tiếng Anh, tiếng Hoa và phân tích ngôn ngữ tự động của các thứ tiếng này đã có bước tiến đáng kể. Luận văn thạc sĩ ngữ văn Chuyên ngành Ngôn ngữ học Người hướng dẫn: PGS.TS Đinh Điền Tác giả: Phạm Thị Kim Uyên Số trang: 515 File PDF-TRUE Ngôn ngữ: Tiếng Việt Đại học Khoa học Xã hội và Nhân văn - Đại học Quốc gia TP. HCM 2015 Link Download https://drive.google.com/file/d/1_2qQrobD_GRTn4KCF-Se4Y-JUpqglIKFhttps://drive.google.com/drive/folders/1yLBzZ1rSQoNjmWeJTM6cEZ3WGQHg04L1