MỤC LỤC
MỤC LỤC …………………………………………………………………………………………………………….. 4
GIẢI THÍCH CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT …………………………………………………… 7
DANH MỤC CÁC BẢNG …………………………………………………………………………………….. 10
DANH MỤC CÁC HÌNH ẢNH, ĐỒ THỊ ……………………………………………………………….. 12
MỞ ĐẦU …………………………………………………………………………………………………………….. 14
1. TỔNG QUAN VỀ NHẬN DẠNG TIẾNG NÓI VÀ NHẬN DẠNG PHƯƠNG NGỮ
19
1.1. Nhận dạng tiếng nói …………………………………………………………………………………. 19
1.1.1. Tổng quan về nhận dạng tiếng nói ………………………………………………………. 19
1.1.2. Lịch sử phát triển và các tiến bộ trong nghiên cứu nhận dạng tiếng nói …… 20
1.1.3. Các thách thức đối với nhận dạng tự động tiếng nói ………………………………. 21
1.1.4. Phân loại hệ thống nhận dạng tự động tiếng nói ……………………………………. 22
1.2. Nhận dạng phương ngữ …………………………………………………………………………….. 24
1.2.1. Các mô hình nhận dạng phương ngữ ……………………………………………………. 24
1.2.2. Nhận dạng phương ngữ theo các phương diện khác nhau ……………………….. 25
1.3. Nghiên cứu nhận dạng tiếng nói và nhận dạng phương ngữ tiếng Việt …………… 30
1.4. Một số mô hình nhận dạng ……………………………………………………………………….. 31
1.4.1. Mô hình GMM …………………………………………………………………………………. 31
1.4.2. Bộ phân lớp SVM ……………………………………………………………………………… 33
1.4.3. Mạng nơ ron nhận tạo ………………………………………………………………………… 39
1.5. Kết chương ……………………………………………………………………………………………… 43
2. XÂY DỰNG BỘ NGỮ LIỆU CHO NGHIÊN CỨU NHẬN DẠNG PHƯƠNG NGỮ
TIẾNG VIỆT ……………………………………………………………………………………………………….. 45
2.1. Tổng quan phương ngữ tiếng Việt ……………………………………………………………… 45
2.1.1. Phương ngữ và phân vùng phương ngữ tiếng Việt …………………………………. 45
2.1.2. Đặc điểm ngữ âm ba vùng phương ngữ chính của tiếng Việt ………………….. 46
2.1.3. Sự khác biệt về từ vựng và ngữ nghĩa giữa ba vùng phương ngữ tiếng Việt 47
2.2. Cấu trúc âm tiết, âm vị trong phương ngữ tiếng Việt ……………………………………. 49
2.2.1. Âm tiết và âm vị trong tiếng Việt ………………………………………………………… 49
2.2.2. Âm đệm và cách kết hợp âm đệm trong các phương ngữ ……………………….. 53
2.3. Phụ âm đầu trong phương ngữ tiếng Việt ……………………………………………………. 54
2.3.1. Hệ thống phụ âm đầu …………………………………………………………………………. 54
2.3.2. So sánh hệ thống phụ âm đầu ba phương ngữ Bắc-Trung-Nam ………………. 56
2.4. Hệ thống thanh điệu và các biến thể trong phương ngữ tiếng Việt …………………. 56
2.4.1. Hệ thống thanh điệu Hà Nội ……………………………………………………………….. 57
2.4.2. Hệ thống thanh điệu Nghệ – Tĩnh và Huế ……………………………………………… 57
2.4.3. Hệ thống thanh điệu Đà Nẵng và Thành phố Hồ Chí Minh …………………….. 58
2.4.4. Một số nhận xét về hệ thống thanh điệu các phương ngữ ……………………….. 59
2.5. Ảnh hưởng của phương ngữ tới nhận dạng tiếng nói ……………………………………. 60
2.6. Ngữ liệu phương ngữ trên thế giới và xây dựng bộ ngữ liệu dùng cho nhận dạng
phương ngữ tiếng Việt ……………………………………………………………………………………….. 60
2.6.1. Phương pháp xây dựng bộ ngữ liệu phương ngữ tiếng Việt ……………………. 62
2.6.2. Chuẩn bị và chuẩn hóa văn bản …………………………………………………………… 62
2.6.3. Ghi âm …………………………………………………………………………………………….. 64
2.6.4. Kết quả ghi âm và đặc tính VDSPEC …………………………………………………… 67
2.7. Phân tích một số đặc trưng phương ngữ tiếng Việt của bộ ngữ liệu VDSPEC …. 68
2.7.1. Biến thiên tần số cơ bản F0 theo thanh điệu của ba phương ngữ ……………… 68
2.7.2. Phân tích thống kê phân bố F0 của các thanh điệu …………………………………. 70
2.7.3. Phân tích dữ liệu dùng LDA ……………………………………………………………….. 72
2.8. Kết chương ……………………………………………………………………………………………… 76
3. NHẬN DẠNG PHƯƠNG NGỮ TIẾNG VIỆT …………………………………………………. 78
3.1. Nhận dạng phương ngữ tiếng Việt với GMM ……………………………………………… 78
3.1.1. Công cụ thử nghiệm nhận dạng phương ngữ ALIZE ……………………………… 78
3.1.2. Lựa chọn số lượng hệ số MFCC ………………………………………………………….. 80
3.1.3. Thử nghiệm nhận dạng phương ngữ tiếng Việt trong trường hợp kết hợp
MFCC với tham số F0 ……………………………………………………………………………………. 81
3.1.4. Thử nghiệm nhận dạng phương ngữ tiếng Việt trong trường hợp kết hợp
formant, dải thông tương ứng và tham số F0 …………………………………………………….. 84
3.1.5. Ảnh hưởng của số lượng thành phần Gauss đối với hiệu năng nhận dạng
phương ngữ tiếng Việt ……………………………………………………………………………………. 85
3.2. SVM nhận dạng phương ngữ tiếng Việt ……………………………………………………… 87
3.2.1. Bộ phân lớp SMO ……………………………………………………………………………… 87
3.2.2. Thử nghiệm nhận dạng phương ngữ tiếng Việt sử dụng SMO ………………… 88
3.3. lBk nhận dạng phương ngữ tiếng Việt ………………………………………………………… 92
3.3.1. Bộ phân lớp IBk ……………………………………………………………………………….. 92
3.3.2. Kết quả nhận dạng phương ngữ tiếng Việt sử dụng IBk …………………………. 95
3.4. Nhận dạng phương ngữ tiếng Việt với bộ phân lớp MultilayerPerceptron ………. 96
3.4.1. Bộ phân lớp MultilayerPerceptron trong Weka …………………………………….. 96
3.4.2. MultilayerPerceptron nhận dạng phương ngữ tiếng Việt ………………………… 96
3.5. JRip nhận dạng phương ngữ tiếng Việt ………………………………………………………. 97
3.5.1. Bộ phân lớp JRip ………………………………………………………………………………. 97
3.5.2. Nhận dạng phương ngữ tiếng Việt với JRip ………………………………………….. 98
3.6. Nhận dạng phương ngữ tiếng Việt với PART ……………………………………………… 99
3.6.1. Bộ phân lớp PART ……………………………………………………………………………. 99
3.6.2. Kết quả dùng PART nhận dạng phương ngữ tiếng Việt …………………………. 99
3.7. Kết chương ……………………………………………………………………………………………… 99
4. CẢI THIỆN HIỆU NĂNG NHẬN DẠNG TIẾNG VIỆT VỚI THÔNG TIN VỀ
PHƯƠNG NGỮ …………………………………………………………………………………………………. 102
4.1. HMM nhận dạng tiếng Việt nói ……………………………………………………………….. 102
4.1.1. Mô hình HMM ……………………………………………………………………………….. 102
4.1.2. HMM nhận dạng tiếng Việt nói theo ba phương ngữ chính …………………… 115
4.2. Cải thiện hiệu năng nhận dạng tiếng Việt nói thông qua sử dụng thông tin phương
ngữ 120
4.2.1. Mô hình nhận dạng tiếng Việt nói với việc sử dụng thông tin phương ngữ 120
4.2.2. Nhận dạng tiếng Việt nói khi có thông tin phương ngữ ………………………… 122
4.3. Kết chương ……………………………………………………………………………………………. 123
KẾT LUẬN VÀ KIẾN NGHỊ ………………………………………………………………………………. 125
TÀI LIỆU THAM KHẢO ……………………………………………………………………………………. 128
DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ CỦA LUẬN ÁN ………………………. 140

