⚠ Vui lòng bật JavaScript để có trải nghiệm tốt nhất trên website này!

Hệ thống tìm kiếm thông tin xuyên ngôn ngữHệ thống tìm kiếm thông tin xuyên ngôn ngữ

Anh chup man hinh 2025 08 03 175516 1
Miễn phí
Tác giả: Chưa cập nhật
Ngày: Trước 2025
Định dạng file: .PDF
Đánh giá post
9 lượt xem
MỤC LỤC
MỞ ĐẦU ……………………………………………………………………………………………….1
Chương 1: TỔNG QUAN ……………………………………………………………………5
1.1 Giới thiệu mô hình tìm kiếm thông tin (Information Retrieval) ……………….5
1.2 Hệ thống tìm kiếm thông tin xuyên ngôn ngữ (CLIR) ……………………………..6
1.2.1 Khái niệm CLIR …………………………………………………………………………..6
1.2.2 Các phương pháp CLIR ………………………………………………………………..6
1.2.3 Các chương trình CLIR ………………………………………………………………..8
1.3 Dịch máy (Machine Translation for Text Translation) ………………………….12
1.3.1 Dịch máy dựa trên từ điển tập (Multilingual Thesaurus) ………………….13
1.3.2 Dựa trên ngữ cảnh (Corpus-based techniques) ………………………………..15
1.3.3 Phương pháp dịch thống kê …………………………………………………………..18
1.4 Kết luận ……………………………………………………………………………………………31
Chương 2: CƠ SỞ LÝ THUYẾT ………………………………………………………..32
2.1 Xây dựng từ điển MRD (Machine Readable Dictionary) …………………….32
2.1.1 Vấn đề kịch bản phát triển MRD trên thế giới …………………………………32
2.1.2 Hai khía cạnh của từ điển máy tính ……………………………………………….33
2.1.3 Vai trò từ điển trong CLIR …………………………………………………………..35
2.1.4 Xây dựng từ điển từ vựng điện tử ………………………………………………….41
2.1.5 Cách thức xử lý ngữ nghĩa từ điển MRD ………………………………………..43
2.2 Nhập nhằng ngữ nghĩa ……………………………………………………………………….47
2.3 Hệ thống dịch thống kê ……………………………………………………………………..51
Chương 3: PHÂN TÍCH VÀ THIẾT KẾ …………………………………………….55
3.1 Tổng quan hệ thống ………………………………………………………………………….55
3.1.1 Mô hình hệ thống …………………………………………………………………………56
3.1.2 Phân biệt ba bước ………………………………………………………………………..61
3.1.3 Phân sinh ngữ nghĩa …………………………………………………………………….63
3.2 Phân tích và thiết kế hệ thống:
  3.2.1 Mô tả Usecase ……………………………………………………………………………66
  3.2.2 Mô tả luồng dữ liệu …………………………………………………………………..70
  3.2.3 Mô tả chức năng ……………………………………………………………………….73
  3.2.4 Thiết kế cơ sở dữ liệu ………………………………………………………………..77
  3.2.5 Thiết kế giao diện …………………………………………………………………….94
CHƯƠNG 3: CÀI ĐẶT VÀ THỬ NGHIỆM ……………………………………………………………………………………….. 97
3.1 Các giai đoạn ……………………………………………………………………………………………………………………………………. 97
3.2 Môi trường cài đặt …………………………………………………………………………………………………………………………….. 98
3.3 Xây dựng hệ thống: ………………………………………………………………………………………………………………………….. 99
  3.3.1 Thu thập dữ liệu MRD ……………………………………………………………………………………………………….. 99
  3.3.2 Phân cực ngữ nghĩa từ điển MRD: tra cứu ………………………………………………………………………… 100
  3.3.3 Tìm kiếm tài liệu bằng công cụ tìm kiếm ………………………………………………………………………….. 110
CHƯƠNG 4: CÀI ĐẶT VÀ THỬ NGHIỆM ……………………………………………………………………………………….. 112
4.1 Giao diện ………………………………………………………………………………………………………………………………………… 112
  4.1.1 Các giao diện đã có …………………………………………………………………………………………………………… 112
  4.1.2 Giao diện từ điển ……………………………………………………………………………………………………………… 113
  4.1.3 Kết quả tìm kiếm ………………………………………………………………………………………………………………. 114
  4.1.4 Ngữ nghĩa ánh xạ ……………………………………………………………………………………………………………… 115
  4.1.5 Tìm kiếm: ………………………………………………………………………………………………………………………… 116
4.2 Mô hình nghiệm ………………………………………………………………………………………………………………………………. 117
  4.2.1 Chương trình và phần nhập những… ………………………………………………………………………………….. 117
  4.2.2 Chương trình demo trên web: ……………………………………………………………………………………………. 119
4.3 Đánh giá ………………………………………………………………………………………………………………………………………….. 120
  4.3.1 Module dịch và xử lý nhập nhằng ………………………………………………………………………………………. 120
  4.3.2 Chương trình tìm kiếm trên từ vựng ………………………………………………………………………………….. 121
CHƯƠNG 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN …………………………………………………………………………. 122
5.1 Kết luận …………………………………………………………………………………………………………………………………………… 122
5.2 Hướng phát triển ……………………………………………………………………………………………………………………………… 123
  5.2.1 Đổi với từ điển và ngữ liệu: ………………………………………………………………………………………………. 123
  5.2.2 Đối với Engine: ………………………………………………………………………………………………………………… 124
  5.2.3 Mở rộng ngôn ngữ trong tìm kiếm cho hệ thống: ………………………………………………………………… 125
PHỤ LỤC ………………………………………………………………………………………………………………………………………….. 126
TÀI LIỆU THAM KHẢO …………………………………………………………………………………………………………………. 132

Liên kết tải về

Xem thêm: