MỤC LỤC
MỞ ĐẦU ……………………………………………………………………………………………….. 3
CHƯƠNG 1 ……………………………………………………………………………………………. 6
TỔNG QUAN VỀ PHÁT HIỆN TRI THỨC VÀ KHAI PHÁ DỮ LIỆU ….. 6
1.1 Giới thiệu chương …………………………………………………………………………… 6
1.2 Tổng quan về phát hiện tri thức và khai phá dữ liệu……………………………. 6
1.3 Quá trình phát hiện tri thức và khai phá dữ liệu ……………………………….. 10
1.4 Các phương pháp khai phá dữ liệu ………………………………………………….. 12
1.5 Các vấn đề cần nghiên cứu của phát hiện tri thức và khai phá dữ liệu …. 14
1.6 Các lĩnh vực ứng dụng của phát hiện tri thức và khai phá dữ liệu ………. 16
1.7 Kỹ thuật khai phá luật kết hợp ……………………………………………………….. 17
1.7.1 Lý thuyết về luật kết hợp …………………………………………………………. 17
1.7.2 Định nghĩa luật kết hợp …………………………………………………………… 18
1.7.3 Một số hướng tiếp cận trong khai phá luật kết hợp …………………….. 20
1.8 Cây quyết định …………………………………………………………………………….. 22
1.8.1 Sơ lược về cây quyết định ……………………………………………………….. 22
1.8.2 Định nghĩa cây quyết định ………………………………………………………. 23
1.8.3 Xây dựng cây quyết định ………………………………………………………… 23
1.8.4 Một số thuật toán xây dựng cây quyết định ……………………………….. 23
1.8.5 Ưu điểm của cây quyết định…………………………………………………….. 29
1.9 Tổng kết chương 1 ……………………………………………………………………….. 30
CHƯƠNG 2 ………………………………………………………………………………………….. 31
BÀI TOÁN CỐ VẤN HỌC TẬP VÀ ĐẶC TRƯNG BỘ DỮ LIỆU SINH
VIÊN ĐẠI HỌC TẠI TRƯỜNG ĐẠI HỌC KINH TẾ QUỐC DÂN ………. 31
2.1 Giới thiệu chương ………………………………………………………………………….. 31
2.2 Những vấn đề về cố vấn học tập theo hình thức đào tạo tín chỉ tại trường
Đại học Kinh tế Quốc dân ………………………………………………………………. 31
2.2.1 Tổ chức hệ thống cố vấn học tập ……………………………………………… 31
2.2.2 Chức năng của cố vấn học tập ………………………………………………….. 32
2.2.3 Nhiệm vụ của cố vấn học tập …………………………………………………… 32
2.2.3.1 Nhiệm vụ chung của CVHT chuyên trách và kiêm nhiệm ………. 32
2.2.3.2 Nhiệm vụ cụ thể ………………………………………………………………… 33
2.3 Bài toán cố vấn học tập tại trường Đại học kinh tế quốc dân ……………… 35
2.3.1 Vấn đề thực tế xung quanh bài toán ………………………………………….. 35
2.3.2 Phát biểu bài toán …………………………………………………………………… 36
2.3.3 Mục tiêu và ý nghĩa của bài toán ………………………………………………. 36
2.3.4 Quy trình giải quyết bài toán ……………………………………………………. 37
2.4 Đặc trưng dữ liệu sinh viên trường Đại học kinh tế quốc dân …………….. 38
2.4.1 Hệ thống quản lý đào tạo, quản lý sinh viên ……………………………… 38
2.4.2 Mô tả một phần cơ sở dữ liệu quản lý sinh viên dựa trên những thông
tin đã thu thập ………………………………………………………………………… 40
2.5 Tổng kết chương 2 ………………………………………………………………………… 41
CHƯƠNG 3 ………………………………………………………………………………………….. 42
ỨNG DỤNG THỬ NGHIỆM GIẢI BÀI TOÁN CỐ VẤN HỌC TẬP TẠI
TRƯỜNG ĐẠI HỌC KINH TẾ QUỐC DÂN ………………………………………… 42
3.1 Giới thiệu chương ………………………………………………………………………….. 42
3.2 Giới thiệu một số công cụ khai phá dữ liệu và phát hiện tri thức …………. 42
3.2.1 Weka …………………………………………………………………………………….. 42
3.2.2 Ngôn ngữ R …………………………………………………………………………… 43
3.2.3 SQL Datamining ……………………………………………………………………. 44
3.2.3.1 Giới thiệu………………………………………………………………………….. 44
3.2.3.2 Thuật toán kết hợp trong công cụ (Assocication Algorithm) …… 45
3.2.3.3 Thuật toán phân loại trong công cụ (Classification Algorithm) .. 46
3.3 Quy trình thực hiện khai phá dữ liệu sinh viên và phát hiện tri thức với bài
toán cố vấn học tập tại Trường Đại học Kinh tế Quốc dân. ………………… 47
3.4 Khai phá dữ liệu bằng luật kết hợp giải bài toán 1 ……………………………. 48
3.4.1 Từ dữ liệu thô thu thập được ……………………………………………………. 48
3.4.2 Tiến hành biến đổi dữ liệu theo bài toán 1 …………………………………. 49
3.4.3 Thực hiện thử nghiệm trên công cụ BIDS ………………………………….. 49
3.5 Khai phá dữ liệu bằng cây quyết định giải bài toán 2 ………………………… 55
3.5.1 Từ dữ liệu thô thu thập được ……………………………………………………. 55
3.5.2 Tiến hành biến đổi dữ liệu theo bài toán 2 …………………………………. 56
3.5.3 Thực hiện thử nghiệm trên công cụ BIDS …………………………………. 58
3.6 Một số đề xuất, kiến nghị ………………………………………………………………. 60
3.7 Tổng kết chương 3 ……………………………………………………………………….. 60
KẾT LUẬN ………………………………………………………………………………………….. 61

