MỤC LỤC
LỜI CAM ĐOAN ………………………………………………………………………………… i
LỜI CẢM ƠN …………………………………………………………………………………….. ii
DANH MỤC HÌNH …………………………………………………………………………….. v
TÓM TẮT …………………………………………………………………………………………. vi
MỞ ĐẦU ……………………………………………………………………………………………. 1
CHƯƠNG 1: TỔNG QUAN VỀ MÃ ĐỘC …………………………………………. 4
1.1. Giới thiệu về mã độc ………………………………………………………………………. 4
1.2. Phân loại mã độc ……………………………………………………………………………. 4
1.2.1. Virus [5]. ……………………………………………………………………………………. 5
1.2.2. Worm [5] ……………………………………………………………………………………. 7
1.2.3. Ransomware ……………………………………………………………………………….. 8
1.2.4. Trojan ………………………………………………………………………………………. 10
1.2.5. Backdoor [6] ……………………………………………………………………………… 10
1.2.6. Rootkits ……………………………………………………………………………………. 11
1.3. Mục đích phân tích mã độc ……………………………………………………………. 12
1.4. Phương pháp phân tích mã độc ……………………………………………………… 12
1.5. Trích xuất đặc trưng và các loại đặc trưng ……………………………………….. 14
1.5.1. Trích xuất đặc trưng …………………………………………………………………… 14
1.5.2. Các loại đặc trưng ……………………………………………………………………… 15
CHƯƠNG 2: TỔNG QUAN VỀ HỌC MÁY ……………………………………… 17
2.1. Giới thiệu về học máy …………………………………………………………………… 17
2.2. Phân loại các thuật toán học máy [2] ………………………………………………. 19
2.3. Thuật toán One-class SVM. …………………………………………………………… 20
2.3.1. Giới thiệu thuật toán One-class SVM …………………………………………… 20
2.3.2. Giới thiệu thuật toán SVM. …………………………………………………………. 21
2.3.3. Thuật toán One-class SVM theo tác giả Schölkopf ………………………… 25
2.3.4. Thuật toán One-class SVM theo tác giả Tax và Duin …………………….. 26
2.4. Đánh giá hiệu quả thuật toán ………………………………………………………….. 26
CHƯƠNG 3: PHƯƠNG PHÁP ÁP DỤNG HỌC MÁY VÀO PHÂN
TÍCH MÃ ĐỘC ………………………………………………………………………………… 30
3.1. Mô hình đề xuất thực hiện gồm các bước sau: ………………………………… 30
3.2. Thu thập và tiền xử lý xử liệu dữ liệu …………………………………………….. 31
3.2.1. Thu thập dữ liệu gói tin mạng ……………………………………………………… 31
3.2.2. Trích chọn đặc trưng trong header của gói tin ……………………………….. 32
3.2.3. Trích chọn đặc trưng từ payload gói tin ………………………………………… 33
3.3. Lựa chọn đặc trưng ……………………………………………………………………… 34
3.3.1. Lựa chọn đặc trưng từ header ……………………………………………………… 34
3.3.2. Lựa chọn đặc trưng từ payload ……………………………………………………. 35
3.4. Xây dựng mô hình học máy ………………………………………………………….. 36
3.5. Thực nghiệm và đánh giá kết quả …………………………………………………… 36
3.5.1. Dữ liệu thực nghiệm …………………………………………………………………… 36
3.5.2. Chương trình thực nghiệm ………………………………………………………….. 36
3.5.3. Đánh giá hiệu quả thuật toán ……………………………………………………….. 37
3.5.4. Kết quả thực nghiệm ………………………………………………………………….. 37
KẾT LUẬN ………………………………………………………………………………………. 39
TÀI LIỆU THAM KHẢO …………………………………………………………………. 41

