Giới thiệu
Ngày nay, công nghệ thông tin phát triển đồng nghĩa với việc phát triển các phần mềm ứng dụng. Phần mềm Khai phá dữ liệu là một công cụ phân tích dùng để phân tích dữ liệu, cho phép người sử dụng phân tích dữ liệu theo nhiều góc nhìn khác nhau, phân loại dữ liệu theo những quan điểm riêng biệt và tổng kết các mối quan hệ đã được bóc tách. Từ thực tế đó, Brainwork Việt Nam xây dựng và phát triển Khóa học "Khai phá dữ liệu nâng cao" với thông tin như sau:
Thời lượng
Khóa học diễn ra trong 2 ngày
Đối tượng tham dự
Cán bộ Nhân viên của các Tổ chức, Doanh nghiệp.
Mục tiêu
Sau khi tham dự khóa học, học viên có khả năng:
- Ứng dụng các thuật toán khai phá dữ liệu như phân lớp, phân cụm, luật kết hợp cũng như cách sử dụng các công cụ hỗ trợ xây dựng các bài toán khai phá dữ liệu;
- Sử dụng các kỹ thuật khai thác dữ liệu để phục vụ công tác thông kê, phân tích và quản lý.
Giảng viên
Nội dung
PHẦN 1
PHẦN 2
PHẦN 3
PHẦN 4
PHẦN 5
KIỂM TRA CUỐI KHOÁ
PHÂN LỚP DỮ LIỆU DỰA VÀO MẠNG NƠ-RON NHÂN TẠO
- Nhắc lại về bài toán phân lớp, nguyên tắc hoạt động
- Mô hình mạng nơ ron nhân tạo (ANN): các khái niệm, cấu hình
- Cơ chế tối ưu hóa mạng ANN
- Áp dụng ANN vào bài toán phân lớp và dự báo
- Một số ứng dụng
- Thực hành với Weka.
PHẦN 2
GOM CỤM DỮ LIỆU VÀ ỨNG DỤNG TRONG BI
- Bài toán gom cụm dữ liệu
- Các phương pháp đo độ tương đồng/ bất tương đồng giữa các đối tượng với các kiểu thuộc tính khác nhau
- Các phương pháp đánh giá các giải thuật gom cụm dữ liệu
- Gom cụm dữ liệu dựa vào phân hoạch: K-Means, K-Medoids
- Gom cụm dựa vào cây phân cấp: giải thuật PAM
- Gom cụm dữ liệu dựa vào mật độ: giải thuật DBSCAN
- Thực hành với Weka, RapidMiner R,...
PHẦN 3
KHAI PHÁ LUẬT KẾT VÀ ỨNG DỤNG TRONG BI
- Giới thiệu bài toán phân tích luật kết hợp
- Phương pháp Aprior
- Phương pháp FP-growth
PHẦN 4
CÁC VẤN ĐỀ CHUYÊN SÂU VỀ KHAI PHÁ DỮ LIỆU VÀ HỌC MÁY
- Giới thiệu một số vấn đề chuyên sâu về KPDL và học máy
- Thực hiện giải pháp: từ phân tích, chọn lựa giải pháp, tiền xử lý dữ liệu, áp dụng các kỹ thuật khai phá, biểu diễn kết quả
- Thực hành với Weka, RapidMiner R,...
PHẦN 5
ỨNG DỤNG VÀ THỰC HÀNH
- Bài toán phát hiện gian lận - intrusion detection systems (IDSs) có sử dụng kỹ thuật rất quan trọng là Bayesian Networks
- Trình bày theo nhóm kết quả thực hiện
- Phân tích ý nghĩa thực tiễn và ý nghĩa khoa học.
KIỂM TRA CUỐI KHOÁ
(*): Nội dung đào tạo có thể được điều chỉnh theo yêu cầu và thực tế triển khai.