TemplateMo 565 Onix Digital https://templatemo.com/tm-565-onix-digital -->


Phân tích dữ liệu lớn

Ngày nay, công nghệ thông tin phát triển đồng nghĩa với việc phát triển các phần mềm ứng dụng. Một lượng dữ liệu lớn yêu cầu công cụ phân tích dùng để phân tích, xử lý, lưu trữ khác nhau. Từ thực tế đó, Brainwork Việt Nam xây dựng và phát triển Khóa học “Phân tích dữ liệu lớn” với thông tin như sau:

Đối tượng tham dự

Cán bộ Nhân viên của các Tổ chức, Doanh nghiệp.

Mục tiêu

Sau khi tham dự khóa học, học viên có khả năng:

  • Trình bày tổng quan về Big Data: khái niệm, đặc điểm, thành phần;
  • Cập nhật các công nghệ sử dụng trong Big Data: cách lưu trữ, quản lý, xử lý và phân tích dữ liệu lớn phi cấu trúc để mang lại các số liệu theo yêu cầu hoạt động của Đơn vị;
  • Liệt kê các ứng dụng Big Data vào hoạt động của Đơn vị.

Thông tin giảng viên

Chuyên gia đào tạo về giải pháp công nghệ số cho các Tổ chức, Doanh nghiệp.

Nội dung

Phần 1 DỮ LIỆU LỚN – KHÁI NIỆM, TIỀM NĂNG, MÔ HÌNH & CÔNG CỤ TRIỂN KHAI

  • Big Data – Khái niệm, ứng dụng, xu hướng & tiềm năng
  • Hệ thống tính toán truyền thống– Vấn đề thường gặp
  • Các công nghệ xử lý Dữ liệu lớn
  • Kiến trúc phân tích dữ liệu – Giải pháp & Hạn chế
  • Hệ thống quản lý dữ liệu truyền thống và Hệ thống quản lý dữ liệu lớn
  • Dữ liệu lớn, dữ liệu thời gian thực & các ứng dụng
  • Ví dụ & Thảo luận.

Phần 2 HADOOP: NỀN TẢNG MÃ NGUỒN MỞ XỬ LÝ DỮ LIỆU CỰC LỚN

  • Hadoop – Đặc điểm, tính năng & yêu cầu
  • Kiếm trúc của Hadoop
  • Thực hành cài đặt Hadoop

Phần 3 HỆ THỐNG TẬP TIN PHÂN TÁN HADOOP (HDFS)

  • Hệ thống tập tin phân tán Hadoop (HDFS) –
  • Đặc điểm, chức năng & nguyên lý hoạt động
  • Ưu điểm & nhược điểm của HDFS
  • Các ứng dụng của Hadoop
  • Ví dụ, Trao đổi, Thảo luận & Thực hành

Phần 4 CÁC HỆ XỬ LÝ DỮ LIỆU CỦA HADOOP

  • MapReduce: Phân hệ xử lý dữ liệu lớn
  • YARN: Mô hình lập trình xử lý dữ liệu lớn
  • Hive: Hệ thống Lưu trữ và phân tích dữ liệu lớn
  • Pig: Nền tảng phân tích các tập dữ liệu lớn
  • Ví dụ và bài tập thực hành với các hệ xử lý dữ liệu của Hadoop (MapReduce, YARN, Hive, Pig)

Phần 5 SPARK – CÔNG CỤ XỬ LÝ DỮ LIỆU LỚN THỜI GIAN THỰC

  • Spark – Khái niệm, chức năng & yêu cầu
  • Phân biệt giữa Spark và Hadoop
  • Spark Streaming – Nguyên lý, ví dụ Spark Streaming
  • Cài đặt Spark, Ví dụ & Thực hành

Phần 6 MỘT SỐ ỨNG DỤNG CỦA BIG DATA & THỰC HÀNH

  • Ứng dụng cho Phân đoạn khách hàng/ Customer Segmentation
  • Ứng dụng cho Phòng ngừa khách hàng rời mạng/ Customer Churn Prevetation
  • Ví dụ & Thực hành

KIỂM TRA CUỐI KHOÁ

(*): Nội dung đào tạo có thể được điều chỉnh theo yêu cầu và thực tế triển khai.