PHÂN TÍCH DỮ LIỆU LỚN PHỤC VỤ CHÍNH PHỦ ĐIỆN TỬ

Ngày nay, phát triển Chính phủ điện tử là xu thế tất yếu, là mô hình phổ biến của nhiều quốc gia, xây dựng Chính phủ điện tử trở thành nhiệm vụ quan trọng hàng đầu của bất cứ chính phủ nào, trong đó việc thu thập và khai thác dữ liệu là một thách thức đặc biệt với các cơ quan chính phủ liên quan đến việc quản lý và sử dụng dữ liệu cho các mục đích khác nhau. Từ thực tế đó, Brainwork Việt Nam xây dựng và phát triển Khóa học “Phân tích Dữ liệu lớn phục vụ Chính phủ điện tử” với thông tin như sau:

Đối tượng tham dự

Cán bộ Nhân viên của các Tổ chức, Đơn vị quản lý Nhà nước.

Mục tiêu

Sau khi tham dự khóa học, học viên có khả năng:

  • Trình bày tổng quan về Chính phủ số, Thành phố thông minh và Big Data;
  • Cập nhật các công nghệ sử dụng trong Big Data: cách lưu trữ, quản lý, xử lý và phân tích dữ liệu lớn phi cấu trúc để mang lại các số liệu theo yêu cầu hoạt động của Đơn vị;
  • Liệt kê các ứng dụng Big Data vào hoạt động của Đơn vị.

Thông tin giảng viên

Chuyên gia đào tạo về giải pháp công nghệ cho các Tổ chức, Đơn vị.

Nội dung

Phần 1 DỮ LIỆU LỚN – KHÁI NIỆM, TIỀM NĂNG VÀ MÔ HÌNH, CÔNG CỤ TRIỂN KHAI

  • Chính phủ số, Thành phố thông minh và Big Data
  • Mô hình Phân tích dữ liệu lớn và các ứng dụng cho các dịch vụ công
  • Các Công nghệ cho Dữ liệu lớn
  • Kiến trúc phân tích dữ liệu hiện tại – Giải pháp & Hạn chế

Phần 2 HADROOP – NỀN TẢNG MÃ NGUỒN MỞ XỬ LÝ DỮ LIỆU LỚN

  • Hadroop – Nền tảng mã nguồn mở cho xử lý dữ liệu cực lớn trong môi trường tính toán phân tán
  • Đặc điểm, tính năng, yêu cầu và kiến trúc của Hadroop
  • Lưu trữ dữ liệu của Hadroop
  • Đặc điểm, chức năng và nguyên lý hoạt động của HDFS
  • Ứng dụng cho Chính phủ số
  • Cài đặt Hadrop: Hướng dẫn & Thực hành.

Phần 3 CÁC HỆ XỬ LÝ DỮ LIỆU CỦA HADROOP

  • MapReduce: Phân hệ xử lý dữ liệu liệu lớn
  • YARN: Mô hình lập trình xử lý dữ liệu lớn
  • Hive: Hệ thống Lưu trữ và Phân tích dữ liệu lớn
  • Pig: Nền tảng phân tích các tập dữ liệu lớn

Phần 4 SPARK – CÔNG CỤ XỬ LÝ DỮ LIỆU LỚN THỜI GIAN THỰC

  • Spark: Khái niệm, chức năng và yêu cầu
  • Phân biệt giữa Spark và Hadoop
  • Ứng dụng cho Chính phủ số

Phần 5 QUẢN LÝ CÁC DỰ ÁN PHÂN TÍCH DỮ LIỆU LỚN

  • Tổng quan vòng đời (lifecycle) của dự án phân tích dữ liệu Big Data
  • Chuyển đổi vấn đề của việc cung cấp dịch vụ công yêu cầu của việc phân tích dữ liệu Big Data
  • Ví dụ & Thực hành.

KIỂM TRA CUỐI KHOÁ

(*): Nội dung đào tạo có thể được điều chỉnh theo yêu cầu và thực tế triển khai.