Menu

Giới thiệu 2 học phần tự chọn mới về xử lý dữ liệu lớn (Xử lý dữ liệu phân tán, Khai phá Web)

Được đăng vào ngày 17 tháng 10 năm 2016

 

Xử lý dữ liệu lớn (Big data processing) là lĩnh vực liên quan đến việc xử lý lượng dữ liệu (rất) lớn (ở mức từ terabytes hoặc petabytes trở lên), xuất hiện mới liên tục, và cần được xử lý (gần) tức thời. Gần đây, lĩnh vực Xử lý dữ liệu lớn được quan tâm rất nhiều và phát triển mạnh mẽ, do sự bùng nổ dữ liệu thu được và nhu cầu phân tích các nguồn dữ liệu khổng lồ đó để thu được các thông tin và tri thức nhằm phục vụ các mục đích thực tế. Xử lý dữ liệu lớn được ứng dụng rộng rãi trong nhiều lĩnh vực quan trọng, bao gồm Phân tích mạng xã hội (Social network analysis), Internet vạn vật (Internet of things), Mạng cảm biến (Sensors network), Thông minh doanh nghiệp (Business intelligence), Thành phố thông minh (Smart city), Ngôi nhà thông minh (Smart home), Giao thông thông minh (Intelligent transportation),...và nhiều lĩnh vực khác.

Với định hướng cập nhật theo các xu hướng phát triển công nghệ thông tin quan trọng, từ năm học 2016/2017, Bộ môn Hệ thống thông tin giới thiệu mới 2 học phần tự chọn: Xử lý dữ liệu phân tán, Khai phá Web. Hai học phần này cung cấp cho người học nhiều kiến thức và kinh nghiệm thực tế thuộc lĩnh vực Xử lý dữ liệu lớn.

IT4867 - Xử lý dữ liệu phân tán (Distributed data processing) là học phần giúp sinh viên hiểu được nguyên lý xử lý dữ liệu hiệu năng cao, các thuật toán và mô hình lập trình xử lý dữ liệu phân tán, và lựa chọn được giải pháp công nghệ để xử lý dữ liệu phân tán trong các bài toán thực tế (tìm kiếm thông tin, xử lý đồ thị, quản trị cơ sở dữ liệu, khai phá dữ liệu và học máy).

IT4868 - Khai phá Web (Web mining) giúp sinh viên thu được các kiến thức và hiểu biết các kỹ thuật cơ bản trong phát hiện tri thức từ các nguồn dữ liệu Web, bao gồm phân tích cộng đồng trong mạng xã hội, phân tích hành vi người dùng, phân tích quan điểm người dùng, gợi ý cho người dùng. Các nguồn dữ liệu Web có thể là các mạng xã hội, trang thông tin mạng, hay cổng mua sắm trực tuyến (như Facebook, Twitter, Amazon,...). Học phần này giới thiệu cụ thể về hai phương pháp phát hiện tri thức từ dữ liệu Web: Học máy thống kê (Statistical machine learning) và Phân tích đồ thị (Graph analysis). Ngoài ra, sinh viên được trải nghiệm với các bài toán thực tế và dữ liệu cụ thể.

 

Liên kết website