Forum

Please or Register to create posts and topics.

Vòng đời của dữ liệu

Hình sau đây thể hiện đúng một vòng đời của dữ liệu

  1. Data Source là dữ liệu nguồn của doanh nghiệp bạn, bao gồm dữ liệu của các ứng dụng ERP, CRM, SCM, FP&A, CPM, hoặc các ứng dụng In-house của doanh nghiệp bạn phát triển nhằm đáp ứng các yêu cầu quản trị rất chuyên biệt của doanh nghiệp bạn, các dữ liệu quảng cáo, hoặc các dữ lệu khác. Các dữ liệu này thường là các dữ liệu của các Database như Oracle, MS SQL,các dữ liệu là các file như CSV, và các dữ liệu phi cấu trúc
  2. Thu gôm dữ liệu: bạn cần phải có một công cụ để truy xuất vào các dữ liệu nguồn, và lấy nội dung nó ra, tập hợp về một nơi, chức tất cả các dữ liệu của bạn, và nơi này thường được giới công nghệ gọi là Datalake
  3. Data Pipeline: Trong mớ hỗn độn dữ liệu trong Data Lake, bạn vẫn phải dùng công cụ để chắc lọc ra các dữ liệu thực sự có giá trị, có khả năng mang lại một giá trị nào đó cho một bộ phận nào đó, và bạn cần chắc lọc các dữ liệu này, các giai đoạn này gọi là Data Pipeline 

 

vòng đời của dữ liệu