Module 1: Tạo một pipeline với Data Factory
Module này mất 10 phút, thực hiện việc nhập dữ liệu thô từ kho lưu trữ nguồn vào bảng Bronze của một Lakehouse dữ liệu bằng cách sử dụng hoạt động Copy trong một pipeline.
Các bước chính trong mô-đun 1 bao gồm như sau:
- Tạo một pipeline dữ liệu.
- Sử dụng hoạt động Copy trong pipeline để tải dữ liệu mẫu vào một Lakehouse dữ liệu.
Tạo một pipeline dữ liệu
- Yêu cầu một tài khoản Microsoft Fabric tenant với đăng ký đang hoạt động. Tạo một tài khoản miễn phí.
- Đảm bảo bạn có một Workspace được kích hoạt Microsoft Fabric: Tạo một workspace.
- Đăng nhập vào Power BI.
- Chọn biểu tượng Power BI mặc định ở góc dưới bên trái của màn hình và chọn Fabric.
- Chọn một workspace từ tab Workspaces, sau đó chọn + New item, và chọn Data pipeline. Cung cấp tên cho pipeline. Sau đó chọn Create.
Thêm hoạt động Copy
- Hộp thoại Copy data được hiển thị với bước đầu tiên, Choose data source, được đánh dấu. Chọn Sample data từ các tùy chọn ở đầu hộp thoại, sau đó chọn NYC Taxi – Green.
- Bản xem trước nguồn dữ liệu xuất hiện tiếp theo trên trang Connect to data source. Xem xét và sau đó chọn Next.
- Đối với bước Choose data destination của trợ lý sao chép, chọn Lakehouse.
- Bây giờ, cấu hình chi tiết đích Lakehouse của bạn trên trang Select and map to folder path or table. Chọn Tables cho Root folder và Load to new table cho Load settings. Cung cấp Table name và chọn Next.
- Xem xét tóm tắt hoạt động Copy và xác nhận.
Chi tiết pipeline
- Pipeline run ID: 6666aaa-77bb-ccc-dd88-eeeee999999
- Tên: Copy data 1
- Loại: Copy data
- Thời gian bắt đầu chạy: 26/04/2023, 4:22:58 PM
- Thời lượng: 00:00:59
- Trạng thái: Thành công
- Chi tiết: 1,508,501 dòng được đọc và ghi.
- Nguồn: Azure Blob Storage
- Đích: Lakehouse
- Dữ liệu đọc: 1.185 GB
- Dữ liệu ghi: 37.977 MB
- Tệp đọc: 1
- Tệp ghi: 1
- Thông lượng: 23.698 MB/s
- Tổng thời lượng: 00:00:56
- DIUs sử dụng: 4
- Sao chép song song sử dụng: 1
Nội dung liên quan
Trong module đầu tiên này của hướng dẫn toàn diện về tích hợp dữ liệu đầu tiên của bạn bằng Data Factory trong Microsoft Fabric, bạn đã học cách:
- Tạo một pipeline dữ liệu.
- Thêm một hoạt động Copy vào pipeline của bạn.
- Sử dụng dữ liệu mẫu và tạo một Lakehouse dữ liệu để lưu trữ dữ liệu vào một bảng mới.
- Chạy pipeline và xem chi tiết cũng như phân tích thời lượng của nó.
Tiếp tục sang phần tiếp theo để tạo dataflow của bạn.
Mô-đun 2: Chuyển đổi dữ liệu với dataflow trong Data Factory