Search for answers or browse our knowledge base.
Tham số và biến số pipeline trong Azure Data Factory và Azure Synapse Analytics
Tham số và biến số pipeline trong Azure Data Factory và Azure Synapse Analytics
Bài viết • 25/09/2024
Áp dụng cho: Azure Data Factory, Azure Synapse Analytics
Lưu ý: Đây là bài dịch
Mẹo: Hãy thử Azure Data Factory trong Microsoft Fabric, một giải pháp phân tích toàn diện cho doanh nghiệp. Microsoft Fabric bao gồm mọi thứ từ di chuyển dữ liệu (data movement) đến khoa học dữ liệu (data science), phân tích thời gian thực (real-time analytics), trí tuệ kinh doanh (business intelligence) và báo cáo (reporting). Tìm hiểu cách bắt đầu dùng thử miễn phí!
Bài viết này giúp bạn hiểu sự khác biệt giữa tham số (parameters) và biến số (variables) của pipeline trong Azure Data Factory và Azure Synapse Analytics, cũng như cách sử dụng chúng để kiểm soát hành vi của pipeline.
Tham số pipeline
Tham số (parameters) được định nghĩa ở cấp độ pipeline và không thể thay đổi trong suốt quá trình chạy pipeline. Tham số pipeline có thể được sử dụng để kiểm soát hành vi của pipeline và các hoạt động (activities) của nó, chẳng hạn như truyền thông tin kết nối cho một tập dữ liệu (dataset) hoặc đường dẫn của một tệp cần xử lý.
Cách định nghĩa một tham số pipeline
Để định nghĩa một tham số pipeline, hãy làm theo các bước sau:
- Nhấp vào pipeline của bạn để xem các tab cấu hình của nó.
- Chọn tab “Tham số (Parameters)”, và nhấp vào nút “+ Mới (+ New)” để định nghĩa một tham số mới.
- Nhập tên và mô tả cho tham số, sau đó chọn kiểu dữ liệu (data type) của nó từ menu thả xuống. Các kiểu dữ liệu có thể là Chuỗi (String), Số nguyên (Int), Số thực (Float), Boolean (Bool), Mảng (Array), Đối tượng (Object), hoặc Chuỗi Bảo mật (SecureString).
- Tùy chọn, bạn cũng có thể gán một giá trị mặc định (default value) cho tham số.
Hình ảnh: Giao diện tab Tham số (Parameters) trong Azure Data Factory
Sau khi định nghĩa một tham số pipeline, bạn có thể truy cập giá trị của nó trong quá trình chạy pipeline bằng cách sử dụng biểu thức @pipeline().parameters.
trong một hoạt động của pipeline. Ví dụ, nếu bạn đã định nghĩa một tham số có tên account_name
với kiểu Chuỗi (String), bạn có thể truy cập giá trị của nó trong một hoạt động bằng cách sử dụng biểu thức @pipeline().parameters.account_name
.
Tham số (Parameters) | Biến số (Variables) | Cài đặt (Settings) | Đầu ra (Output) | ||||
---|---|---|---|---|
Tên | Kiểu | Giá trị mặc định | ||
Mới (New) Xóa (Delete) | account_name | Chuỗi (String) | ab-8762 |
Trước mỗi lần chạy pipeline, bạn có thể gán một giá trị mới cho tham số của mình trong bảng điều khiển bên phải, nếu không pipeline sẽ sử dụng giá trị mặc định hoặc giá trị đã được định nghĩa trước đó.
Biến số pipeline
Biến số pipeline (pipeline variables) là các giá trị có thể được thiết lập và sửa đổi trong suốt quá trình chạy pipeline. Không giống như tham số pipeline, được định nghĩa ở cấp độ pipeline và không thể thay đổi trong quá trình chạy pipeline, biến số pipeline có thể được thiết lập và sửa đổi trong một pipeline bằng cách sử dụng hoạt động Đặt Biến số (Set Variable Activity).
Biến số pipeline có thể được sử dụng để lưu trữ và thao tác dữ liệu trong quá trình chạy pipeline, chẳng hạn như lưu trữ kết quả của một phép tính hoặc trạng thái hiện tại của một quy trình.
Lưu ý: Các biến số hiện đang được giới hạn ở cấp độ pipeline. Điều này có nghĩa là chúng không an toàn cho luồng (thread-safe) và có thể gây ra hành vi không mong muốn hoặc bất ngờ nếu chúng được truy cập từ bên trong một hoạt động lặp song song như vòng lặp foreach, đặc biệt khi giá trị cũng đang được sửa đổi trong hoạt động foreach đó.
Cách định nghĩa một biến số pipeline
Để định nghĩa một biến số pipeline, hãy làm theo các bước sau:
- Nhấp vào pipeline của bạn để xem các tab cấu hình của nó.
- Chọn tab “Biến số (Variables)”, và nhấp vào nút “+ Mới (+ New)” để định nghĩa một biến số mới.
- Nhập tên và mô tả cho biến số, sau đó chọn kiểu dữ liệu (data type) của nó từ menu thả xuống. Các kiểu dữ liệu có thể là Chuỗi (String), Boolean (Bool), hoặc Mảng (Array).
- Tùy chọn, bạn cũng có thể gán một giá trị mặc định (default value) cho biến số. Giá trị này sẽ được sử dụng làm giá trị ban đầu của biến số khi bắt đầu một lần chạy pipeline.
Hình ảnh: Giao diện tab Biến số (Variables) trong Azure Data Factory
Sau khi định nghĩa một biến số pipeline, bạn có thể truy cập giá trị của nó trong quá trình chạy pipeline bằng cách sử dụng biểu thức @variables('')
trong một hoạt động của pipeline. Ví dụ, nếu bạn đã định nghĩa một biến số có tên flag
với kiểu Mảng (Array), bạn có thể truy cập giá trị của nó trong một hoạt động bằng cách sử dụng biểu thức @variables('flag')
. Bạn cũng có thể sử dụng một hoạt động “Đặt Biến số (Set Variable)” để sửa đổi giá trị của biến số trong một pipeline.
Tham số (Parameters) | Biến số (Variables) | Cài đặt (Settings) | Đầu ra (Output) | ||||
---|---|---|---|---|
Tên | Kiểu | Giá trị mặc định | ||
Mới (New) Xóa (Delete) | flag | Boolean (Boolean) | true |
Nội dung liên quan
Xem các hướng dẫn sau để biết các bước chi tiết về việc tạo pipelines với các hoạt động: