How Can We Help?

Search for answers or browse our knowledge base.

Table of Contents
< All Topics
Print

Tham số và biến số pipeline trong Azure Data Factory và Azure Synapse Analytics

Tham số và biến số pipeline trong Azure Data Factory và Azure Synapse Analytics

Bài viết • 25/09/2024

Áp dụng cho: Azure Data FactoryAzure Synapse Analytics

Lưu ý: Đây là bài dịch

Mẹo: Hãy thử Azure Data Factory trong Microsoft Fabric, một giải pháp phân tích toàn diện cho doanh nghiệp. Microsoft Fabric bao gồm mọi thứ từ di chuyển dữ liệu (data movement) đến khoa học dữ liệu (data science), phân tích thời gian thực (real-time analytics), trí tuệ kinh doanh (business intelligence) và báo cáo (reporting). Tìm hiểu cách bắt đầu dùng thử miễn phí!

Bài viết này giúp bạn hiểu sự khác biệt giữa tham số (parameters) và biến số (variables) của pipeline trong Azure Data Factory và Azure Synapse Analytics, cũng như cách sử dụng chúng để kiểm soát hành vi của pipeline.

Tham số pipeline

Tham số (parameters) được định nghĩa ở cấp độ pipeline và không thể thay đổi trong suốt quá trình chạy pipeline. Tham số pipeline có thể được sử dụng để kiểm soát hành vi của pipeline và các hoạt động (activities) của nó, chẳng hạn như truyền thông tin kết nối cho một tập dữ liệu (dataset) hoặc đường dẫn của một tệp cần xử lý.

Cách định nghĩa một tham số pipeline

Để định nghĩa một tham số pipeline, hãy làm theo các bước sau:

  • Nhấp vào pipeline của bạn để xem các tab cấu hình của nó.
  • Chọn tab “Tham số (Parameters)”, và nhấp vào nút “+ Mới (+ New)” để định nghĩa một tham số mới.
  • Nhập tên và mô tả cho tham số, sau đó chọn kiểu dữ liệu (data type) của nó từ menu thả xuống. Các kiểu dữ liệu có thể là Chuỗi (String), Số nguyên (Int), Số thực (Float), Boolean (Bool), Mảng (Array), Đối tượng (Object), hoặc Chuỗi Bảo mật (SecureString).
  • Tùy chọn, bạn cũng có thể gán một giá trị mặc định (default value) cho tham số.

Hình ảnh: Giao diện tab Tham số (Parameters) trong Azure Data Factory

Sau khi định nghĩa một tham số pipeline, bạn có thể truy cập giá trị của nó trong quá trình chạy pipeline bằng cách sử dụng biểu thức @pipeline().parameters. trong một hoạt động của pipeline. Ví dụ, nếu bạn đã định nghĩa một tham số có tên account_name với kiểu Chuỗi (String), bạn có thể truy cập giá trị của nó trong một hoạt động bằng cách sử dụng biểu thức @pipeline().parameters.account_name.

Tham số (Parameters) | Biến số (Variables) | Cài đặt (Settings) | Đầu ra (Output)
TênKiểuGiá trị mặc định
Mới (New) Xóa (Delete)account_nameChuỗi (String)ab-8762

Trước mỗi lần chạy pipeline, bạn có thể gán một giá trị mới cho tham số của mình trong bảng điều khiển bên phải, nếu không pipeline sẽ sử dụng giá trị mặc định hoặc giá trị đã được định nghĩa trước đó.

Biến số pipeline

Biến số pipeline (pipeline variables) là các giá trị có thể được thiết lập và sửa đổi trong suốt quá trình chạy pipeline. Không giống như tham số pipeline, được định nghĩa ở cấp độ pipeline và không thể thay đổi trong quá trình chạy pipeline, biến số pipeline có thể được thiết lập và sửa đổi trong một pipeline bằng cách sử dụng hoạt động Đặt Biến số (Set Variable Activity).

Biến số pipeline có thể được sử dụng để lưu trữ và thao tác dữ liệu trong quá trình chạy pipeline, chẳng hạn như lưu trữ kết quả của một phép tính hoặc trạng thái hiện tại của một quy trình.

Lưu ý: Các biến số hiện đang được giới hạn ở cấp độ pipeline. Điều này có nghĩa là chúng không an toàn cho luồng (thread-safe) và có thể gây ra hành vi không mong muốn hoặc bất ngờ nếu chúng được truy cập từ bên trong một hoạt động lặp song song như vòng lặp foreach, đặc biệt khi giá trị cũng đang được sửa đổi trong hoạt động foreach đó.

Cách định nghĩa một biến số pipeline

Để định nghĩa một biến số pipeline, hãy làm theo các bước sau:

  • Nhấp vào pipeline của bạn để xem các tab cấu hình của nó.
  • Chọn tab “Biến số (Variables)”, và nhấp vào nút “+ Mới (+ New)” để định nghĩa một biến số mới.
  • Nhập tên và mô tả cho biến số, sau đó chọn kiểu dữ liệu (data type) của nó từ menu thả xuống. Các kiểu dữ liệu có thể là Chuỗi (String), Boolean (Bool), hoặc Mảng (Array).
  • Tùy chọn, bạn cũng có thể gán một giá trị mặc định (default value) cho biến số. Giá trị này sẽ được sử dụng làm giá trị ban đầu của biến số khi bắt đầu một lần chạy pipeline.

Hình ảnh: Giao diện tab Biến số (Variables) trong Azure Data Factory

Sau khi định nghĩa một biến số pipeline, bạn có thể truy cập giá trị của nó trong quá trình chạy pipeline bằng cách sử dụng biểu thức @variables('') trong một hoạt động của pipeline. Ví dụ, nếu bạn đã định nghĩa một biến số có tên flag với kiểu Mảng (Array), bạn có thể truy cập giá trị của nó trong một hoạt động bằng cách sử dụng biểu thức @variables('flag'). Bạn cũng có thể sử dụng một hoạt động “Đặt Biến số (Set Variable)” để sửa đổi giá trị của biến số trong một pipeline.

Tham số (Parameters) | Biến số (Variables) | Cài đặt (Settings) | Đầu ra (Output)
TênKiểuGiá trị mặc định
Mới (New) Xóa (Delete)flagBoolean (Boolean)true

Nội dung liên quan

Xem các hướng dẫn sau để biết các bước chi tiết về việc tạo pipelines với các hoạt động:

Was this article helpful?
0 out of 5 stars
5 Stars 0%
4 Stars 0%
3 Stars 0%
2 Stars 0%
1 Stars 0%
5
Please Share Your Feedback
How Can We Improve This Article?