Search for answers or browse our knowledge base.
Thiết lập môi trường tích hợp tự quản cho trình kết nối SAP CDC trong Azure Data Factory
Thiết lập môi trường tích hợp tự quản cho trình kết nối SAP CDC trong Azure Data Factory
Bài viết • 15/05/2024
ÁP DỤNG CHO: Azure Data Factory, Azure Synapse Analytics
Mẹo
Hãy thử Azure Data Factory trong Microsoft Fabric, một giải pháp phân tích toàn diện cho doanh nghiệp. Microsoft Fabric bao gồm mọi thứ từ di chuyển dữ liệu (data movement) đến khoa học dữ liệu (data science), phân tích thời gian thực (real-time analytics), trí tuệ kinh doanh (business intelligence) và báo cáo (reporting). Tìm hiểu cách bắt đầu dùng thử miễn phí tại start a new trial for free!
Tìm hiểu cách tạo và thiết lập một môi trường tích hợp tự quản (self-hosted integration runtime) cho trình kết nối SAP CDC (SAP change data capture – CDC) trong Azure Data Factory. SAP CDC là một giải pháp mạnh mẽ giúp trích xuất dữ liệu thay đổi từ hệ thống SAP, và việc thiết lập môi trường tích hợp tự quản là bước quan trọng để triển khai SAP CDC hiệu quả.
Để chuẩn bị một môi trường tích hợp tự quản (self-hosted integration runtime) sử dụng với trình kết nối SAP CDC, hãy thực hiện các bước được mô tả trong các phần sau.
Tạo và thiết lập môi trường tích hợp tự quản cho SAP CDC
Trong Azure Data Factory Studio, bạn cần tạo và cấu hình một môi trường tích hợp tự quản (self-hosted integration runtime) để hỗ trợ SAP CDC. Bạn có thể tải xuống phiên bản mới nhất của môi trường tích hợp tự quản riêng (private self-hosted integration runtime). Phiên bản tải xuống này có hiệu suất cải thiện và cung cấp thông báo lỗi chi tiết, rất hữu ích khi làm việc với SAP CDC. Hãy cài đặt môi trường này trên máy tính tại chỗ (on-premises computer) hoặc trên một máy ảo (virtual machine – VM).
Máy tính chạy môi trường tích hợp tự quản (self-hosted integration runtime) càng có nhiều lõi CPU (CPU cores), thì thông lượng trích xuất dữ liệu (data extraction throughput) với SAP CDC càng cao. Ví dụ, một thử nghiệm nội bộ đã đạt được thông lượng trên 12 MB/s khi thực hiện trích xuất song song (parallel extractions) trên một máy tính chạy môi trường tích hợp tự quản với 16 lõi CPU.
Lưu ý
Nếu bạn muốn sử dụng môi trường tích hợp tự quản chia sẻ (shared self-hosted integration runtime) từ một Data Factory khác để hỗ trợ SAP CDC, hãy đảm bảo rằng Data Factory của bạn nằm trong cùng khu vực (region) với Data Factory kia. Hơn nữa, môi trường tích hợp luồng dữ liệu (Data Flow integration runtime) của bạn cần được cấu hình thành “Tự động giải quyết” (Auto Resolve) hoặc cùng khu vực với Data Factory của bạn.
Tải xuống và cài đặt trình kết nối SAP .NET cho SAP CDC
Tải xuống phiên bản 64-bit mới nhất của Trình kết nối SAP .NET (SAP .NET Connector – SAP NCo 3.0) và cài đặt nó trên máy tính chạy môi trường tích hợp tự quản (self-hosted integration runtime) để hỗ trợ SAP CDC. Trong quá trình cài đặt, trong hộp thoại Các bước thiết lập tùy chọn (Optional setup steps dialog), chọn tùy chọn Cài đặt tập hợp vào GAC (Install assemblies to GAC), sau đó chọn Tiếp theo (Next).
Hình ảnh: Cửa sổ “SAP .NET Connector 3.0 for .NET 4.0 on x64” hiển thị phần “Optional setup steps” với các tùy chọn: “None”, “Install assemblies to GAC”, và “Register WMI provider and install assemblies to GAC”.
Thêm quy tắc bảo mật mạng cho SAP CDC
Thêm một quy tắc bảo mật mạng (network security rule) trên hệ thống SAP của bạn để máy tính chạy môi trường tích hợp tự quản (self-hosted integration runtime) có thể kết nối với chúng, đảm bảo SAP CDC hoạt động hiệu quả. Nếu hệ thống SAP của bạn nằm trên một máy ảo Azure (Azure VM), để thêm quy tắc, hãy làm như sau:
- Đặt Dải địa chỉ IP nguồn/CIDR (Source IP addresses/CIDR ranges) thành địa chỉ IP của máy chạy môi trường tích hợp tự quản (self-hosted integration runtime machine).
- Đặt Dải cổng đích (Destination port ranges) thành 3200, 3300. Ví dụ:
Kiểm tra kết nối với hệ thống SAP cho SAP CDC
Trên máy tính chạy môi trường tích hợp tự quản (self-hosted integration runtime), chạy lệnh PowerShell (PowerShell cmdlet) sau để đảm bảo rằng nó có thể kết nối với hệ thống SAP, hỗ trợ SAP CDC hoạt động ổn định:
Test-NetConnection <SAP system IP address> -port 3300
Kết quả mẫu:
PS C:\Users\> Test-NetConnection ComputerName : <SAP system IP address> RemoteAddress : <SAP system IP address> RemotePort : 3300 InterfaceAlias : <interface name> SourceAddress : <local IP address> TcpTestSucceeded : True
Chỉnh sửa tệp hosts để hỗ trợ SAP CDC
Chỉnh sửa tệp hosts trên máy tính chạy môi trường tích hợp tự quản (self-hosted integration runtime) để thêm địa chỉ IP SAP (SAP IP addresses) vào tên máy chủ (server names), giúp SAP CDC kết nối chính xác với hệ thống SAP.
Trên máy tính chạy môi trường tích hợp tự quản (self-hosted integration runtime), chỉnh sửa tệp C:\Windows\System32\drivers\etc\hosts
để thêm ánh xạ địa chỉ IP của hệ thống SAP (SAP system IP addresses) đến tên máy chủ (server names). Ví dụ:
# SAP ECC xxx.xxx.xxx.xxx <SAP server name>
Nội dung liên quan
Để biết thêm chi tiết về cách thiết lập và sử dụng SAP CDC trong Azure Data Factory, hãy tham khảo các tài liệu liên quan.