Forum

Please or Register to create posts and topics.

Microsoft Power BI Thống Nhất Datamart với Fabric Data Warehouse

Microsoft Power BI Thống Nhất Datamart với Fabric Data Warehouse – Cập nhật quan trọng cho người dùng!
 
Microsoft vừa công bố một thay đổi lớn liên quan đến Power BI Datamart, và mình muốn chia sẻ thông tin chi tiết để mọi người nắm rõ và chuẩn bị cho quá trình chuyển đổi. Dưới đây là nội dung được tổng hợp từ bài blog chính thức của Microsoft Power BI (ngày 07/05/2025), với đầy đủ các lý do và hướng dẫn để bạn không bỏ sót điều gì!

Tổng quan về thay đổi
Power BI Datamart, ra mắt vào tháng 5/2022, là tính năng tự phục vụ giúp người dùng phân tích dữ liệu trên cơ sở dữ liệu quan hệ mà không cần hỗ trợ từ đội ngũ IT. Datamart được yêu thích nhờ:
  • Trải nghiệm low-code, dễ sử dụng cho phân tích cơ sở dữ liệu quan hệ.
  • Cơ sở dữ liệu được quản lý sẵn, không cần tinh chỉnh.
  • Tích hợp mượt mà với các artifact Power BI như Dataflows để xử lý ETL.
Tuy nhiên, qua phản hồi từ cộng đồng (blog, Microsoft Fabric Ideas), Microsoft nhận thấy Datamart còn nhiều hạn chế và không đáp ứng được các nhu cầu nâng cao. Vì vậy, Microsoft quyết định thống nhất Datamart với Fabric Data Warehouse, một giải pháp tiến hóa hơn, xây dựng trên nền tảng Azure Synapse Analytics và SQL Server, tích hợp AI và hỗ trợ phân tích quy mô lớn.
 
Lý do thống nhất
Dưới đây là các lý do chính dẫn đến việc chuyển đổi từ Datamart sang Fabric Data Warehouse, bao gồm cả hạn chế của Datamart và yêu cầu từ người dùng:
  1. Hạn chế về quy mô: Datamart chỉ hỗ trợ dung lượng tối đa 100GB, không phù hợp với các tập dữ liệu lớn.
  2. Hiệu suất giới hạn: Datamart thiếu khả năng tối ưu hóa truy vấn cho khối lượng dữ liệu phức tạp hoặc lớn.
  3. Thiếu hỗ trợ DDL/DML: Người dùng mong muốn tạo và quản lý các đối tượng SQL linh hoạt hơn, nhưng Datamart không đáp ứng được.
  4. Không có tích hợp Git: Datamart thiếu hỗ trợ Git, gây khó khăn cho việc phát triển và xem xét mã nguồn theo nhóm.
  5. Thiếu sao lưu dữ liệu: Datamart không có cơ chế sao lưu, dẫn đến rủi ro mất dữ liệu hoặc khó duy trì tính liên tục.
  6. Bảo mật hạn chế: Datamart thiếu các biện pháp kiểm soát truy cập chi tiết ở cấp đối tượng, hàng, hoặc cột.
  7. Không có lộ trình phát triển dài hạn: Người dùng lo ngại Datamart không thể mở rộng thành một giải pháp kho dữ liệu toàn diện.
  8. Tích hợp với Microsoft Fabric: Fabric Data Warehouse tích hợp tốt hơn với các dịch vụ Fabric (như Fabric ML) cho khoa học dữ liệu, phân tích, và AI.
  9. Công nghệ hiện đại hơn: Fabric Data Warehouse sử dụng công nghệ phân tích thế hệ mới, tích hợp AI (Copilot, tối ưu hóa truy vấn tự động).
  10. Định dạng dữ liệu mở: Dữ liệu lưu dưới dạng Delta/Parquet, hỗ trợ tương tác đa nền tảng với các nhà phân tích và nhà khoa học dữ liệu.
  11. Hỗ trợ truy vấn đa cơ sở dữ liệu: Fabric Data Warehouse cho phép truy vấn từ nhiều nguồn trong cùng không gian làm việc, điều mà Datamart không làm được.
  12. Tính linh hoạt trong cấp phép: Fabric Data Warehouse hỗ trợ Power BI Premium Capacity (P SKU) và Fabric Capacity (F SKU) với mô hình thanh toán linh hoạt, kèm bản dùng thử 60 ngày.

Lợi ích của Fabric Data Warehouse
So với Datamart, Fabric Data Warehouse mang lại nhiều cải tiến vượt trội:
  1. Hỗ trợ DDL/DML: Tạo và quản lý đối tượng SQL với đảm bảo giao dịch đa bảng.
  2. Khả năng mở rộng: Không giới hạn dung lượng dữ liệu, tối ưu hóa hiệu suất truy vấn nhanh chóng.
  3. Định dạng dữ liệu mở: Lưu trữ dưới dạng Delta/Parquet, hỗ trợ tương tác đa nền tảng.
  4. Tích hợp AI: Công cụ SQL được tối ưu bằng AI, không cần tinh chỉnh, kèm Copilot để đơn giản hóa phát triển SQL.
  5. Bảo mật chi tiết: Kiểm soát quyền truy cập ở cấp đối tượng, hàng, cột.
  6. Truy vấn đa cơ sở dữ liệu: Truy vấn dữ liệu từ nhiều nguồn trong cùng không gian làm việc Fabric.
  7. Tích hợp với Fabric: Hỗ trợ các dịch vụ như Fabric ML cho khoa học dữ liệu và phân tích.
  8. Direct Lake mode: Giảm thời gian làm mới mô hình ngữ nghĩa, loại bỏ nhu cầu sao chép dữ liệu.
  9. Khôi phục dữ liệu: Hỗ trợ sao chép bảng và khôi phục kho dữ liệu về thời điểm trước nếu xảy ra lỗi.
  10. Hiệu suất cao: Công nghệ từ Azure Synapse Analytics và SQL Server đảm bảo xử lý dữ liệu nhanh và đáng tin cậy.
Giá cả: Fabric Data Warehouse được hỗ trợ trong gói Power BI Premium Capacity (P SKU) hoặc Fabric Capacity (F SKU) với giá từ $0.36/giờ. Có bản dùng thử miễn phí 60 ngày để trải nghiệm.

Lộ trình chuyển đổi
Microsoft đang dần loại bỏ Power BI Datamart. Dưới đây là các mốc thời gian quan trọng:
  • Từ 01/06/2025: Không thể tạo Datamart mới trong Fabric portal. Người dùng sẽ nhận thông báo về việc Datamart bị ngừng hỗ trợ.
  • Từ 01/10/2025: Datamart sẽ chính thức bị xóa khỏi các không gian làm việc. Để tránh mất dữ liệu và gián đoạn báo cáo, bạn cần chuyển đổi sang Fabric Data Warehouse trước thời điểm này.
Cách kiểm tra Datamart hiện có
Để biết bạn đang sử dụng bao nhiêu Datamart, hãy sử dụng các công cụ sau:
  • Admin Monitoring workspace: Báo cáo Feature Usage and Adoption.
  • Purview Hub.
  • Power BI admin portal.
  • Power BI REST APIs.

Hướng dẫn chuyển đổi
Có 2 cách để chuyển đổi Datamart sang Fabric Data Warehouse:
  1. Sử dụng accelerator scripts
Microsoft cung cấp các script để tự động hóa quá trình chuyển đổi. Bạn có thể tìm chi tiết trên Fabric portal.
  1. Chuyển đổi thủ công
Dưới đây là các bước chi tiết:
  1. Vào Datamart, chọn Transform data trong ribbon, sau đó chọn Export template để xuất schema và dữ liệu dưới dạng template Power Query Online.
  2. Tạo Fabric Data Warehouse mới từ Fabric portal.
  3. Trong kho dữ liệu, từ tab Home, chọn Get data > New Dataflow Gen2. Lưu ý: Tạo Dataflow Gen2 từ kho dữ liệu sẽ đặt đích mặc định của truy vấn là kho dữ liệu hiện tại, giúp tiết kiệm thời gian.
  4. Trong trình chỉnh sửa Dataflow Gen2, chọn Import from a Power Query Template và nhập template đã xuất.
  5. Chọn Save & run để xuất bản Dataflow và làm mới dữ liệu vào Fabric Data Warehouse.
  6. Kết nối các báo cáo/dashboards Power BI với Fabric Data Warehouse qua Default Semantic Model hoặc làm nguồn dữ liệu.

Xem thêm về cách chuyển đổi từ Datamart sang Fabric Data Warehouse tại đây


Lưu ý khi chuyển đổi

Mô hình ngữ nghĩa tùy chỉnh

Khác với Datamart (tự động thêm tất cả bảng vào mô hình ngữ nghĩa mặc định), Fabric Data Warehouse không tự động thêm bảng để tránh đồng bộ nền không cần thiết, giúp tiết kiệm chi phí. Nếu bạn muốn kích hoạt:
  • Bật Sync the default Power BI semantic model trong cài đặt kho dữ liệu (lưu ý: có thể phát sinh chi phí).
  • Chọn thủ công các bảng và view để thêm vào mô hình ngữ nghĩa qua Manage default Power BI semantic model trong ribbon hoặc info bar.
Tối ưu hóa
Cân nhắc các tính năng tùy chọn của Fabric Data Warehouse để tối ưu hóa:
  • Direct Lake mode: Giảm thời gian làm mới dữ liệu.
  • Khôi phục dữ liệu: Sử dụng tính năng sao chép bảng hoặc khôi phục kho dữ liệu để bảo vệ dữ liệu.

Kết luận
Việc thống nhất Datamart với Fabric Data Warehouse là một bước tiến lớn, mang lại hiệu suất, khả năng mở rộng, và tích hợp AI vượt trội cho người dùng Power BI. Tuy nhiên, thời gian chuyển đổi khá gấp rút (trước 01/10/2025), nên mọi người cần lên kế hoạch sớm để tránh mất dữ liệu hoặc gián đoạn báo cáo.
Mọi người có kinh nghiệm, câu hỏi, hoặc mẹo gì về quá trình chuyển đổi này không? Hãy chia sẻ để cùng thảo luận nhé! Nếu bạn cần thêm tài liệu hoặc hỗ trợ, mình sẵn sàng giúp.
 
Nguồn: Blog Microsoft Power BI – “Unify Datamart with Fabric Data Warehouse!” (07/05/2025)