Microsoft Fabric các tính năng mới Tháng 4/2025

·

·

Tóm tắt các tính năng mới của Microsoft Fabric – Tháng 4/2025

Microsoft Fabric tiếp tục mang đến những cải tiến vượt bậc trong bản cập nhật tháng 4/2025, tập trung vào việc nâng cao hiệu suất, đơn giản hóa quy trình và tích hợp AI vào các quy trình làm việc. Dưới đây là chi tiết các tính năng mới theo từng danh mục trong bảng cập nhật lần này

1. Cộng đồng và Sự kiện
Chứng chỉ Microsoft Fabric miễn phí
  • Chi tiết: Microsoft kỷ niệm 50 năm đổi mới bằng cách tặng 50.000 voucher thi chứng chỉ miễn phí (DP-600 hoặc DP-700) thông qua chương trình Microsoft AI Skills Fest. Người dùng có thể tham gia rút thăm hàng tuần để nhận voucher.
  • Lợi ích: Cơ hội nâng cao kỹ năng và đạt chứng chỉ Fabric mà không tốn chi phí.
  • Hành động: Đăng ký tại chương trình rút thăm để có cơ hội nhận voucher.
Các buổi học trực tiếp miễn phí cho Kỹ sư Dữ liệu
  • Chi tiết: Microsoft tổ chức các buổi học trực tiếp do chuyên gia Fabric hướng dẫn, giúp người dùng mới và người có kinh nghiệm nâng cao kỹ năng và tự tin thi chứng chỉ. Các buổi học bắt đầu từ 30/4/2025 (bằng tiếng Anh) và có bản ghi theo yêu cầu bằng tiếng Tây Ban Nha và Bồ Đào Nha.
  • Lợi ích: Hỗ trợ phát triển sự nghiệp kỹ sư dữ liệu với kiến thức thực tiễn.
  • Hành động: Đăng ký ngay để tham gia các buổi học.
2. Tổng quan
Fabric Copilot và Tính năng AI trên tất cả SKU trả phí
  • Chi tiết: Tính năng Fabric Copilot và các khả năng AI giờ đây có sẵn trên tất cả các SKU trả phí, bắt đầu từ F2 (trước đây yêu cầu SKU cao hơn). Bao gồm:
    • Fabric Copilot.
    • Đại lý dữ liệu Fabric.
    • Hàm AI Fabric.
  • Lợi ích:
    • Tăng khả năng tiếp cận các công cụ AI, giúp đội ngũ thử nghiệm và ứng dụng AI dễ dàng hơn.
    • Tăng năng suất, khám phá thông tin nhanh chóng và làm giàu dữ liệu liền mạch.
  • Lưu ý: SKU nhỏ hơn hỗ trợ số lượng yêu cầu AI giới hạn do dung lượng thấp hơn.
  • Hành động: Các đội ngũ có thể bắt đầu khám phá các tính năng AI trong Fabric ngay hôm nay.
New AI-powered capabilities coming to Data Wrangler
3. Khoa học Dữ liệu
Công cụ AI mã thấp tăng tốc năng suất trong Notebook (Preview)
  • Chi tiết: Các công cụ AI mã thấp mới trong Fabric Notebook giúp người dùng:
    • Chọn DataFrame (pandas hoặc Spark) và cột mục tiêu để biến đổi.
    • Điền các tham số cần thiết, Fabric sẽ tự động tạo mã.
  • Lợi ích: Giảm thời gian viết mã, tăng tốc xử lý dữ liệu và dễ dàng tích hợp AI vào quy trình làm việc.
  • Tài liệu tham khảo: Transform and enrich data seamlessly with AI functions.
Khả năng AI mã thấp trong Data Wrangler (Preview)
  • Chi tiết: Data Wrangler, công cụ mã thấp dành cho việc khám phá và biến đổi DataFrame, được nâng cấp với:
    • Gợi ý tự động dựa trên AI: Sử dụng AI dựa trên quy tắc từ nhóm Microsoft PROSE để đề xuất các thao tác làm sạch dữ liệu phù hợp.
    • Chuyển ngôn ngữ tự nhiên thành mã với Copilot: Người dùng có thể yêu cầu Copilot tạo mã tùy chỉnh, xem trước và áp dụng hoặc loại bỏ.
    • Chuyển mã từ pandas sang PySpark: Data Wrangler tự động chuyển đổi mã pandas sang PySpark khi xuất, tối ưu hóa hiệu suất.
  • Lợi ích: Giao diện trực quan, giảm rào cản kỹ thuật, hỗ trợ người dùng không chuyên về mã hóa.
  • Hành động: Khám phá Data Wrangler trong Fabric Notebook để trải nghiệm các tính năng AI mới.
4. Kho Dữ liệu (Data Warehouse)
Hỗ trợ ALTER TABLE DROP COLUMN và SP_RENAME COLUMN (Generally Available)
  • Chi tiết:
    • ALTER TABLE DROP COLUMN: Xóa cột không cần thiết để tối ưu hóa lưu trữ, cải thiện hiệu suất truy vấn.
    • SP_RENAME COLUMN: Đổi tên cột mà không gây gián đoạn, giảm rủi ro lỗi khi điều chỉnh schema.
  • Lưu ý:
    • Không hỗ trợ xóa cột từ bảng Lakehouse.
    • Không hỗ trợ đổi tên cột/bảng trong Lakehouse.
  • Lợi ích: Dễ dàng duy trì mô hình dữ liệu sạch và hiệu quả, đáp ứng nhu cầu kinh doanh thay đổi nhanh chóng.
  • Tài liệu tham khảo: sp_renameALTER TABLE.
Bảng tạm phân tán theo phiên (#temp table) trong Fabric Data Warehouse (Generally Available)
  • Chi tiết: Người dùng có thể tạo bảng tạm theo phiên (#temp tables) để quản lý kết quả truy vấn trung gian hiệu quả, với hai loại:
    • Bảng tạm không phân tán (mdf-backed): Tạo bằng cú pháp giống bảng thông thường, thêm tiền tố ‘#’.
    • Bảng tạm phân tán (Parquet-backed): Hỗ trợ xử lý dữ liệu lớn với phân phối ROUND_ROBIN.
  • Lợi ích: Linh hoạt, tối ưu hóa quy trình xử lý dữ liệu trong các tác vụ hàng loạt.
  • Tài liệu tham khảo: Session-scoped distributed #temp tables.
Trợ lý di chuyển cho Fabric Data Warehouse (Preview)
  • Chi tiết: Trợ lý di chuyển tích hợp trong Fabric giúp chuyển từ Azure Synapse Analytics (Data Warehouse) sang Fabric, với 4 bước:
    1. Di chuyển metadata.
    2. Khắc phục sự cố.
    3. Sao chép dữ liệu.
    4. Định tuyến lại kết nối.
  • Lợi ích: Đơn giản hóa di chuyển với công cụ đánh giá tích hợp và hỗ trợ AI, tận dụng khả năng Fabric mà không phức tạp.
  • Tài liệu tham khảo: Migration Assistant for Fabric Data Warehouse.
Hàm OPENROWSET (Generally Available)
  • Chi tiết: Hàm OPENROWSET cho phép đọc file Parquet và CSV từ Azure Data Lake StorageAzure Blob Storage, với các tính năng:
    • Hỗ trợ tham chiếu cấu trúc thư mục tùy chỉnh bằng ký tự đại diện (, /).
    • Đọc dữ liệu phân vùng từ cấu trúc Hive-style.
    • Hỗ trợ kiểu dữ liệu phức tạp (struct, array, map) dưới dạng JSON.
    • Tùy chỉnh schema kết quả với mệnh đề WITH.
    • Tích hợp với CTAS hoặc INSERT SELECT để biến đổi dữ liệu khi nhập.
  • Lợi ích: Cải thiện trải nghiệm nhập dữ liệu, hỗ trợ di chuyển dễ dàng từ SQL Server, Azure SQL, Synapse sang Fabric.
  • Ví dụ: SELECT TOP 10 * FROM OPENROWSET('path/to/file.parquet')
Câu lệnh BULK INSERT (Generally Available)
  • Chi tiết: BULK INSERT cho phép tải dữ liệu từ lưu trữ bên ngoài, tương tự COPY INTO, với cú pháp tương thích SQL Server và Azure SQL.
  • Lợi ích:
    • Hỗ trợ di chuyển dễ dàng từ SQL Server sang Fabric mà không cần thay đổi mã.
    • Hỗ trợ các tùy chọn truyền thống như file text/xml (bcp) và mã hóa không Unicode.
  • Ví dụ:BULK INSERT table_name FROM 'file_url_path'
Microsoft Fabric với các tính năng mới trong tháng 4.2025
5. Trí tuệ Thời gian Thực (Real-Time Intelligence)
Plugin OpenAI cho Eventhouse
  • Chi tiết: Hai plugin OpenAI mới:
    • AI concerned text: Tạo embedding bằng mô hình OpenAI trong KQL.
    • AI chat completion: Tăng cường phân tích dữ liệu với ChatGPT và các mô hình OpenAI.
  • Lợi ích: Hỗ trợ xây dựng ứng dụng RAG và nâng cao phân tích dữ liệu trong Eventhouse.
Thử thách Kusto Detective Agency
  • Chi tiết: Thử thách tối ưu hóa cho người mới làm quen với Real-Time Intelligence (RTI), sử dụng các công cụ:
    • Eventstream: Xử lý dữ liệu thời gian thực.
    • Eventhouse: Lưu trữ và truy vấn tập dữ liệu lớn.
    • Real-Time Dashboard: Trực quan hóa số liệu.
    • Activator: Kích hoạt phản hồi tự động.
  • Lợi ích: Học KQL qua trải nghiệm thực tế, có cơ hội nhận giải thưởng.
  • Hành động: Tham gia tại Kusto Detective Agency.
Tích hợp nguồn dữ liệu Azure Monitor với KQL Queryset
  • Chi tiết: Application InsightsLog Analytics giờ là nguồn dữ liệu chính thức trong KQL Queryset, hỗ trợ truy vấn đa dịch vụ dễ dàng.
  • Lợi ích: Khám phá và phân tích dữ liệu liền mạch mà không cần cấu hình bổ sung.
Cải tiến trải nghiệm khám phá dữ liệu mã thấp
  • Chi tiết:
    • Bảng cột phân cấp: Hiển thị danh sách cột, kiểu dữ liệu, thống kê (trung bình, min, max, cardinality).
    • Hành động chuột phải trên lưới dữ liệu: Sao chép, xuất dữ liệu nhanh chóng.
    • Pin vào dashboardChỉnh sửa trong Queryset.
  • Lợi ích: Dễ dàng khám phá và thao tác dữ liệu trong Real-Time Dashboard và KQL Database.
Cải tiến giám sát trong Eventhouse và KQL Database
  • Chi tiết:
    • Eventhouse System Overview: Theo dõi số hàng dữ liệu được nhập theo thời gian (1 giờ, 1 ngày, 7 ngày, 30 ngày).
    • Top 10 cơ sở dữ liệu truy vấn/nhập: Hiển thị thông tin truy vấn, lỗi, thời lượng.
  • Lợi ích: Tăng khả năng quan sát và quản lý hiệu suất hệ thống.
Kết nối thời tiết thời gian thực cho Eventstream
  • Chi tiết: Kết nối thời tiết thời gian thực mới trong Eventstream.
  • Lợi ích: Hỗ trợ xử lý và phân tích dữ liệu thời tiết theo thời gian thực.
6. Cơ sở dữ liệu (Databases)
Cơ sở dữ liệu SQL trong Fabric
  • Vùng mới được hỗ trợ:
    • Australia Southeast, Italy North, Japan East, Poland Central, WestUS3.
  • Thanh toán sao lưu:
    • Sao lưu tự động (hàng tuần, mỗi 12 giờ, mỗi 10 phút) với khả năng khôi phục điểm thời gian trong 7 ngày.
    • Từ 1/4/2025, tính phí lưu trữ sao lưu vượt quá kích thước cơ sở dữ liệu được cấp.
  • Bảng điều khiển hiệu suất:
    • Hiển thị truy vấn chặn chính, giúp xác định nhanh vấn đề hiệu suất.
  • Hỗ trợ Terraform, REST API, CLI:
    • Tự động hóa và quản lý cơ sở dữ liệu SQL qua Terraform, hỗ trợ Infrastructure-as-Code.
  • Tích hợp:
    • Hỗ trợ cơ sở dữ liệu SQL Fabric làm nguồn dữ liệu cho Stored Procedure và Script trong Fabric data pipelines.
  • Hỗ trợ cơ sở dữ liệu đồ thị:
    • Trình chỉnh sửa truy vấn T-SQL hỗ trợ cơ sở dữ liệu đồ thị, cho phép mô hình hóa quan hệ nhiều-đến-nhiều với mệnh đề MATCH.
7. Data Factory
Phản chiếu (Mirroring) cho Snowflake được bảo vệ bởi tường lửa (Preview)
  • Chi tiết: Hỗ trợ phản chiếu Snowflake qua VNet data gateway hoặc on-premises data gateway, đảm bảo kết nối an toàn qua điểm cuối riêng hoặc mạng riêng.
  • Lợi ích: Tăng cường bảo mật và khả năng tích hợp với Snowflake trong môi trường được bảo vệ.
  • Tài liệu tham khảo: Mirroring for Snowflake.
8. Kết luận

Bản cập nhật tháng 4/2025 của Microsoft Fabric mang đến hàng loạt cải tiến, từ công cụ AI mã thấp, tối ưu hóa kho dữ liệu, đến tích hợp thời gian thực và hỗ trợ cơ sở dữ liệu nâng cao. Những tính năng này không chỉ tăng năng suất mà còn đơn giản hóa quy trình, giúp doanh nghiệp tận dụng tối đa dữ liệu.

  • Hành động đề xuất:
    • Tham gia Fabric Community để thảo luận và cập nhật.
    • Khám phá tài liệu Fabric chi tiết tại docs.microsoft.com.
    • Gửi ý tưởng tại Fabric Ideas để định hình các tính năng tương lai.

Liên lạc BSD 0918 339 689 để tìm hiểu thêm về Microsoft Fabric, tìm hiểu về phương pháp tiếp cận và triển khai giải pháp Microsoft Fabric vào cho môi trường của doanh nghiệp bạn