Forum

Please or Register to create posts and topics.

Giới thiệu Microsoft Fabric

Microsoft Fabric: Giải pháp phân tích dữ liệu cho kỷ nguyên AI

Microsoft Fabric là một giải pháp phân tích tất cả-trong-một dành cho các doanh nghiệp, bao gồm mọi thứ từ chuyển động dữ liệu đến khoa học dữ liệu, phân tích thời gian thực và kinh doanh thông minh. Nó cung cấp một bộ dịch vụ toàn diện, bao gồm kho lưu trữ dữ liệu thô (data lake), kỹ thuật dữ liệu và tích hợp dữ liệu, tất cả ở một nơi.

Với Microsoft Fabric, bạn không cần phải ghép các dịch vụ khác nhau từ nhiều nhà cung cấp lại với nhau. Thay vào đó, bạn có thể tận hưởng một sản phẩm tích hợp cao, toàn diện và dễ sử dụng được thiết kế để đơn giản hóa nhu cầu phân tích của bạn.

Nền tảng này được xây dựng trên nền tảng của Software as a Service (SaaS), đưa sự đơn giản và tích hợp lên một cấp độ hoàn toàn mới.

Nền tảng SaaS

Microsoft Fabric tập hợp các thành phần mới và hiện có từ Power BI, Azure Synapse và Azure Data Explorer vào một môi trường tích hợp duy nhất. Các thành phần này sau đó được trình bày trong các trải nghiệm người dùng tùy chỉnh khác nhau.

Microsoft Fabric

Microsoft Fabric tập hợp các trải nghiệm như Data Engineering, Data Factory, Data Science, Data Warehouse, Real-Time Analytics và Power BI trên nền tảng SaaS. Sự tích hợp này mang lại những lợi ích sau:

  • Một loạt các phân tích tích hợp sâu trong ngành.
  • Chia sẻ các kinh nghiệm quen thuộc và dễ học.
  • Các nhà phát triển có thể dễ dàng truy cập và sử dụng lại tất cả các tài sản.
  • Một kho dữ liệu thống nhất cho phép bạn giữ lại dữ liệu tại chỗ trong khi sử dụng các công cụ phân tích ưa thích của mình.
  • Quản trị tập trung trên tất cả các trải nghiệm.

Với trải nghiệm Microsoft Fabric SaaS, tất cả dữ liệu và dịch vụ được tích hợp liền mạch. Các nhóm CNTT có thể định cấu hình tập trung các khả năng cốt lõi của doanh nghiệp và các quyền được tự động áp dụng trên tất cả các dịch vụ cơ bản. Ngoài ra, các label nhạy cảm với dữ liệu được kế thừa tự động trên các mục trong bộ phần mềm.

Microsoft Fabric cho phép người sáng tạo tập trung vào việc tạo ra tác phẩm tốt nhất của họ, giải phóng khỏi nhu cầu tích hợp, quản lý hoặc hiểu cơ sở hạ tầng cơ bản hỗ trợ trải nghiệm.

Các thành phần của Microsoft Fabric

Microsoft Fabric cung cấp bộ trải nghiệm phân tích toàn diện được thiết kế để hoạt động cùng nhau một cách liền mạch. Mỗi trải nghiệm được điều chỉnh cho phù hợp với một tính cách và một nhiệm vụ cụ thể. Kết cấu bao gồm các trải nghiệm hàng đầu trong ngành trong các danh mục sau đây để đáp ứng nhu cầu phân tích từ đầu đến cuối.

Microsoft Power BI

  • Data Engineering – Cung cấp nền tảng Spark đẳng cấp thế giới với trải nghiệm authoring tuyệt vời, cho phép các kỹ sư dữ liệu thực hiện chuyển đổi dữ liệu quy mô lớn và cấp quyền truy cập và sử dụng dữ liệu thông qua lakehouse. Sự tích hợp của Microsoft Fabric Spark với Data Factory cho phép lên lịch và sắp xếp sổ ghi chép và công việc.
  • Data Factory – Kết hợp tính đơn giản của Power Query với quy mô và sức mạnh của Azure Data Factory, bạn có thể sử dụng hơn 200 trình kết nối gốc để kết nối với các nguồn dữ liệu tại chỗ và trên đám mây.
  • Data Science – Cho phép bạn xây dựng, triển khai và vận hành các mô hình machine learning một cách liền mạch trong trải nghiệm Fabric của mình. Nó tích hợp với Azure Machine Learning để cung cấp đăng ký mô hình và theo dõi thử nghiệm tích hợp. Các nhà khoa học dữ liệu được trao quyền để làm phong phú thêm dữ liệu của tổ chức bằng các dự đoán và tích hợp những dự đoán đó vào báo cáo BI.
  • Data Warehouse – Cung cấp quy mô và hiệu suất SQL hàng đầu. Nó tách biệt hoàn toàn điện toán khỏi lưu trữ, cho phép mở rộng quy mô độc lập của cả hai thành phần. Ngoài ra, nó còn lưu trữ dữ liệu ở định dạng Delta Lake mở.
  • Real-Time Analytics – Dữ liệu quan sát được thu thập từ nhiều nguồn khác nhau như ứng dụng, thiết bị IoT, tương tác của con người, v.v. Nó hiện là loại dữ liệu phát triển nhanh nhất. Dữ liệu này thường ở dạng bán cấu trúc ở các định dạng như JSON hoặc Text với số lượng lớn, các lược đồ thay đổi khiến các nền tảng lưu trữ dữ liệu truyền thống khó hoạt động. Real-Time Analytics là công cụ tốt nhất để phân tích dữ liệu quan sát.
  • Power BI – Đây là nền tảng Business Intelligence hàng đầu thế giới. Nó đảm bảo rằng chủ sở hữu doanh nghiệp có thể truy cập tất cả dữ liệu trong Fabric một cách nhanh chóng và trực quan để đưa ra quyết định tốt hơn với dữ liệu.

Fabric tập hợp tất cả những trải nghiệm này thành một nền tảng thống nhất để phân tích dữ liệu lớn và toàn diện nhất.

OneLake và lakehouse – Sự hợp nhất của lakehouses

Nền tảng Microsoft Fabric hợp nhất kiến trúc OneLake và lakehouse trong toàn doanh nghiệp.

OneLake

Data lake là nền tảng mà tất cả các dịch vụ Fabric được xây dựng trên đó. Microsoft Fabric Lake còn được gọi là OneLake được tích hợp vào dịch vụ Fabric và cung cấp một vị trí thống nhất để lưu trữ tất cả dữ liệu tổ chức nơi các trải nghiệm hoạt động.

OneLake được xây dựng trên ADLS (Azure Data Lake Storage) Gen2. Nó cung cấp một trải nghiệm SaaS duy nhất và một kho lưu trữ dữ liệu trên toàn bộ tenant phục vụ cả nhà phát triển chuyên nghiệp và cá nhân. Trải nghiệm OneLake SaaS đơn giản hóa các trải nghiệm, loại bỏ nhu cầu người dùng hiểu bất kỳ khái niệm cơ sở hạ tầng nào như nhóm tài nguyên, RBAC (Kiểm soát truy cập dựa trên vai trò), Azure Resource Manager, dự phòng hoặc vùng. Ngoài ra, nó thậm chí không yêu cầu người dùng phải có tài khoản Azure.

OneLake loại bỏ các silo dữ liệu hỗn loạn và phổ biến hiện nay mà các nhà phát triển tạo ra khi họ cung cấp và định cấu hình các tài khoản lưu trữ bị cô lập của riêng họ. Thay vào đó, OneLake cung cấp một hệ thống lưu trữ thống nhất, duy nhất cho tất cả các nhà phát triển và việc tuân thủ các cài đặt chính sách và bảo mật được thực thi một cách tập trung và thống nhất.

Cơ cấu tổ chức của OneLake và lakehouse

OneLake có bản chất phân cấp để đơn giản hóa việc quản lý trong toàn tổ chức. Nó được tích hợp vào Microsoft Fabric và không yêu cầu bất kỳ việc cung cấp trước nào. Dữ liệu trong OneLake được chia thành các vùng chứa để dễ dàng xử lý.

Hình ảnh sau đây hiển thị các mục Fabric khác nhau nơi dữ liệu được lưu trữ trong OneLake. Bạn có thể tạo nhiều không gian làm việc trong một tenant, tạo nhiều lakehouse trong mỗi không gian làm việc. Lakehouse là một tập hợp các tệp, thư mục và bảng thể hiện cơ sở dữ liệu trên data lake.

Microsfot Fabric and lakehouse

Mọi nhà phát triển và đơn vị kinh doanh trong tenant có thể ngay lập tức tạo không gian làm việc của riêng họ trong OneLake. Họ có thể nhập dữ liệu vào kho dữ liệu riêng của mình, bắt đầu xử lý, phân tích và cộng tác trên dữ liệu, giống như OneDrive trong Office.

Giới thiệu Microsoft Fabric

OneLake được thiết kế để cho phép gắn các tài khoản lưu trữ PaaS hiện có vào OneLake bằng tính năng Shortcut. Không cần di chuyển bất kỳ dữ liệu hiện có nào, bạn có thể truy cập dữ liệu được lưu trữ trong Azure Data Lake Storage bằng cách sử dụng các phím tắt.

Ngoài ra, các phím tắt cho phép bạn dễ dàng chia sẻ dữ liệu giữa người dùng và ứng dụng mà không cần di chuyển hoặc sao chép thông tin. Khả năng phím tắt mở rộng sang các hệ thống lưu trữ khác, cho phép bạn soạn và phân tích dữ liệu trên các đám mây với bộ nhớ đệm thông minh giúp giảm chi phí đầu ra và đưa dữ liệu đến gần hơn với tính toán.