Forum

Please or Register to create posts and topics.

Câu hỏi phỏng vấn của Power BI

Tài liệu bạn cung cấp là một bộ sưu tập các câu hỏi và câu trả lời liên quan đến Power BI, một công cụ phân tích kinh doanh dựa trên đám mây được phát triển bởi Microsoft. Nó bao gồm các khía cạnh khác nhau của Power BI, từ các thành phần cơ bản, chức năng, giới hạn, đến các tính năng nâng cao như bảo mật cấp hàng (Row-Level Security – RLS), DAX (Data Analysis Expressions), và cách triển khai báo cáo. Dưới đây là tóm tắt và giải thích để giúp bạn hiểu rõ hơn về tài liệu này:


1. Tổng quan về Power BI

  • Power BI Services: Là dịch vụ phân tích kinh doanh dựa trên đám mây, cho phép người dùng trực quan hóa và phân tích dữ liệu một cách nhanh chóng và hiệu quả. Nó cung cấp một cái nhìn tổng quan về dữ liệu quan trọng và hỗ trợ nhiều nguồn dữ liệu khác nhau.
  • Các thành phần chính:
    • Power Query: Dùng để biến đổi dữ liệu (ví dụ: thay đổi kiểu dữ liệu, xóa trùng lặp).
    • Power Pivot: Dùng để mô hình hóa dữ liệu, kết nối nhiều nguồn dữ liệu và tạo các thước đo (measures).
    • Power View: Tạo các hình ảnh trực quan (visualizations).
    • Power Map: Tạo biểu diễn địa không gian của dữ liệu.
    • Power Q&A: Cho phép đặt câu hỏi bằng ngôn ngữ tự nhiên để nhận câu trả lời từ dữ liệu.

2. Các khái niệm cơ bản

  • Building Blocks (Khối xây dựng):
    • Visualization: Biểu đồ, đồ thị hiển thị dữ liệu.
    • Dataset: Tập hợp dữ liệu dùng để tạo visualization.
    • Report: Nhóm các visualization trên một hoặc nhiều trang.
    • Dashboard: Bộ sưu tập các ô (tiles) từ báo cáo.
    • Tile: Một visual đơn lẻ được ghim từ báo cáo.
  • Giới hạn kích thước dữ liệu:
    • Power BI Pro: 1GB/tệp, 10GB dung lượng lưu trữ tối đa mỗi người dùng.
    • Power BI Premium: 10GB/tệp, 100GB dung lượng lưu trữ tối đa mỗi người dùng.

3. Các phương thức kết nối dữ liệu

  • Import: Dữ liệu được tải vào Power BI (phù hợp với tập dữ liệu nhỏ).
  • Direct Query: Kết nối trực tiếp tới nguồn dữ liệu, không lưu dữ liệu trong Power BI mà chỉ lưu siêu dữ liệu (metadata). Phù hợp với tập dữ liệu lớn (ví dụ: SQL Server, SAP HANA, Azure SQL Database).
  • Live Connection: Dữ liệu và siêu dữ liệu đều nằm ngoài Power BI (thường dùng với SQL Server Analysis Services – SSAS).

4. Các tính năng nâng cao

  • Relationships (Quan hệ):
    • Active Relationship: Quan hệ mặc định được sử dụng trong tính toán và trực quan hóa.
    • De-active Relationship: Quan hệ không hoạt động trừ khi được kích hoạt thủ công.
    • Cardinality: Mối quan hệ giữa các bảng (Many-to-One, One-to-Many, Many-to-Many).
    • Cross Filter Direction: Lọc chéo giữa các bảng (Single hoặc Both).
  • Row-Level Security (RLS):
    • Cho phép lọc dữ liệu dựa trên vai trò của người dùng.
    • Hỗ trợ cả dữ liệu nhập vào và Direct Query.
    • Không thể ẩn cột hoặc giới hạn quyền truy cập vào dữ liệu tổng hợp mà không ảnh hưởng đến dữ liệu chi tiết.
  • DAX Functions:
    • Aggregation: SUM, MIN, MAX, COUNT, DIVIDE.
    • Iterating: SUMX, COUNTX, MINX, MAXX, FILTERX, RANKX.
    • Virtual Tables: CALCULATE, SUMMARIZE, VALUES.
    • RELATED vs RELATEDTABLE: RELATED tham chiếu cột, RELATEDTABLE tham chiếu bảng trong quan hệ many-side.

5. Tính năng trực quan và tương tác

  • Filters: Có 3 loại:
    • Visual Level: Áp dụng cho một visual.
    • Page Level: Áp dụng cho toàn bộ trang.
    • Report Level: Áp dụng cho toàn bộ báo cáo.
  • Slicer và Sync Slicer:
    • Slicer: Lọc dữ liệu động trên một trang.
    • Sync Slicer: Lọc dữ liệu động trên nhiều trang.
  • Bookmarks: Lưu trạng thái hiện tại của báo cáo để quay lại sau.
  • Edit Interactions: Điều chỉnh cách các visual tương tác với nhau (lọc, tô sáng, hoặc không ảnh hưởng).

6. Chia sẻ và triển khai

  • Các cách chia sẻ:
    • Email: Chia sẻ qua email.
    • Content Pack: Gói nội dung bao gồm dataset, báo cáo và dashboard cho nhóm hoặc tổ chức.
    • App: Ứng dụng để chia sẻ báo cáo cụ thể cho nhóm hoặc tổ chức.
  • Gateway:
    • Personal Mode: Chỉ một người dùng, không thể chia sẻ.
    • On-Premises: Hỗ trợ nhiều người dùng, kết nối với nguồn dữ liệu tại chỗ.
  • Scheduled Refresh:
    • Pro: 8 lần/ngày.
    • Premium: 48 lần/ngày.

7. So sánh Power BI Pro và Premium

Tiêu chí Power BI Pro Power BI Premium
Dung lượng lưu trữ 10GB/người dùng 100GB/người dùng
Kích thước dataset 1GB 10GB
Tần suất làm mới tự động 8 lần/ngày 48 lần/ngày
Chia sẻ báo cáo Có thể Không thể (trừ khi có quyền)

8. Các vấn đề thực tế

  • Vấn đề với tập dữ liệu lớn: Sử dụng bảng tổng hợp (aggregate tables) trong Azure SQL Server và cấu hình trong Power BI để tăng hiệu suất.
  • Thời gian phát triển: Tạo 10 measures, 10 báo cáo, 20-30 visual mất 1-2 tuần nếu mô hình dữ liệu đã sẵn sàng, hoặc 1-2 tháng nếu chưa có.
  • Tương tác với khách hàng: Qua họp hàng ngày hoặc tài liệu yêu cầu kinh doanh (BRD).

9. Ứng dụng thực tế

  • Đề xuất cho tổ chức:
    • Với 700 người dùng (100 nhà phát triển, 600 người xem), nên dùng Power BI Pro cho nhà phát triển và Premium cho người xem để tối ưu chi phí.
  • Visuals phổ biến: Bar Chart, Line Chart, Pie Chart, KPI, Tree Map, Waterfall Chart, v.v.
Uploaded files:
  • You need to login to have access to uploads.