Dưới đây là bản tổng hợp chi tiết nội dung của tài liệu “Microsoft Power BI Quick Start Guide, Second Edition” là cuốn dành cho các bạn mới làm quen với Power BI cho đến các chuyên gia của Power BI đều có thể dùng được với nội dung viết rất hay, dễ dàng áp dụng
Preface (Lời mở đầu)
Nội dung chính:
- Cuốn sách hướng dẫn cách sử dụng Microsoft Power BI, một công cụ phân tích kinh doanh tự phục vụ (self-service BI) mạnh mẽ của Microsoft, giúp người dùng khám phá dữ liệu, xây dựng mô hình dữ liệu, trực quan hóa và chia sẻ kết quả.
- Đối tượng:
- Các chuyên gia BI truyền thống muốn chuyển sang Power BI.
- Người mới trong lĩnh vực BI (có kiến thức cơ bản về thuật ngữ ngành).
- Quản lý BI đang triển khai Power BI trong tổ chức.
- Nội dung bao gồm 9 chương: Từ kết nối dữ liệu, biến đổi dữ liệu, xây dựng mô hình, trực quan hóa, đến triển khai trên đám mây hoặc tại chỗ.
- Yêu cầu: Cài đặt Power BI Desktop (miễn phí) và tùy chọn Power BI Pro để thực hành đầy đủ các ví dụ.
Tư vấn của chuyên gia:
- Nếu bạn là người mới, hãy bắt đầu với Power BI Desktop để làm quen giao diện trước khi khám phá các tính năng nâng cao như Dataflows hoặc Power BI Report Server.
- Đừng bỏ qua việc tải các tệp ví dụ từ GitHub của sách (link trong tài liệu) để thực hành song song với lý thuyết.

Chapter 1: Getting Started with Importing Data Options (Bắt đầu với các tùy chọn nhập dữ liệu)
Nội dung chính:
- Giới thiệu Power BI Desktop: Công cụ phát triển chính, miễn phí, có thể tải từ Microsoft Store hoặc trực tiếp từ trang web Power BI.
- Các tùy chọn nhập dữ liệu:
- Import (Nhập dữ liệu):
- Dữ liệu được tải vào bộ nhớ trong (xVelocity engine), nén hiệu quả (giảm tới 1/10 kích thước gốc).
- Phù hợp với hiệu suất cao, nhưng cần làm mới dữ liệu thủ công hoặc theo lịch trình.
- Ví dụ: Nhập từ Excel, SQL Server, Web (dữ liệu công khai từ data.gov).
- DirectQuery:
- Không nhập dữ liệu, truy vấn trực tiếp từ nguồn, phù hợp với dữ liệu thời gian thực hoặc nguồn lớn.
- Hạn chế: Chỉ hỗ trợ một số nguồn (SQL Server, Oracle, SAP HANA, v.v.), hiệu suất phụ thuộc vào máy chủ nguồn, một số tính năng Power Query bị vô hiệu hóa.
- Live Connection:
- Kết nối trực tiếp với SQL Server Analysis Services hoặc Power BI datasets, không nhập dữ liệu, hiệu suất cao nhờ engine xVelocity.
- Hạn chế: Không chỉnh sửa mô hình hoặc biến đổi dữ liệu trong Power BI.
- Composite Models: Kết hợp Import và DirectQuery trong cùng một mô hình, tối ưu hiệu suất và tính linh hoạt.
- Lựa chọn nào phù hợp?
- Dùng ma trận quyết định (Decision Matrix) trong tệp đi kèm sách để cân nhắc dựa trên hiệu suất, tính cập nhật, và khả năng mở rộng.
Tư vấn của chuyên gia:
- Với dữ liệu nhỏ (<1GB) và không cần cập nhật thường xuyên, chọn Import để tận dụng hiệu suất in-memory.
- Nếu làm việc với dữ liệu lớn hoặc cần thời gian thực (real-time), thử DirectQuery hoặc Live Connection, nhưng hãy kiểm tra trước xem nguồn dữ liệu của bạn có được hỗ trợ không.
Chapter 2: Data Transformation Strategies (Chiến lược biến đổi dữ liệu)
Nội dung chính:
- Power Query Editor: Công cụ biến đổi dữ liệu trong Power BI, giao diện thân thiện, tự động tạo mã M.
- Biến đổi cơ bản:
- Dùng hàng đầu làm tiêu đề (Use First Row as Headers), xóa cột (Remove Columns), thay đổi kiểu dữ liệu (Change Type), thêm cột từ ví dụ (Column From Examples).
- Biến đổi nâng cao:
- Cột điều kiện (Conditional Columns), điền xuống (Fill Down), bỏ xoay (Unpivot), hợp nhất truy vấn (Merge Query), nối truy vấn (Append Query).
- Tích hợp R: Cài đặt R và dùng R Script Transform để phân tích dữ liệu nâng cao.
- AI Insights: Phân tích cảm xúc (Sentiment Analysis) qua Text Analytics (yêu cầu Power BI Premium).
- Ngôn ngữ M: Ngôn ngữ nền tảng của Power Query, hỗ trợ tùy chỉnh nâng cao (ví dụ: hàm #shared để xem danh sách hàm có sẵn).
Tư vấn của chuyên gia:
- Dành thời gian làm quen với Power Query Editor vì đây là bước quan trọng để làm sạch dữ liệu trước khi phân tích.
- Nếu bạn đã quen với Excel, hãy thử Column From Examples – rất trực quan và tiết kiệm thời gian.
- Với dữ liệu phức tạp, cân nhắc học cơ bản về M để tùy chỉnh sâu hơn.
Chapter 3: Building the Data Model (Xây dựng mô hình dữ liệu)
Nội dung chính:
- Quan hệ trong Power BI:
- Xây dựng và chỉnh sửa quan hệ giữa các bảng (Relationships).
- Xử lý quan hệ phức tạp: Many-to-many (đa-đa), thay đổi hướng lọc (Cross-filtering), bảng vai trò (Role-playing tables).
- Tăng tính dễ dùng:
- Ẩn bảng/cột không cần thiết, đổi tên bảng/cột, gán tổng hợp mặc định (Default Summarization), phân loại dữ liệu (Data Categorization), tạo phân cấp (Hierarchies).
- Hiệu suất mô hình:
- Tối ưu truy vấn: Nhập dữ liệu, DirectQuery, tạo bảng tổng hợp (Aggregations).
- Tối ưu xử lý: Query Folding, Incremental Refresh (làm mới gia tăng).
- Thực hành tốt nhất: Giảm số lượng cột, chọn kiểu dữ liệu phù hợp.
Tư vấn của chuyên gia:
- Luôn kiểm tra và tối ưu quan hệ giữa các bảng trước khi trực quan hóa để tránh kết quả sai lệch.
- Sử dụng Aggregations cho dữ liệu lớn để tăng tốc độ truy vấn – đây là mẹo rất hiệu quả trong thực tế.
Chapter 4: Leveraging DAX (Tận dụng DAX)
Nội dung chính:
- Cột tính toán (Calculated Columns):
- Dùng hàm chuỗi (String Functions), định dạng (Format), SWITCH(), và liên kết (RELATED).
- Biện pháp tính toán (Calculated Measures):
- Tạo các phép tính cơ bản như Total Sales, Profit, Profit Margin.
- Sắp xếp vào thư mục hiển thị (Display Folders).
- Bối cảnh lọc (Filter Context): Dùng CALCULATE để thay đổi ngữ cảnh tính toán.
- Thời gian thông minh (Time Intelligence): Tính YTD Sales, Prior Year Sales.
- Bảng vai trò với DAX: Tạo bản sao logic của bảng mà không cần nhập thêm dữ liệu.
Tư vấn của chuyên gia:
- DAX có thể khó với người mới, hãy bắt đầu với các hàm đơn giản như SUM, AVERAGE trước khi chuyển sang CALCULATE hoặc Time Intelligence.
- Với Role-playing tables, dùng DAX thay vì nhập nhiều bảng Date để tiết kiệm bộ nhớ.
Chapter 5: Visualizing Data (Trực quan hóa dữ liệu)
Nội dung chính:
- Giao diện Report View: Tạo và lọc biểu đồ (Visuals), tương tác chéo (Cross-filtering/Highlighting).
- Các loại trực quan:
- Dữ liệu dạng bảng: Table, Matrix.
- Dữ liệu phân loại: Bar/Column, Pie/Donut, Treemap, Scatter, etc.
- Dữ liệu xu hướng: Line/Area, Combo, Ribbon, Waterfall.
- Dữ liệu KPI: Gauge, KPI.
- Dữ liệu địa lý: Map, Filled Map, Shape Map, ArcGIS, Azure Maps.
- Mẹo trực quan: Thay đổi kiểu biểu đồ, địnhTrend dạng, dùng Top N Filter, Analytics.
Tư vấn của chuyên gia:
- Chọn biểu đồ phù hợp với câu chuyện dữ liệu: Ví dụ, dùng Waterfall để phân tích thay đổi theo thời gian, hoặc Treemap để so sánh tỷ lệ.
- Tránh lạm dụng màu sắc hoặc biểu đồ phức tạp khiến người xem khó hiểu.
Chapter 6: Digital Storytelling with Power BI (Kể chuyện số với Power BI)
Nội dung chính:
- Drill Through: Cho phép khám phá chi tiết dữ liệu.
- Bookmarks: Lưu trạng thái báo cáo, kết hợp với ẩn/hiện đối tượng (Object Visibility).
- Buttons: Điều hướng báo cáo qua nút bấm.
- Report Pages as Tooltips: Tạo chú thích chi tiết bằng trang báo cáo.
Tư vấn của chuyên gia:
- Dùng Bookmarks và Buttons để tạo trải nghiệm tương tác giống như một ứng dụng, rất hữu ích cho báo cáo trình bày với lãnh đạo.
- Tooltips dạng trang báo cáo là cách tuyệt vời để cung cấp thông tin bổ sung mà không làm rối giao diện chính.
Chapter 7: Using a Cloud Deployment with the Power BI Service (Triển khai trên đám mây với Power BI Service)
Nội dung chính:
- Triển khai báo cáo: Đưa báo cáo từ Desktop lên Power BI Service.
- Dashboards: Tạo và tương tác, đặt câu hỏi bằng ngôn ngữ tự nhiên (Q\&A).
- Chia sẻ: Qua liên kết, workspaces, hoặc ứng dụng Power BI.
- Bảo mật cấp hàng (Row-Level Security): Giới hạn dữ liệu theo vai trò người dùng.
- Làm mới dữ liệu: Lên lịch tự động, dùng Data Gateway cho dữ liệu tại chỗ (on-premises).
Tư vấn của chuyên gia:
- Cấu hình Row-Level Security ngay từ đầu nếu dữ liệu nhạy cảm, tránh rò rỉ thông tin không mong muốn.
- Với dữ liệu tại chỗ, cài đặt Data Gateway trên máy chủ ổn định để đảm bảo làm mới dữ liệu đáng tin cậy.
Chapter 8: Data Cleansing in the Cloud with Dataflows (Làm sạch dữ liệu trên đám mây với Dataflows)
Nội dung chính:
- Dataflows: Công cụ ETL tự phục vụ trên Power BI Service, lưu trữ dữ liệu dưới dạng entities trong Azure Data Lake.
- Tạo Dataflow: Ví dụ tạo bảng Date bằng mã M trong Power Query Online.
- Tính năng: Hỗ trợ làm mới gia tăng (Incremental Refresh), AI Insights (Premium), tích hợp Common Data Model.
- Sử dụng: Kết nối từ Power BI Desktop như nguồn dữ liệu thông thường.
Tư vấn của chuyên gia:
- Dataflows rất phù hợp để tạo nguồn dữ liệu chuẩn hóa (như bảng Date) dùng chung trong tổ chức.
- Nếu có Premium, tận dụng Incremental Refresh để giảm tải khi làm việc với dữ liệu lớn.
Chapter 9: On-Premises Solutions with Power BI Report Server (Giải pháp tại chỗ với Power BI Report Server)
Nội dung chính:
- Power BI Report Server: Phiên bản tại chỗ của Power BI Service, dùng Power BI Desktop đặc biệt.
- Triển khai: Lưu báo cáo từ Desktop hoặc tải lên server.
- Bảo mật: Gán vai trò (Browser, Publisher, etc.) cho người dùng.
- Làm mới dữ liệu: Dùng SQL Server Agent, yêu cầu đường dẫn mạng (network path) cho tệp.
Tư vấn của chuyên gia:
- Kiểm tra kỹ phiên bản Desktop và Server để đảm bảo tương thích, tránh lỗi khi triển khai.
- Dùng shared schedules để quản lý lịch làm mới hiệu quả trong tổ chức lớn.
Kết luận
Cuốn sách cung cấp hướng dẫn toàn diện từ cơ bản đến nâng cao về Power BI, phù hợp cho cả người mới và chuyên gia BI. Với các ví dụ thực tế và mẹo từ tác giả, bạn có thể nhanh chóng áp dụng vào công việc. Để tận dụng tối đa, hãy thực hành song song với tài liệu và khám phá thêm tài nguyên từ cộng đồng Power BI.