3 ví dụ cho mô hình dữ liệu khái niệm

·

·

3 ví dụ về mô hình dữ liệu khái niệm (conceptual data models) dành cho dữ liệu và phân tích

Bởi Sonny Rivera, Chuyên gia Phân tích Cấp cao tại ThoughtSpot

Cập nhật ngày 18 tháng 4 năm 2023

Khi nào cần lập mô hình dữ liệu (data modeling)

Khi lập mô hình dữ liệu (data modeling), mô hình dữ liệu khái niệm (conceptual data models) là loại đầu tiên trong ba loại mô hình dữ liệu chính. Ba loại đó là mô hình khái niệm (conceptual), logic (logical), và vật lý (physical). Hãy đón đọc bài viết tiếp theo của tôi, nơi chúng tôi sẽ định nghĩa mô hình logic (logical models) và vật lý (physical models) cũng như thảo luận về các điểm khác biệt chính.

Giá trị của lập mô hình dữ liệu khái niệm (conceptual data modeling)

Hai sản phẩm chính (artifacts) phát sinh từ quá trình tạo mô hình dữ liệu khái niệm (conceptual data model) là sơ đồ CDM thực tế (CDM diagram) và các định nghĩa của các khái niệm cốt lõi (definitions of the essential concepts). Những sản phẩm này sẽ được chỉnh sửa liên tục và sử dụng để truyền đạt sự hiểu biết chung về doanh nghiệp (shared understanding of the business).

Giá trị thực sự của mô hình dữ liệu khái niệm (conceptual data model) nằm ở chỗ nó:

  • Liên kết các động lực kinh doanh (business drivers), mục tiêu chiến lược (strategic goals), và chiến lược (strategies) với các câu hỏi kinh doanh (business questions), sự kiện (facts), và các yếu tố định tính (qualifiers).
  • Tạo sự hiểu biết chung giữa công nghệ và doanh nghiệp (shared understanding between technology and the business), giúp giao tiếp rõ ràng (clear communications) và thúc đẩy tranh luận về các yếu tố cốt lõi (fostering debate on the essentials).
  • Cải thiện độ rõ ràng (clarity) và chính xác (precision) của mô hình dữ liệu (data model) trong tương lai.
  • Tạo ra một bối cảnh có thể xác minh (verifiable context) và ranh giới (boundary) cho phạm vi của vấn đề (scope of the problem).

Cách tạo một mô hình dữ liệu khái niệm (conceptual data model)

Thể hiện các thành phần cốt lõi và mối quan hệ giữa chúng (Demonstrate the essential components as they relate to each other)

Mô hình dữ liệu khái niệm (conceptual data models) tập trung vào các thực thể (entities) như phòng (room) và số xác nhận (confirmation number). Tuy nhiên, không có kiểu dữ liệu (data types). Mặc dù các mối quan hệ (relationships) thể hiện số lượng (cardinality), nhưng chúng thiếu mô tả (descriptor). Hình ảnh trực quan (visuals) của một mô hình khái niệm (conceptual model) ít cứng nhắc hơn so với các mô hình logic (logical models) và vật lý (physical models). Những mô hình đó được dựa trên các ngôn ngữ chính thức (formal languages) và định nghĩa chính thức (formal definitions).

Mục tiêu của CDM là nắm bắt bản chất của doanh nghiệp (essence of the business) và truyền đạt điều đó với một đối tượng rộng lớn (broad audience). Vì vậy, một đối tượng kỹ thuật (technical audience) có thể không phản đối một CDM tuân thủ chặt chẽ với sơ đồ dữ liệu chính thức (formal data diagramming). Ngược lại, một đối tượng định hướng kinh doanh phi kỹ thuật (non-technical business-oriented audience) có thể muốn có hình ảnh về khách sạn (images of hotels), hình người que cho khách hàng (stick figures for customers), và các câu chuyện về mối quan hệ (stories about relationships).

Những điểm chính cần rút ra là:

  1. Đối tượng (audience) rất quan trọng.
  2. Không có định dạng tốt nhất duy nhất cho sơ đồ (diagram).
  3. Sơ đồ (diagram) nên nắm bắt được cái nhìn tổng thể (birds-eye) của doanh nghiệp, các yếu tố cốt lõi (essentials).

Thêm các định nghĩa kinh doanh (Add business definitions)

Chúng ta vẫn còn thiếu các định nghĩa kinh doanh (business definitions) tạo nên mô hình dữ liệu khái niệm (conceptual data model) của chúng ta. Những định nghĩa này mô tả thực thể (entity) và mối quan hệ (relationship). Dưới đây là một ví dụ nhanh về cách chúng có thể trông như thế nào.

Định nghĩa (Definitions)
Thực thể (Entity)Mô tả (Description)Mối quan hệ (Relationships)
Khách sạn (Hotel)
Phòng (Room)

Ví dụ về mô hình dữ liệu khái niệm (conceptual data models) cho dữ liệu và phân tích

Đối tượng kinh doanh (business object) sẽ quyết định cách tiến hành quá trình lập mô hình dữ liệu khái niệm (conceptual data modeling process). Bạn đang xây dựng một mô hình giao dịch (transactional model) cho một ứng dụng di động (mobile application)? Hay một mô hình phân tích (analytics model) cho một lĩnh vực kinh doanh (line of business)? Hoặc một mô hình kho dữ liệu (warehouse model) nhằm phục vụ như một kho dữ liệu doanh nghiệp (enterprise data warehouse)?

Hãy nhớ rằng, mô hình dữ liệu khái niệm (conceptual data model) không phụ thuộc vào công nghệ nền tảng dữ liệu (data platform technology), nhưng cách sử dụng của nó rất đa dạng và sẽ ảnh hưởng đến quá trình lập mô hình (modeling process). Dưới đây là một vài loại ví dụ về mô hình khái niệm (conceptual model).

Giao dịch (Transactional)

Việc phát triển một CDM cho một hệ thống giao dịch (transactional system) thường yêu cầu hiểu rõ các yêu cầu đặc thù về tốc độ (speed), tính toàn vẹn giao dịch (transaction integrity), trải nghiệm khách hàng (customer experience), khả năng mở rộng (scalability), và tính dễ sử dụng (ease of use). Những loại hệ thống này rất phổ biến trong bán lẻ trực tuyến (online retail), đặt chỗ (reservations), quản lý hàng tồn kho (inventory), và thậm chí là dịch vụ tài chính (financial services). Xem Hình 1 và Hình 2 để biết ví dụ về một khách sạn.

[Hình ảnh: Figure 1 – Transactional CDM Example]

[Hình ảnh: Figure 2 – Transactional CDM Example]

Điều quan trọng cần hiểu là tất cả các mô hình dữ liệu khái niệm (conceptual data models) đều tập trung vào các thực thể (entities) như khách hàng (customer), phòng (room), và đặt chỗ (reservation). Nó cũng xác định các thuộc tính chính (key attributes) như mã khách hàng (customer id) và số xác nhận (confirmation number). Cuối cùng, nó xác định các tương tác kinh doanh (business interactions) giữa các thực thể (entities). Nó không tập trung vào các bảng thực tế (actual tables), tên cột (column names), kiểu dữ liệu (data types), hoặc các mối quan hệ khóa chính/khóa ngoại (PK/FK relationships). Tất cả những điều này được định nghĩa trong các định nghĩa kinh doanh (business definitions). Xem ví dụ trong Hình 3.

[Hình ảnh: Figure 3 – Transactional CDM with Business Definitions]

Phân tích (Analytical)

Mô hình khái niệm phân tích (analytical conceptual models) tập trung vào việc xác định các sự kiện (facts), số liệu (measures), và các yếu tố định tính (qualifiers) để hỗ trợ phân tích kinh doanh (business analytics). Ví dụ, trong lĩnh vực khách sạn (hotel industry), bạn có thể muốn đo lường doanh thu (revenue), thuế (taxes), phí (fees), tỷ lệ lấp đầy (occupancy rate), và tỷ lệ hủy (cancellation rate) theo thời gian (time), khách sạn (hotel), phòng (room), hoặc khách hàng (customer). Những yếu tố này có thể được thể hiện trong một Ma trận Định tính Sự kiện (Fact Qualifier Matrix – FQM), như trong Hình 5.

Thời gian (Time)Khách sạn (Hotel)Phòng (Room)Khách hàng (Customer)
Doanh thu (Revenue)
Thuế (Taxes)
Phí (Fees)
Tỷ lệ lấp đầy (Occupancy Rate)
Tỷ lệ hủy (Cancellation Rate)

[Hình ảnh: Figure 5 – Fact Qualifier Matrix]

Việc tạo một FQM không khó, và nó sẽ hỗ trợ và xác nhận mô hình dữ liệu khái niệm (conceptual data model) của bạn. Để tạo một FQM, chỉ cần hỏi các bên liên quan (stakeholders) của bạn:

  • Bạn sử dụng số liệu (measures) nào để hiểu doanh nghiệp?
  • Làm thế nào để định tính (qualify), nhóm (group), hoặc phân loại (categorize) các số liệu?
  • Số liệu cần chi tiết đến mức nào (granular)? Ví dụ, bạn tính toán doanh số (sales) theo ngày (daily), giờ (hourly), hay tháng (monthly)?
  • Đối với mỗi số liệu, xác định xem yếu tố định tính (qualifier) có áp dụng cho số liệu đó không.

Như bạn thấy trong ví dụ của chúng tôi, một người không chuyên về kỹ thuật (non-technical person) có thể dễ dàng hiểu sơ đồ (diagram) và FQM của chúng tôi. Họ có thể thấy rằng hệ thống sẽ đo lường doanh thu (revenue) theo thời gian (time), khách sạn (hotel), phòng (room), và khách hàng (customer). FQM cũng là một công cụ giá trị để xác minh (verify) và xác nhận (validate) mô hình.

Doanh nghiệp (Enterprise)

Mô hình CDM doanh nghiệp (Enterprise CDMs) đưa ra các thách thức bổ sung do số lượng lớn các bên liên quan (stakeholders), các lĩnh vực kinh doanh (lines of business), và sự phức tạp của các tổ chức lớn (larger organizations). Nhưng đó không phải là vấn đề vì chúng ta có “khu vực chủ đề” (subject areas).

Khu vực chủ đề (Subject Areas)

Khu vực chủ đề (subject areas) là các nhóm logic (logical groupings) của dữ liệu, chẳng hạn như đặt chỗ (reservation), tiếp thị (marketing), và thanh toán (payment) trong một chuỗi khách sạn (hotel chain). Để lập mô hình dữ liệu khái niệm (conceptual data modeling) cho một doanh nghiệp (enterprise):

  • Xác định các khu vực chủ đề (subject areas) chính dựa trên các lĩnh vực kinh doanh (lines of business) hoặc chức năng (functions).
  • Đối với mỗi khu vực chủ đề, lặp lại quá trình xác định thực thể (entities), thuộc tính (attributes), và mối quan hệ (relationships).

Một khi CDM cho một khu vực chủ đề cụ thể (specific subject area) hoàn tất, lập mô hình logic (logical modeling) và vật lý (physical modeling) có thể bắt đầu. Không cần thiết phải hoàn thành toàn bộ mô hình doanh nghiệp (enterprise model) trước khi chuyển sang lập mô hình logic (logical modeling) và vật lý (physical modeling).

Như bạn thấy trong Hình 5, mô hình tập trung vào khu vực chủ đề đặt chỗ (reservation subject area) với các liên kết đến các khu vực chủ đề khác như tiếp thị (marketing) và thanh toán (payment). Việc sử dụng khu vực chủ đề (subject areas) theo cách này đảm bảo rằng bạn duy trì phạm vi (scope) và đảm bảo tất cả các bên liên quan (stakeholders) thấy mối quan tâm của họ đang được giải quyết.

[Hình ảnh: Figure 5 – Enterprise CDM with Subject Areas]

Những điểm chính về mô hình khái niệm (Key takeaways about conceptual models)

Nếu bạn là kiểu người thích đọc phần kết thúc của một cuốn sách trước, thì phần này dành cho bạn. Dưới đây là một số điểm chính (key takeaways):

  • Mô hình dữ liệu khái niệm (Conceptual Data Models) cung cấp cái nhìn tổng thể (big-picture view) về yêu cầu dữ liệu (data requirements) của một tổ chức mà không đi sâu vào chi tiết kỹ thuật (technical details) – hãy duy trì phạm vi (scope) của bạn.
  • CDM nắm bắt bản chất của vấn đề kinh doanh (essence of the business problem) và sẽ phù hợp với các mô hình dữ liệu logic (logical data models) và vật lý (physical data models) trong tương lai.
  • Mục tiêu chính của CDM là tạo sự hiểu biết chung giữa công nghệ và đội ngũ kinh doanh (shared understanding between technology and the business team), giúp giao tiếp rõ ràng (clear communications) và thúc đẩy tranh luận về các khái niệm cốt lõi (essential concepts).
  • Định nghĩa (definitions) của các thực thể (entities), mối quan hệ (relationships), và khái niệm cốt lõi (core concepts) là một phần của mô hình dữ liệu khái niệm (conceptual data model). Mô hình không chỉ là một sơ đồ (diagram).
  • Thể hiện CDM một cách trực quan (visually) và truyền đạt nội dung của nó đến các bên liên quan (stakeholders) của bạn bằng các phương pháp giao tiếp (communication methods) và phong cách (style) mà họ thấy hấp dẫn nhất (most engaging).

ThoughtSpot có thể giúp gì cho bạn

ThoughtSpot có thể giúp bạn biến mô hình dữ liệu (data models) của mình thành phân tích dễ tiếp cận, được hỗ trợ bởi AI (AI-Powered analytics), giúp bạn đưa dữ liệu vào phòng họp (boardroom) và trao quyền cho người dùng kinh doanh (business users) trả lời các truy vấn ad-hoc (ad-hoc queries) bằng tìm kiếm ngôn ngữ tự nhiên (natural language search). Hãy tự mình trải nghiệm khi bạn bắt đầu dùng thử miễn phí (free trial).

Bắt đầu dùng thử miễn phí (Start free trial)

Trích dẫn: [Charles] “Darwin không phải là [Ben] Franklin, ông đã cân nhắc nhiều khía cạnh trong nhiều ngày. Mặc dù ông tiếp cận lựa chọn thay đổi cuộc đời này một cách nghiêm túc, Darwin đã quyết định ngay khi ghi chú của ông chạm đến cuối trang nhật ký. Ông đã điều chỉnh theo trang giấy. Điều này gợi nhớ đến cả Early Stopping và Lasso: bất cứ điều gì không có trên trang thì không được đưa vào quyết định.”

Nguồn: Christian, Brian; Griffiths, Tom. Algorithms to Live By (trang 168). Henry Holt and Co.. Kindle Edition.

Bắt đầu nhận được những hiểu biết tốt hơn

Đăng ký ngay bây giờ và bạn sẽ sử dụng ThoughtSpot trong vài phút.

Bắt đầu dùng thử miễn phí (Start free trial)

ThoughtSpot – Nền tảng phân tích chủ động (Agentic Analytics platform)

ThoughtSpot là nền tảng phân tích chủ động (Agentic Analytics platform) trao quyền cho mọi người đặt và trả lời bất kỳ câu hỏi nào, trên bất kỳ dữ liệu nào, ở bất kỳ nơi nào bạn làm việc.

Liên hệ

Số điện thoại: (800) 508-7008