跳至內容
資料倉儲流程上的人員工作

什麼是資料模型化?

 

此網頁採機器翻譯,SAP 對於機器翻譯的內容之正確性及完整性,不予以任何保證。 您可以透過頁面右上角的地球圖示,找到原文或英文網頁。

資料模型化是資料流程的圖表程序。在建立新的或替代的資料庫結構時,設計工具會以資料如何流入資料庫的方式圖表開始。此流程圖用於定義資料格式、結構和資料庫處理功能的特性,以便有效支援資料流程需求。建立並部署資料庫後,資料模型會持續成為資料庫存在原因的文件和理由,以及資料流程的設計方式。

 

此程序的資料模型提供資料庫內資料元素之間的關係架構,以及使用資料的指南。資料模型是軟體開發和分析的基本元素。其提供標準方法,用於跨系統一致定義和格式化資料庫內容,讓不同應用程式共用相同資料。

資料模型化為何重要?

全方位且最佳化的資料模型可協助建立簡化的邏輯資料庫,消除冗餘作業、降低儲存需求並實現有效檢索。這也使所有系統具備了「單一事實來源」,對有效操作和符合法規及法規要求的文件為必要。資料模型化是數位企業兩個重要功能的關鍵步驟。

由 IT 專業人員執行的軟體開發專案 (新或自訂)

 
在設計和建置任何軟體專案之前,必須先有記錄的視覺呈現最終產品的外觀,以及它的表現方式。此願景的一大部分是管理所需功能的業務規則集。另一部份為資料說明:資料流程 (或資料模型) 和資料庫設計來支援。
 
資料模型化會保留願景的記錄,並為軟體設計者提供藍圖。透過完整定義和記錄的資料庫和資料流程,以及根據這些規格開發的系統,系統應提供維持資料正確所需的預期功能 (假設程序已正確遵循)。
 

分析和視覺效果 (或商務智慧) 是使用者主要的決策工具

 

隨著資料量增加,使用者人數不斷增加,組織需要一種方式,將原始資料轉化為可據以行動的資訊以進行決策。不料,資料分析的需求已大幅成長。透過圖形呈現資料,資料視覺效果可讓使用者更容易存取資料。

 

現今的資料模型會將原始資料轉換為實用資訊,並轉換為動態視覺效果。資料模型化會準備資料以供分析:清除資料、定義衡量和維度,並建立階層、設定單位和幣別,並新增公式以增強資料。

 

資料模型化的類型為何?

三種主要資料模型類型為關聯式、維度和實體關係 (E-R)。此外,還有數種非一般用途,包括階層、網路、物件導向和多重值。模型類型會定義邏輯結構 (資料的儲存方式、邏輯方式),以及儲存、組織和檢索的方式。

  1. 關係: 雖然方法為「較舊」,但目前最常使用的資料庫模型為關聯式,可將資料儲存在固定格式記錄中,並在包含資料列和資料行的表格中排序資料。最基本的資料模型類型有兩個元素:衡量和維度。衡量為數值,例如數量和收入,用於數學計算,例如總和或平均。維度可為文字或數值。其不會用於計算,並包含說明或位置。原始資料會定義為衡量或維度。關聯式資料庫設計中使用的其他術語包括「關聯」(包含資料列和資料行的表格)、「屬性」(資料行)、「Tuple」(資料列) 和「網域」(資料行中允許的值集合)。雖然還有附加條款和結構需求可定義關聯式資料庫,但重要因素就是定義在該結構內的關係。一般資料元素 (或鍵值) 會將表格和資料集連結在一起。表格也可以明確相關,例如父子關係 (包含一對一、一對多或多對多)。
  2. 維度:硬性和結構性較差,維度方法有利於與業務使用或內容更相關的內容資料結構。此資料庫結構已針對線上查詢和資料倉儲工具進行最佳化。例如,關鍵資料元素 (例如交易數量) 稱為「事實」,且包含名為「維度」的參考資訊,包含該產品 ID、單價或交易日期。事實資料表是維度模型中的主要資料表。檢索可快速且有效率 (包含儲存的特定作業類型資料),但缺少關係連結可使分析檢索和使用資料更為複雜。由於資料結構與產生並使用資料的商業功能連結,因此合併不同系統 (例如資料倉儲) 所產生的資料可能發生問題。
  3. 實體豐富 (E-R):E-R 模型會以圖形形式表示業務資料結構,其中包含各種形狀方塊,以表示活動、功能或「實體」和代表關聯、相關性或「關係」的行。接著,E-R 模型會用來建立關聯式資料庫,其中每一列代表實體,且該資料列中的欄位包含屬性。如同所有關聯式資料庫,「索引鍵」資料元素用於將表格連結在一起。

哪些層級的資料抽象化?

資料模型有許多類型,其可能配置類型不同。在開發模型時,資料處理社群會識別三種模型類型,以代表思考層級。

概念資料模型

 

這是「全貌」模型,代表整體結構和內容,而非資料計劃的詳細資料。這是資料模型化的典型起點,用於識別組織中各種資料集和資料流程。概念模型是邏輯和實體模型開發的高階藍圖,是資料結構紀錄文件的重要部份。

 

邏輯資料模型

 

明細第二層為邏輯資料模型。其中與「資料模型」的一般定義最密切相關,說明資料流程和資料庫內容。邏輯模型會將明細新增至概念模型中的整體結構,但不包含資料庫本身的規格,因為模型可套用至各種資料庫技術和產品。(請注意,若專案與單一應用程式或其他限制系統相關,則可能沒有概念模型。)

 

實體資料模型

 

實體資料庫模型會說明邏輯模型實現方式的細節。其必須包含足夠的詳細資料,以便技術人員在硬體和軟體中建立實際的資料庫結構,以支援將使用的應用程式。毋庸置疑,實體資料模型是特定於指定的資料庫軟體系統。如果將使用不同的資料庫系統,則單一邏輯模型可衍生多個實體模型。

資料模型化流程與技術

資料模型化本質上是自上而下的過程,從概念模型開始,建立整體視野,再繼續到邏輯模型,最後是物理模型中包含的詳細設計。

 

建立概念模型主要是將構思轉換成圖形形式,類似於程式設計師的流程圖。

 

現代的資料模型化工具可協助您定義並建立邏輯和實體資料模型和資料庫。以下為幾個典型的資料模型化技術和步驟:

  • 決定實體並建立實體關係圖 (ERD)。實體可更詳細地描述為「對貴公司感興趣的資料元素」。例如,「客戶」為實體。「銷售」將是另一個。在 ERD 上,您可以記錄這些不同實體如何與您的業務中彼此產生關聯,以及之間存在的高階連線。
  • 定義事實、計量和維度。事實為資料的一部份,表示特定項目或交易,例如產品銷售。您的計量為定量,例如數量、收入、成本等。您的維度為定性計量,例如說明、地點和日期。  
  • 使用圖形工具或透過 SQL 查詢建立資料檢視連結。若您不熟悉 SQL,圖形工具是最直覺的選項,可讓您將元素拖放至模型,並以視覺方式建立連線。建立檢視時,您可選擇將表格或其他檢視合併為單一輸出。當您在圖形檢視中選擇來源並將其拖曳至與輸出相關聯的來源上方時,您可選擇聯結或建立這些表格的聯集。

現代分析解決方案也可協助您使用圖形拖放顯示來選取、篩選並連結資料來源。資料專家通常在 IT 中工作的進階工具可供使用,但使用者也可透過視覺化方式建立資料模型,並組織表格、圖表、地圖和其他物件來根據資料洞察來描述故事。

placeholder

探索 SAP Analytics Cloud

建立資料模型,依據資料洞察說明故事。

資料模型化範例

無論是商務、娛樂、個人或其他應用程式,資料模型是設計系統及定義啟用系統所需的基礎架構的必要步驟。這包含任何類型的交易系統、資料處理應用集或套件,或其他收集、建立或使用資料的系統。

 

資料倉儲需要資料模型化,因為資料倉儲是來自多個來源的資料儲藏庫,可能有不同格式的資料相似或相關資料。您必須先繪製倉庫格式和結構的對映,以決定如何操作每個收到的資料集,以符合倉儲設計的需求,讓資料對分析和資料採集有所幫助。接著,資料模型是分析工具、執行資訊系統 (儀表板)、資料採集的重要推動器,以及與任何及所有資料系統和應用程式的整合。

 

在任何系統的設計初期,資料模型化是其他所有步驟和階段所依賴的重要先決條件,在於建立所有程式、功能和工具所依賴的基礎。資料模型如同共同語言,可讓系統瞭解和接受模型中所述的資料,進行通訊。這在現今的大數據機器學習人工智慧雲端連接性物聯網和分散式系統 (包括邊緣運算) 的世界中,都更為重要。

資料模型演進

在非常實際的意義上,只要資料處理、資料儲存和電腦程式設計,資料模型化就一直持續著,雖然這個詞本身可能只會在資料庫管理系統在1960年代開始演進的時間被普遍使用。對於規劃和建構新結構的概念,沒有任何新或創新。資料模型化本身已變得結構化、形式化,因為資料越來越多、資料庫越來越多,資料種類也越來越多。

 

現在,隨著技術人員對新的資料來源 (IoT 感測器、地點感知裝置、點選流程、社交媒體) 以及超越傳統系統功能的大量和速度,資料模型變得更為重要。現在不斷對新系統提出了要求,創新數據庫結構和技術,新的數據模型,將這一新的發展工作結合在一起。

資料模型化的下一步為何?

資訊連線能力以及來自許多不同來源 (包括感應器、語音、影片、電子郵件等) 的大量資料,擴展了 IT 專業人員的建模專案範圍。互聯網當然就是這種進化的推動者之一。雲端是解決方案的主要部分,因為這是唯一的運算基礎架構夠大、可擴展性足夠且靈活,能在日益擴大的連線世界中因應目前與未來的需求。

 

資料庫設計的選項也會變更。十年前,主導型數據庫結構是採用傳統磁碟存儲技術的一列導向關聯式數據庫。典型的 ERP 總帳或存貨管理資料會儲存在數十個需要更新和建模的不同表格中。今日,現代 ERP 解決方案使用欄式設計將有效資料儲存在記憶體中,以大幅減少表格並提高速度和效率。

 

針對業務部門專業人員,目前提供的新自助服務工具將持續改善。並導入新工具,讓資料模型化和視覺效果更加輕鬆且協同合作。

彙總

經過深思熟慮且完整的資料模型,是真正發揮功能、實用性、安全性和準確性數據庫發展的關鍵。從概念模型開始,配置資料模型的所有元件和功能。接著將這些計劃細化為說明資料流程的邏輯資料模型,並說明所需資料的定義,以及取得、處理、儲存和分配的方式。邏輯資料模型會驅動資料庫產品特定的實體資料模型,且為指導建立資料庫和應用程式軟體的詳細設計文件。

 

良好的資料模型化和資料庫設計對於開發功能、可靠且安全的應用程式系統和資料庫,與資料倉儲和分析工具密切合作,並促進與業務夥伴及多個應用程式集的資料交換。周全熟慮的資料模型有助於確保資料完整性,使貴公司的資料更加珍貴且可靠。

placeholder

探索現代資料模型化工具

連結資料與業務內容,協助商務使用者發掘洞察力。

此序列中的更多

SAP Insights 電子報

placeholder
立即訂閱

訂閱我們的電子報以掌握關鍵洞察資訊。

進階讀取

返回頂部