flex-height
text-black
資料管理辭彙
在資料管理辭彙中,探索一系列資料相關的詞彙和定義。
default
{}
default
{}
primary
default
{}
secondary
何謂資料庫?
資料庫是組織、儲存、管理、保護和控管資料存取的設施。資料庫是根據許多不同的綱要(結構描述)所設計,其中有許多遵守關聯模型,方便程式和資料查詢存取。常見的資料庫類型包括關聯式資料庫管理系統(RDBMS)、記憶體式資料庫、物件導向資料庫(OODBMS)、NoSQL 資料庫和 NewSQL 資料庫,各自具有各自的優點。
何謂資料管理?
資料管理係指收集、控管、保護、操作及提供資料所需的所有功能。資料管理系統包括資料庫、資料倉儲和資料市集;資料收集、儲存和擷取的工具;以及協助驗證、品質以及整合應用程式和分析工具的公用程式。企業需要一個資料策略,才能建立對特定責任領域所衍生或特有的資料責任承擔制度。
何謂資料庫管理?
資料庫管理是指儲存、處理、操作和保護資料所需的流程和程序。在許多組織中,建立和監督這類程序的責任是資料庫管理員(DBA)或類似職位的主要責任。多數組織依賴商業資料庫管理系統(DBMS)作為管理其資料庫的主要工具。
何謂資料庫管理系統(DBMS)?
資料庫管理系統(DBMS)是提供資料庫管理儲存結構和資料管理設施的軟體工具組。DBMS 可能是授權企業資源規劃(ERP)系統的核心部分、需要單獨購買的項目、系統軟體(作業系統)的一部分,或單獨授權的軟體產品。無論來源為何,應用程式都必須根據 DBMS 建立和(或)與 DBMS 完全整合,兩者相互依存,並決定應用程式和 DBMS 功能是否有效。DBMS 本質上是資料庫管理的工具組。
何謂 SQL 資料庫?
SQL 資料庫是將資料儲存在資料表和資料列中的關聯式資料庫。資料項目(列)會根據一般資料項目進行連結,提高效率、避免冗餘,並簡化彈性擷取。SQL 的名稱衍生自「結構化查詢語言」,這是一種工具組和自然語言查詢通訊協定,使用者可學習並套用至任何相容的資料庫,以進行資料儲存、操作和擷取。
何謂 NoSQL 資料庫?
NoSQL 資料庫是專為處理 SQL 因結構缺乏而無法支援的非結構化資料而開發。NoSQL 使用創意技術來克服這項限制,包括動態架構和各種預先處理技術。非結構化資料最常見的資料庫類型包括鍵值、文件、資料欄和圖形資料庫,且通常包括影片、圖形、任意文字和原始感測器輸出等。
何謂關聯式資料庫管理系統(RDBMS)?
關聯式資料庫管理系統是以關聯式資料模型為基礎的資料庫管理系統(DBMS)。RDBMS 的內容儲存在資料表中,由資料列和資料行組成,每個資料表都代表特定的物件或實體,在資料庫中可以與其他物件相關。RDBMS 通常包含多個資料表,並包括其他可維護資料準確性、一致性、完整性和安全性的功能,以及透過複雜查詢存取彼此相關資料的 SQL 介面。
何謂 CDBMS?
CDBMS 是 Gartner 建立的術語,主要說明上述 RDBMS 的雲端部署模型。
何謂結構化資料?
結構化資料會格式化為資料列和資料欄,並對應至預先定義的欄位。通常儲存在 Excel 試算表或關聯式資料庫中,範例包含財務交易、人口統計資訊和機器記錄。長久以來,結構化資料一直是企業唯一可使用的資料類型。
何謂非結構化資料?
由於未結構化的資料未組織成資料列和資料欄,因此更難以儲存、分析和搜尋。例如:原始物聯網(IoT)資料、影片和音訊檔案、社交媒體評語和客服中心記錄。非結構化資料通常儲存於資料湖泊、NoSQL 資料庫或現代資料倉儲。
何謂半結構化資料?
半結構化資料具有某些組織屬性,例如語意標籤或中繼資料,但不適用於試算表或關聯式資料庫的資料列和資料欄。電子郵件就是一個很好的半結構資料範例,其中包含某些結構化資料,例如寄件人和收件人地址,但也包含非結構化資料(如訊息本身)。
何謂資料對應?
資料對應是不同資料結構或資料庫間欄位比對的程序。若要合併資料庫、將資料從一個系統或資料庫移轉至另一個系統,或是要在單一應用程式或分析工具中使用不同的資料來源(這在資料倉儲中經常發生),則此為必要步驟。資料對應將識別唯一、衝突和重複的資訊,以便制定一組規則,將所有資料帶入統一的架構或格式。
何謂資料建模?
在建立新的或替代的資料庫結構時,設計工具會從資料如何流入/出資料庫的方式圖表開始。將資料流程顯示為圖表稱為資料建模。軟體工程師可從此流程圖中定義資料格式、結構和資料庫處理功能的特性,以便有效支援資料流程需求。
何謂資料倉儲?
資料倉儲針對來自內部和外部的各種不同來源資料,提供單一且全方位的儲存設施。其主要目的是提供資料以供商務智慧(BI)、報表製作和分析使用。現代的資料倉儲可以儲存和管理所有資料類型,無論是結構化或非結構化,並且通常部署在雲端中,以提高擴充能力和易用性。
何謂資料湖泊?
資料湖泊是以資料原始或自然格式儲存資料的龐大資料庫。資料湖泊通常用於儲存大數據,包括結構化、非結構化和半結構化資料。
何謂大數據?
大數據是一個描述結構化、非結構化和半結構化資料極大型資料集的詞彙。大數據通常具有五 V 為特徵:收集的 資料量(volume) 大、資料類型的多樣化(variety)、資料產生的速度(velocity)、資料的 真實性(veracity) 和資料的價值(value)。有了大數據管理系統和分析功能,企業便可採集大數據取得深入洞察,引導決策和行動。
何謂小數據?
相對於量大而複雜的大數據,小數據很容易讓人理解。小數據集可以包含任何行銷調查到日常試算表,甚至可以「小」至單一社群媒體發文或電子郵件。除了大數據之外,越來越多的企業使用小數據來訓練其 AI 和機器學習演算法,以獲取更深入的見解。
何謂複雜型資料?
複雜型資料是質性資訊,能讓您洞察消費者的日常情感生活。包括觀察、感覺和反應,這些通常很難量化。其與大數據結合時,會出現非常全面性的觀點,呈現消費者的偏好和需求。
何謂資料整合?
資料整合是隨時隨地實際的擷取、轉換、合併和建置資料。此整合發生在所有夥伴及第三方資料來源及使用案例的企業以上,以滿足所有應用程式和企業流程的資料使用需求。技術包括大量/批次資料移動、擷取、轉換、載入(ETL)、變更資料擷取、資料複製、資料虛擬化、串流資料整合、資料彙整等。
何謂資料虛擬化?
資料虛擬化可在虛擬資料層中,針對不同的系統和格式,提供公司所有企業資料的統一檢視。資料虛擬化將資料保留在來源系統中,而非複製資料,並直接以虛擬方式即時向使用者和應用程式呈現。資料虛擬化是一種現代的資料整合方式,無論資料的實際位置、格式或通訊協定為何,使用者都能探索及操作資料。
何謂資料結構?
資料結構是架構與技術的客製化組合。其使用動態資料整合和協作來連接不同位置、來源和資料類型。透過資料結構平台內定義的正確結構和流程,無論資料的產生位置或方式為何,公司都能快速存取並共用資料。
何謂資料網格?
資料網格為使用分散式架構的資料管理方法。換句話說,它會將整個企業特定資料集的所有權和責任分散給那些擁有專業知識的使用者,以了解該資料的含義,以及如何充分利用這些資料。
何謂資料管道?
資料管道說明一系列自動化和可重複的流程,用以從來源尋找、清除、轉換和分析任何資料類型。由於資料是在接近其產生的位置進行分析,因此商務使用者可以低成本地快速分析及分享所需資訊給組織。資料管道也可以透過機器學習等技術來增強,使其更快速、更有效率。
何謂資料孤島?
資料孤島為俗稱用語,指企業內的個別部門或功能區域不與其他部門共享資料與資訊的情況。這種孤立情況阻礙各部門共同為公司目標努力,導致績效(以及客戶服務)不佳、成本高以及普遍無法因應市場需求與變更。重複和冗餘的資料難以調節,更阻礙了協調活動與有效管理業務。
何謂資料整理?
資料整理是將原始資料擷取並轉換為與已建立的資料庫和應用程式相容格式的程序。此程序可能包括依需要建構、清除、擴充和驗證資料,以使使用原始資料。
何謂資料安全性?
資料安全性是確保資料安全之行為,避免未經授權存取或曝光、災難或系統故障,並同時可供合法使用者及應用程式存取。方法和工具包含資料加密、金鑰管理、備援和備份實務以及存取控管。資料安全性是所有規模與類型組織的需求,以保護客戶和組織資料,避免不斷增加的資料外洩和隱私權風險。備援和備份對於業務持續性和災害復原很重要。
何謂資料隱私權?
資料隱私權係指處理資料的政策與作法,以保護資料不受未經授權存取或揭露之保護。資料隱私權政策與實務涵蓋如何根據組織的資料策略收集和儲存資訊、如何與第三方共用資訊,以及如何遵守法規限制。資料隱私權是的企業首要任務,在滿足客戶期望的同時,保護儲存資訊的完整性和安全性。
何謂資料品質?
資料品質是描述資料合適性和可靠性的抽象詞彙。良好、高品質的資料僅表示資料正確無誤(真正代表所描述的內容)、可靠(一致、可稽核、正確管理和受保護),並且完全滿足使用者與應用程式所需的程度。只有使用企業級工具和系統來正確設計並執行資料策略,並嚴格遵循資料管理政策和程序,才能確保資料品質。
何謂資料驗證?
資料驗證是在匯入或使用資料前,判斷資料品質、精確性和有效性的程序。驗證可能包含一系列用於驗證資料的作業和程序,且通常為「清除」資料項目,包含移除重複項目、更正明顯錯誤或缺少項目,以及可能的格式化更改(資料清除)。資料驗證可確保制定重要決策所需的資訊正確且值得信任。
何謂資料清除?
資料清除是從資料集、表格或資料庫移除或更正錯誤的程序。這些錯誤可能包含毀損、不正確、不相關或不完整的資訊。此程序也稱為資料更新,尋找重複資料和其他不一致,例如錯字和或不符的數字集。資料清除可能會移除不正確的資訊或修正明顯的錯誤,例如空白欄位或缺少代碼。
何謂資料完整性?
資料完整性是指資料長期的真實性。一旦資料輸入或匯入、整理、驗證、清理和儲存,資料完整性即為維護資料品質的證明,使用者可以放心,輸入的資料沒有也不會改變。擷取的資料與原始儲存的資料相同。有時作為資料品質的同義詞,資料完整性更著重於可靠性和相依性。
何謂資料控管?
資料控管是一套確保整個組織妥善管理資料的政策和做法。其建立 IT 基礎架構,並點出具有處理和保障特定資料類型責任的個人(或職位)。有效的資料管理可確保資料可用、值得信任、安全且合規,並且不會遭到濫用。
何謂資料管理權?
資料管理權是資料管理政策和程序的建置,以建立資料準確性、可靠性、完整性和安全性。獲派資料管理責任的人員將管理和監督用於處理、儲存和保護資料的程序和工具。
何謂資料架構?
資料架構是結構、政策和規則的整體設計,可定義組織的資料以及使用和管理方式。資料架構包含如何建置資料策略以支援業務需求和目標的詳細資料,並作為資料庫、程序、保障、安全性和資料管理的開發基礎。
何謂主檔資料管理?
主檔資料管理(MDM)是針對所有重要業務資料建立一個單一「主檔」參考來源的作法。其中包含用於定義、管理和控制(或控管)處理主檔資料的政策與程序。集中主檔資料管理可消除來自分散資料庫的衝突和混淆,因其具有重複的資訊和未經協調的資料,這些資料可能已過時、毀損或及時取代(已經在一處更新,但另一處沒有)。在整個企業使用單一版本表示組織的所有部門皆使用相同的定義、標準和假設。
何謂分析?
分析是表示資料系統分析的詞彙。分析應用程式與工具組包含數學演算法和運算引擎,可以操作大型資料集,發掘模式、趨勢、關係和其他智慧項目,讓使用者可以提問並取得有關其業務、營運和市場的實用洞察。許多現代分析工具組專為非技術性商業人員設計,讓其只需資料科學家或 IT 專家的最少協助就能執行這些分析。
何謂強化預測分析?
強化預測分析是運用機器學習和自然語言處理(NLP)等人工智慧技術「強化預測」的分析。其不僅有助於使用者更快速地發掘更深入的洞察,還能將程序中的許多複雜步驟自動化,甚至允許非技術的使用者以自然且對話的方式查詢資料。
何謂資料採集?
資料採集是從大型資料集擷取實用資訊的動作。資料採集通常是由商務使用者所完成,並採用分析工具來發掘模式、趨勢、異常、關係、相關性和其他實用智慧功能。資料採集應用範圍廣泛,從詐欺偵測和網路安全顧慮,到改進預測、尋找績效提升機會。
何謂資料分析?
資料分析是收集資料集的統計和特性的作法,例如精確性、完整性和有效性。資料分析是資料驗證和資料清除工作所用的其中一種技術,可協助偵測資料品質問題(如重複、缺少值和不一致)。