flex-height
text-black

サーバールーム

データ管理用語集

データ管理用語集で、データ関連のさまざまな用語と定義を確認しましょう。

default

{}

default

{}

primary

default

{}

secondary

データベースとは?
データベースとは、データを整理し、保存・管理・保護しながら、アクセス制御を行うためのシステムです。データベースはさまざまなスキーマに基づいて設計されており、多くの場合、プログラムやデータクエリから容易に利用できるリレーショナルモデルが用いられます。主なデータベースの種類には、リレーショナルデータベース管理システム(RDBMS)、インメモリーデータベース、オブジェクト指向データベース(OODBMS)、NoSQLデータベース、NewSQLデータベースなどがあり、それぞれに特徴があります。
データ管理とは?
データ管理とは、データの収集、管理、保護、操作、配信に必要なすべての機能を指します。データ管理システムには、データベース、データウェアハウス、データマート、データの収集・保存・取得のためのツール、検証や品質管理を支援するユーティリティ、さらにアプリケーションや分析ツールとの連携をサポートするユーティリティが含まれます。企業は、特定の責任分野や固有のデータに対する説明責任を明確にするために、データ戦略が必要です。
データベース管理とは?
データベース管理とは、データの保存、処理、操作、保護に関するプロセスや手順を指します。多くの組織では、これらの手順を確立し監督する役割をデータベース管理者(DBA)などが担っています。ほとんどの組織では、市販のデータベース管理システム(DBMS)が主な管理ツールとして利用されています。
データベース管理システム (DBMS) とは?
データベース管理システム(DBMS)は、データベースの管理に必要なストレージ構造やデータ管理機能を提供するソフトウェアツールです。DBMSは、ERP システムに組み込まれている場合もあれば、別途購入する必要がある場合もあります。また、システムソフトウェア(オペレーティングシステム)の一部として提供される場合や、独立したソフトウェア製品としてライセンスされる場合もあります。どのような形態であっても、各アプリケーションはDBMSを中心に構築するか、DBMSと完全に統合することが重要です。これは、アプリケーションとDBMSが相互に依存することで、より効果的に機能するためです。つまり、DBMSはデータベース管理のための基本的なツールキットです。
SQL データベースとは?
SQL データベースとは、データをテーブルと行の形式で保存するリレーショナルデータベースです。各データ項目(行)は共通の属性によって関連付けられるため、効率的で重複が少なく、柔軟な検索が可能です。SQL(Structured Query Language)は、その名の通り構造化された問い合わせ言語であり、ユーザーはこの言語を学ぶことで、準拠する任意のデータベースに対してデータの保存、操作、取得を行うことができます。
NoSQL データベースとは?
NoSQL データベースは、SQL では扱えない非構造化データを処理するために開発されました。NoSQL は、動的なスキーマや多様な前処理技術など、さまざまな方法でこの制限を克服しています。非構造化データを扱うデータベースには、キーバリュー型、ドキュメント型、カラム型、グラフ型などがあり、ビデオ、画像、フリーテキスト、生のセンサー出力などが含まれることが多いです。
リレーショナルデータベース管理システム (RDBMS) とは?
リレーショナルデータベース管理システム(RDBMS)とは、リレーショナルデータモデルに基づいて設計されたデータベース管理システム(DBMS)です。RDBMS では、データは行と列からなるテーブルに格納され、各テーブルはデータベース内のオブジェクトやエンティティを表現し、相互に関連付けることができます。さらに、RDBMS には複数のテーブルを管理する機能や、データの正確性・一貫性・完全性・安全性を保つための仕組み、複雑なクエリでデータを操作するための SQL インターフェースが備わっています。
CDBMS とは?
CDBMS は Gartner 社が考案した用語で、主に上記の RDBMS のクラウド展開モデルのことを指します。
構造化データとは?
構造化データは、行と列で適切にフォーマットされ、あらかじめ定義されたフィールドに割り当てられます。通常はExcelスプレッドシートやリレーショナルデータベースに保存されます。例えば、財務取引、人口統計情報、機械のログなどが含まれます。構造化データは、近年までビジネスで利用可能な唯一のデータタイプでした。
非構造化データとは?
非構造化データは、行や列の形式に整理できないため、保存や分析、検索が難しいという特徴があります。例えば、IoTの生データ、ビデオやオーディオファイル、ソーシャルメディアのコメント、コールセンターの音声テキストなどが挙げられます。これらの非構造化データは、一般的にデータレイクやNoSQLデータベース、または最新のデータウェアハウスに保存されます。
半構造化データとは?
半構造化データは、セマンティックタグやメタデータなどのいくつかの組織的な特性を持っていますが、スプレッドシートやリレーショナルデータベースのような行と列の形式には当てはまりません。半構造化データの例として電子メールが挙げられます。電子メールには、送信者や受信者のアドレスといった構造化データだけでなく、メッセージ本文のような非構造化データも含まれています。
データマッピングとは?
データマッピングとは、異なるデータ構造やデータベース間でフィールドを対応させるプロセスです。これは、データベースの統合や、あるシステムまたはデータベースから別のシステムやデータベースへのデータ移行、またはデータウェアハウスのように単一のアプリケーションや分析ツールで複数のデータソースを利用する際に必要となります。データマッピングによって、一意な情報、競合する情報、重複する情報を特定できるため、すべてのデータを統一したスキーマや形式に取り込むためのルールを策定できます。
データモデリングとは?
新しいデータベース構造や代替構造を作成する際、設計者はまずデータベースへの入出力データの流れを図式化します。このデータフロー図の作成はデータモデリングと呼ばれます。ソフトウェアエンジニアは、このフロー図を活用して、データ形式・データ構造・データベース処理機能の特性を定義し、データフロー要件を効率よく満たすことができます。
データウェアハウスとは?
DWH(データウェアハウス)とは、社内外のさまざまなソースのデータを対象とした、単一の包括的なストレージ機能を提供します。その主な目的は、BI、レポート作成、および分析のためのデータを提供することです。最新のデータウェアハウスは、構造化、非構造化ともにあらゆるデータタイプを格納および管理でき、通常はクラウドにデプロイされ、高いスケーラビリティと使いやすさを実現します。
データレイクとは?
データレイクとは、生データや元の形式のままデータを保存する大規模なデータプールです。通常、データレイクは構造化データ、非構造化データ、半構造化データなど、さまざまなビッグデータを保存する目的で利用されます。
ビッグデータとは?
ビッグデータは、構造化データ、非構造化データ、半構造化データからなる非常に大きなデータセットを表す用語です。ビッグデータの特徴はしばしば 5 つの V によって表されます。データ量 (volume)、データタイプの多様性 (variety)、データの生成速度 (velocity)、データの真実性 (veracity)、およびその価値 (value) です。ビッグデータ管理システムとアナリティクスにより、ビッグデータを採掘(マイニング)し、意思決定と行動につながる深いインサイトを得ることができます。
スモールデータとは?
量が膨大で複雑なビッグデータとは対照的に、スモールデータは人間から見て容易に理解できるデータです。スモールデータセットには、マーケティング調査から日常的に発生するスプレッドシートまで、あらゆるものが含まれます。そして、1 件の SNS の投稿やメールのように「小さい」ものも含まれます。より深いインサイトを求めて、ビッグデータにスモールデータを加えて AI機械学習アルゴリズムをトレーニングする企業が増えています。
シックデータとは?
シックデータとは、消費者の日常的な感情の動きに対するインサイトを提供する定性的な情報のことを言います。これには、観察、感情、反応など、一般的に数値化することが難しいものも含まれます。ビッグデータと組み合わせると、消費者の好みとニーズに関するきわめて包括的な全体像が浮かび上がります。
データ統合とは?
データ統合とは、いつでもどこでも必要なデータを取得、変換、結合、プロビジョニングできるようにすることです。この統合は、社内だけでなく、社外のパートナーならびにサードパーティーのデータソースおよびユースケース全体で、すべてのアプリケーションおよびビジネスプロセスのデータ使用要件が満たされるように行われます。その手法には、バルク/バッチデータ移動、ETL(抽出、変換、ロード)、変更データのキャプチャ、データの複製、仮想化、ストリーミングデータ統合、データオーケストレーションなどがあります。
データ仮想化とは?
データ仮想化により、企業は、仮想データレイヤーで異種のシステムおよび形式にわたってすべての企業データを一元的に把握できます。データ仮想化では、データを複製するのではなく、データをソースシステムに残して、単にその仮想表現をユーザーやアプリケーションにリアルタイムで公開します。データ仮想化は、データ統合に対する最新のアプローチであり、ユーザーはデータの物理的な場所、形式、プロトコルに関係なく、データを発見および操作できます。
データファブリックとは?
データファブリックは、アーキテクチャーとテクノロジーのカスタマイズされた組み合わせです。動的なデータ統合とオーケストレーションを使用して、さまざまな場所、ソース、およびタイプのデータを接続します。データファブリックプラットフォーム内で定義された適切な構造とフローにより、データがある場所や生成方法に関係なく、企業はデータにすばやくアクセスして共有できます。
データメッシュとは?
データメッシュは、分散アーキテクチャーフレームワークを使用するデータ管理手法です。つまり、組織内のあるデータセットについて、そのデータが何を意味するのか、どうすればそのデータを最大限に活用できるのかについて専門知識を持っているユーザーに、そのデータセットの所有権と責任を分散します。
データパイプラインとは?
データパイプラインは、データソースにあるあらゆるタイプのデータを検索、クレンジング、変換、分析するための自動化された反復可能な一連のプロセスを記述します。データは生成された場所の近くで分析されるため、ビジネスユーザーは必要な情報を低コストで迅速に分析し、共有できます。また、データパイプラインは、機械学習などのテクノロジーによって強化され、より迅速で効果的なものにすることもできます。
データサイロとは?
データサイロとは、企業内の個々の部門や職務領域が、データや情報を他の部門と共有しない状況を表す俗語です。この分離した状況により、会社の目標に向けた協調的な取り組みが阻害され、パフォーマンスの低下(および顧客サービスの劣化)と高いコストにつながり、全体的に市場の需要と変化に対応することができなくなります。重複および冗長なデータの照合は困難になり、活動を調整したりビジネスを効果的に管理しようとする試みの妨げになります。
データラングリングとは?
データラングリングは、ローデータを取得し、構築済みのデータベースやアプリケーションと互換性のある形式に変換するプロセスです。このプロセスには、ローデータを有用なものにするために必要なデータの構造化、クリーニング、エンリッチメント、および検証が含まれる場合があります。
データセキュリティとは?
データセキュリティとは、不正なアクセスや開示、災害、システム障害からデータを保護すると同時に、正規のユーザーやアプリケーションが適切にアクセスできるようにすることです。手法およびツールとしては、データの暗号化、キー管理、冗長性とバックアップの実施、アクセス制御などがあります。データセキュリティは、どのような規模やタイプの組織であっても、増大し続けるデータ侵害やプライバシーリスクの脅威から顧客と組織のデータを保護するために必要です。冗長性とバックアップは、事業継続性および災害回復にとって重要です。
データプライバシーとは?
データプライバシーとは、不正なアクセスや開示からデータを保護するためのデータの取り扱いポリシーおよび実践を指します。データプライバシーのポリシーおよび実践には、組織のデータ戦略に従って情報を収集および保存する方法、サードパーティと共有可能/不可にする方法、および規制に準拠する方法が含まれます。データプライバシーは、保存された情報の整合性と安全性を確保しながら、クライアントの期待を満たすためのビジネス上の責務です。
データ品質とは?
データ品質とは、データの適合性と信頼性を表す漠然とした用語です。良質なデータとは、正確性(記述内容を真に表している)、信頼性(一貫性があり、監査可能で、適切に管理/保護されている)、およびユーザーやアプリケーションが必要とする範囲での完全性が確保されたデータであることを意味します。データ品質は、産業用の強力なツールとシステムを用いて適切に策定および実行されるデータ戦略と、データ管理ポリシーおよび手順に綿密に従うことによってのみ保証されます。
データ検証とは?
データ検証とは、インポート前または使用前にデータの品質、正確性、および妥当性を判断するプロセスです。検証は、データを認証するための一連のアクティビティとプロセスで構成でき、重複の削除、明白なエラーや欠落している項目の修正、可能な書式設定の変更(データクレンジング)など、データ項目の一般的な「クリーンアップ」を行うことができます。データ検証により、重要な意思決定を行うために必要な情報の正確性と信頼性が確保されます。
データクレンジングとは?
データクレンジングとは、データセット、テーブル、またはデータベースに含まれるエラーを削除したり修正するプロセスです。これらのエラーには、情報の破損、不正確さ、関連性の欠如、不完全さなどがあります。このプロセスはデータスクラビングとも呼ばれ、データの重複、入力ミスや集計されない数値セットなど、その他の不整合を検出します。データクレンジングによって、不適切な情報を除去したり、空の項目やコードの欠落などの明らかな間違いを修正できる場合があります。
データ整合性とは?
データ整合性とは、長期間にわたるデータの真実性を指します。データ整合性とは、データの入力、インポート、ラングリング、検証、クレンジング、および保存が行われた後に、データ品質が維持されていることと、入力されたデータが変更されてなく、今後も変更されないとユーザーが確信できることを表す言葉です。取得されるデータは、最初に保存されたデータと同じです。データ整合性は、データ品質の同義語として使用されることもありますが、それよりも確実性と信頼性が重視されます。
データガバナンスとは?
データガバナンスとは、組織全体で適切なデータ管理を実現するためのポリシーとその実践のことです。データガバナンスに基づいて IT インフラが構築され、データタイプ別にそのデータを処理できる権限とデータを保護する責任を担う個人(または職位)が指定されます。効果的なデータガバナンスにより、データの可用性、信頼性、安全性、コンプライアンスが確保され、データの誤用を防ぐことができます。
データスチュワードシップとは?
データスチュワードシップは、データの正確性、信頼性、完全性、およびセキュリティを確立するためのデータガバナンスポリシーおよび手順を実施することです。データスチュワードシップの担当者は、データの処理、保存、保護に使用される手順とツールを管理し、監督します。
データアーキテクチャーとは?
データアーキテクチャーとは、組織のデータの構造や、その利用・管理方法を定める設計・ルール・方針の全体像を指します。これは、ビジネスのニーズや目標を支えるためのデータ戦略を実行するための具体的な仕組みを含み、データベースの設計や運用手順、セキュリティ対策、データガバナンスの基盤として機能します。
マスターデータ管理とは?
マスターデータ管理 (MDM)とは、重要な全ビジネスデータに対して 1 つの「マスター」基準ソースを作成して管理することです。MDM には、マスターデータの処理を定義、管理、および制御(または規定)するためのポリシーおよび手順が含まれます。一元化されたマスターデータ管理により、重複した情報や調整されていないデータ(古いデータや破損したデータ、または 1 つの場所では更新済みだが別の場所では未更新なためやがて置き換えられるデータなど)が散在するデータベースから発生する矛盾や混乱が排除されます。企業全体で 1 つのバージョンを使用するということは、その組織のすべての部署が同じ定義、標準、および想定に基づいて作業できるということです。
アナリティクスとは?
アナリティクスとは、データの体系的な分析のことを指します。アナリティクスアプリケーションおよびツールキットには、数学的アルゴリズムと計算エンジンが含まれています。これらによって、大規模なデータセットを操作してパターン、トレンド、関係、およびその他のインテリジェンスを発見できます。それにより、ユーザーは質問を行って、ビジネス、オペレーション、およびマーケットに関する有用なインサイトを得ることができます。最新のアナリティクスツールキットの多くは、技術的専門知識がないビジネスパーソンによる使用を想定して設計されており、データサイエンティストや IT スペシャリストからは最小限の支援を受けるだけで、これらの分析を実行できるようになっています。
拡張アナリティクスとは?
拡張アナリティクスは、機械学習や自然言語処理 (NLP) などの人工知能 (AI) テクノロジーによって「拡張」されたアナリティクスです。拡張アナリティクスによって、より深いインサイトをすばやく発見できるだけでなく、プロセス内の多くの複雑なステップを自動化し、IT に詳しくないユーザーでも自然な会話形式でデータを照会することができます。
データマイニングとは?
データマイニングとは、大きなデータセットから有用な情報を抽出することです。データマイニングは、多くの場合、パターン、トレンド、異常、関連性、依存関係、およびその他の有用なインテリジェンスを発見するために、ビジネスユーザーがアナリティクスツールを使用して行います。データマイニングの用途は、不正行為やサイバーセキュリティ問題の検出から、予測の向上、パフォーマンス改善機会の発見にいたるまで、広範にわたります。
データプロファイリングとは?
データプロファイリングとは、データセットに関する統計や特徴(正確性、完全性、有効性など)を収集する手法です。データプロファイリングは、重複や値の欠落、不整合などのデータ品質の問題の検出に役立つため、データ検証およびデータクレンジング作業で使用される手法の 1 つです。
SAP のロゴ

SAP 製品

データ管理とは?

データを価値ある資産に変える方法をご覧ください。

詳細はこちら