コンテンツにスキップする
コンピュータケーブル

データマイニングとは?

 

この Web ページは、お客様の利便性のために機械翻訳されています。SAP は、機械翻訳の正確性または完全性に関して一切保証しません。 オリジナルの英語版ウェブページは、このページの右上角にあるワールドマップを利用することで確認できます。

データマイニングとは、蓄積されたデータ(多くはデータウェアハウスやリンクされたデータセットの集合体)から有用な情報を抽出するプロセスである。データマイニングツールには、強力な統計、数学、および分析機能が含まれており、その主な目的は、大量のデータセットをふるい分けトレンド、パターン、関係を特定、十分な情報に基づく意思決定と計画をサポートすることです。

 

多くの場合、データマイニングは、マーケティング部門の問い合わせと関連しており、多くのエグゼクティブが、需要をより深く理解し、製品、価格設定、またはプロモーションの変化が販売に与える影響を確認する方法として捉えています。しかし、データマイニングは他の事業領域にとっても大きなメリットがあります。エンジニアおよび設計者は、製品変更の効果を分析し、製品の使用方法、時期、場所に関連する製品の成功または失敗の考えられる原因を探すことができます。サービスおよび修理業務では、パーツ在庫と要員配置をより適切に計画することができます。プロフェッショナルサービス組織は、データマイニングを使用して、変化する経済動向や人口動態の変化から新たな機会を特定することができます。

 

データマイニングは、より大きなデータセットとユーザエクスペリエンスによって、より有用で価値のあるものになります。論理的には、データが多いほど、インサイトとインテリジェンスをそこに埋める必要があります。また、ユーザがツールに習熟し、データベースの理解を深めるにつれ、探索や分析による創造性が高まります。

データマイニングを使用する理由

データマイニングの主な利点は、複数のソースから大量のデータ内のパターンと関係を特定できることです。ソーシャルメディア、リモートセンサー、製品の動きや市場の動きに関する詳細なレポートなど、さまざまなソースから入手できるデータが増える中、データマイニングはビッグデータをを十分に活用し、実用的なインテリジェンスに変えるためのツールを提供します。さらに、"既成概念にとらわれない "ための仕組みとしても機能するのです。

 

データマイニングプロセスでは、一見無関係な情報の中で、驚くべき興味を引く関係やパターンを検出できます。情報は断片化される傾向があるため、歴史的に全体としての分析は困難または不可能でした。ただし、外部要因 (人口や経済的要因) と、会社の製品のパフォーマンスとの間には関係がある場合があります。また、経営幹部はテリトリ、製品ライン、流通チャネル、および地域別に販売数を定期的に調べていますが、多くの場合、この情報に対する外部コンテキストが不足しています。分析では、「何が起こったのか」を指摘することはできますが、「なぜこうなったか」を明らかにすることはほとんどありません。データマイニングにより、このギャップを埋めることができます。

 

データマイニングでは、外部要因との相関関係を探すことができます。相関関係は常に因果関係を示すものではありませんが、これらの傾向は、製品、チャネル、および生産に関する意思決定の指針となる貴重な指標となる可能性があります。同じ分析により、製品設計から業務効率、サービス提供に至るまで、ビジネスの他の部分にもメリットがあります。

データマイニングの履歴

人々は何千年もの間、データを収集して分析してきました。多くの点でプロセスは変わっていません。必要な情報の特定、品質データソースの検索、データの収集と結合、データの分析に利用できる最も効果的なツールの使用、学習した内容の活用です。コンピューティングおよびデータベースのシステムが拡大し、進化していくにつれ、データの管理および分析のためのツールが提供されます。1960年代、リレーショナルデータベーステクノロジーを開発し、SQL (Structured Query Language) のようなユーザ指向の自然言語クエリツールを開発しました。もはや、データはカスタムメイドのプログラムを通してのみ利用できるものではなくなりました。この飛躍的な進歩により、ビジネスユーザーはデータをインタラクティブに探索し、その中に埋もれている隠れたインテリジェンスを探り当てることができるようになったのです。

 

データマイニングは、従来、データサイエンスの中でも専門的なスキルセットでした。しかし、新世代の分析ツールはどれも、最初は高度な技術的スキルが必要でしたが、すぐにユーザーにとって使いやすいものに進化しています。インタラクティブ性、つまりデータがあなたに語りかける能力こそが、重要な進歩なのです。質問をして、その答えを見る。学んだことをもとに、また質問をする。このようなデータを介した非構造化ローミングにより、ユーザはアプリケーション固有のデータベース設計の範囲を超え、機能および組織の境界を越える関係を発見することができます。

 

データマイニングは、ビジネスインテリジェンスの主要コンポーネントです。データマイニングツールはエグゼクティブダッシュボードに組み込まれており、ソーシャルメディア、IoT (Internet of Things) センサーフィード、位置認識デバイス、非構造化テキスト、ビデオなどのビッグデータからインサイトを収集します。最新のデータマイニングでは、クラウドと仮想コンピューティング、およびインメモリデータベースを使用して、多くのソースのデータをコスト効率良く管理し、必要に応じて拡張します。

データマイニングの仕組み

データマイニングには、データマイニングを行う場合と同じくらいの数のアプローチがあります。このアプローチは、質問の種類と、検索および分析の原材料を提供するデータベースまたはデータセットの内容と構成によって異なります。とはいえ、データ、ツール、ユーザーを準備するために完了すべき組織的な準備ステップがいくつかあります。
  1. 問題を理解する - 少なくとも調査対象領域を理解 このデータマイニングオフロードアドベンチャーの推進者の席にいるべきビジネス上の意思決定者は、作業するドメイン (この調査の一部となる内部データと外部データのタイプ) について全般的な理解が必要です。これらのユーザは、関連するビジネスおよび機能領域について深い知識を持っていることを前提としています。
  2. データ収集 まず、内部システムおよびデータベースから開始します。データモデルやさまざまなリレーショナルツールを介してデータをリンクするか、データをデータウェアハウスにまとめます。これには、フィールドセールス/サービスデータ、IoT、ソーシャルメディアデータなど、業務の一部である外部ソースからのあらゆるデータが含まれます。業界動向や金融ベンチマークなど、人口統計、経済データ、市場インテリジェンスなどの外部データに対する権利を、貿易協会や政府から探し出して獲得します。これらをツールキットの目的に取り込みます (データウェアハウスに取り込むか、データマイニング環境にリンクします)。
  3. データの準備と理解 データの定義、分類、整理を行うには、ビジネスの専門家が必要です。この作業は、「データ整理」「マンギング」と呼ばれることもあります。データの中には、重複、矛盾、不完全な記録、古い形式などを取り除くために、クリーニングやクレンジングが必要なものもあります。データの準備とクレンジングは、新しいプロジェクトや新しい分野のデータが注目されるようになると、継続的な作業となる場合があります。
  4. ユーザトレーニング。 適切な自動車教習を受けることなく、10代の子供たちにフェラーリの鍵を与えることはないでしょう。そのため、これらの強力なツールに慣れるため、将来のデータマイナーに正式なトレーニングを提供するとともに、監視下で実践を積むことが重要です。基本をマスターし、より高度なテクニックに移行できるようになったら、継続的な教育を行うのも良いアイデアです。

データマイニング手法

データマイニングは、決まったルーチンやプロセスではなく、ツールキットに基づくものであることを念頭に置いてください。ここで挙げた特定のデータマイニング手法は、組織がトレンド、相関関係、インテリジェンス、ビジネスインサイトを探ってデータを探索するためにツールがどのように使用されているかを示す例にすぎません。

 

一般的に、データマイニングのアプローチは、特定の目的の結果に焦点を当てた有向型と、発見プロセスとしての無向型に分類することができます。他の探索は、業種、製品、サイズ、ロケーションなどのビジネス属性に応じた見込顧客のグループ化など、データのソートまたは分類を目的とする場合があります。同様の目的である外れ値や異常値の検出は、識別可能なパターンを示すデータの集合の中から(単純な変動ではなく)実際の異常を認識する自動化された手法です。

 

アソシエーション

もう 1 つの興味深い目標は、関連付けです。関連性のない 2 つのイベントまたは活動をリンクします。アナリティクスとデータマイニングの初期の古典的なストーリーは、おそらく架空のものですが、コンビニチェーンがビールとおむつの販売に相関関係があることを発見しています。夜遅くにおむつを買いに来た新米パパが、ついでに6本入りのパックを2〜3本手に取るかもしれない、という推測です。店舗ではビールやおむつを近くに並べ、結果としてビールの売上を伸ばします。

 

クラスタリング

このアプローチは、あらかじめ定義された前提条件ではなく、類似性によってデータをグループ化することを目的としています。例えば、顧客の販売情報と外部の消費者信用情報および人口統計データを組み合わせてマイニングすると、最も収益性の高い顧客は中堅都市の出身であることが分かるかもしれません。

データマイニングは、多くの場合、予測をサポートするために行われます。パターンと行動をよりよく理解できれば、因果関係や相関関係に関連する将来の行動を予測する能力が高まります。

 

回帰分析

データマイニングツールキットで提供される数学的手法の 1 つである 回帰分析 では、将来予測される履歴パターンに基づいて数値が予測されます。その他のさまざまなパターン検出および追跡アルゴリズムは、ユーザがデータとそれが表す動作をより深く理解するのに役立つ柔軟なツールを提供します。

これらは、データマイニングツールキットで利用可能な手法とツールの一部です。ツールや手法の選択は、質問の投げかけ方に応じて手法が適用されるという点で、ある程度自動化されています。以前は、データマイニングはデータベースの "スライスアンドダイシング" と呼ばれていましたが、現在ではより洗練され、アソシエーション、クラスタリング、回帰などの用語が一般的になっています。

ユースケースと例

データマイニングは、センチメント分析、価格最適化、データベースマーケティング、信用リスク管理、トレーニングとサポート、不正行為の検出、ヘルスケアと医療診断、リスク評価、推奨システム(「これを買った人はこんな商品も好きです」)など、さまざまな場面で重要な役割を担っています。小売、卸売流通、サービス業、通信、保険、教育、製造、医療、銀行、科学、工学、オンラインマーケティングやソーシャルメディアなど、あらゆる産業で有効なツールとなります。

  • 製品開発:物理的な製品を設計、製造、販売する企業は、購買パターンと経済・人口統計データを組み合わせて分析することで、製品のターゲットを絞り込む機会を特定することができます。また、設計者とエンジニアは、顧客およびユーザのフィードバック、修理レコード、およびその他のデータを相互参照して、製品改善の機会を特定することもできます。
  • 製造:製造業者は、品質傾向、修理データ、生産率、製品パフォーマンスデータを現場から追跡し、生産上の問題を特定することができます。また、品質の向上、時間とコストの節約、製品パフォーマンスの改善、新しい工場設備やより良い工場設備のニーズを示すプロセスのアップグレードの可能性を認識することもできます。
  • サービス業:サービス業では、顧客からのフィードバック(直接、またはソーシャルメディアやその他のソース)と、特定のサービス、チャネル、同業他社のパフォーマンスデータ、地域、価格、人口統計、経済データなどを相互参照することによって、製品改善のための同様の機会を見出すことができます。

最後に、これらすべての結果を予測および計画にフィードバックすることで、組織全体が顧客のより深い知識に基づいて予想される需要の変化に気付き、新たに特定された機会を活用できる態勢を整える必要があります。

データマイニングの課題

  • ビッグデータ:データは急速に加速するペースで生成されており、データマイニングの機会が広がっています。ただし、大量のデータ構造、高速データ、多種多様なデータ構造、および増加する非構造化データの量を考慮して、ビッグデータから意味を抽出するには、最新のデータマイニングツールが必要です。しかし、多くの既存システムは、このような大量のデータを処理し、保存し、活用することに苦労しています。
  • ユーザーのコンピテンシー: データマイニングと分析ツールは、ユーザーと意思決定者が大量のデータから意味とインサイトを導き出すことを支援するために設計されています。高度な技術を必要とする一方で、これらの強力なツールは優れたユーザーエクスペリエンスデザインとパッケージ化されており、事実上誰でも最小限のトレーニングでこれらのツールを使用することができます。しかし、そのメリットを十分に享受するためには、ユーザーは利用可能なデータと、求めている情報のビジネス上の背景を理解する必要があります。また、少なくとも一般的には、ツールがどのように機能し、何ができるかを把握している必要があります。これは、一般的なマネージャーやエグゼクティブの手の届かない範囲ではなく、学習プロセスであり、ユーザーはこの新しいスキルセットの開発にある程度の努力をする必要があります。
  • データの品質と可用性:大量の新しいデータには、不完全なもの、不正確なもの、誤解を招くもの、不正なもの、破損したもの、あるいは単に役に立たないデータも含まれます。ツールはこのようなデータの整理に役立ちますが、ユーザーはデータの出所とその信頼性を常に意識していなければなりません。また、データの入手や、入手後の管理・取り扱いの面からも、プライバシーへの配慮は重要である。
placeholder

データ管理の専門知識 を拡充

データ管理プロセスとその利点について理解します。

このシリーズの詳細

データマイニングに関する FAQ

データマイニングは、高度な分析ツールを使用して、データの蓄積から有用な情報を抽出するプロセスです。機械学習は、システムが経験から学習できる人工知能 (AI) の一種です。分析プログラムが、実行するデータ分析に応じて機能を調整できる場合、データマイニングで機械学習が使用される場合があります。

データ分析または分析は、有用な情報の特定、評価、および特定の回答の提供に重点を置いた幅広いプラクティスの一般的な用語です。データマイニングは、大量のデータセットを掘り下げてパターン、トレンド、関係を発見することに焦点を当てた、インサイトと予測につながるデータ分析の 1 つです。

データサイエンスとは、データに適用される統計、数学、高度な計算技術など、多くの情報技術を含む用語です。データマイニングは、幅広いソースからの大規模なデータセットの分析に重点を置いたデータサイエンスのユースケースです。

データウェアハウスは、通常は複数のソース (ERPCRM など) からのデータのコレクションであり、企業がアーカイブストレージとデータマイニングなどの広範な分析のために倉庫に統合します。

SAP Insights ニュースレター

placeholder
今すぐ購読

ニュースレターを購読して、重要な情報や知見を手に入れましょう。

詳細情報

先頭に戻る