ما هو مستودع البيانات؟

مستودع البيانات هو مستودع بيانات مركزي يساعد على معالجة مشكلات مخزن البيانات. 

نظرة عامة على مستودع البيانات

في الجوهر، مستودع البيانات هو مستودع للمعلومات. غالبًا ما يتم الخلط بين بحيرات البيانات ومستودعات البيانات، ومع ذلك فإن كليهما يخدم احتياجات أعمال مختلفة ولديه بُنى مختلفة. على وجه الخصوص، تعد بحيرات البيانات السحابية مكونًا حيويًا لاستراتيجية حديثة لإدارة البيانات مع استمرار تسارع انتشار البيانات الاجتماعية وبيانات آلة إنترنت الأشياء (IoT) وبيانات المعامَلات. القدرة على تخزين وتحويل وتحليل أي نوع بيانات يمهد الطريق لفرص الأعمال الجديدة والتحول الرقمي – وهنا في تكمن دور مستودع البيانات.

90

%

من المؤسسات المالية تعتقد أن مبادرات البيانات الضخمة تحدد النجاح المستقبلي

64.2

تم إنشاء zetabytes من البيانات الرقمية في 2020

17.6

ب دولار أمريكي

القيمة المقدَّرة لسوق مستودع البيانات بحلول 2026

تعريف مستودع البيانات

مستودع البيانات هو مستودع بيانات مركزي يساعد على معالجة مشكلات مخزن البيانات. الأهم من ذلك أن مستودع البيانات يخزن كميات هائلة من البيانات الأولية في صيغتها الأصلية – أو الأصلية –. ويمكن أن يكون هذا التنسيق منظمًا أو غير بنيوي أو شبه بنيوي. بحيرات البيانات، وخاصة تلك الموجودة في السحابة، منخفضة التكلفة وقابلة للتطوير وغالبًا ما تستخدم مع تحليلات تدريب الآلة المطبقة.

مستودع البيانات مقابل مستودع البيانات

على عكس مستودع البيانات، يوفر مستودع البيانات إمكانات إدارة البيانات ويخزن البيانات التي تمت معالجتها وتصفيتها والتي تمت معالجتها بالفعل لأسئلة الأعمال المحددة مسبقًا أو حالات الاستخدام.

مخطط لمستودع بيانات تمت مقارنته بمستودع بيانات.

وغالبًا ما تكمل مستودعات البيانات والبحيرات بعضها البعض. على سبيل المثال، عندما تكون هناك حاجة إلى البيانات الأولية المخزنة في مستودع البيانات للإجابة على سؤال تجاري، يمكن استخراجها وتنظيفها وتحويلها واستخدامها في مستودع البيانات لمزيد من التحليل.

 

"مستودع البيانات" هو مفهوم جديد ومتطور، والذي يضيف قدرات إدارة البيانات على قمة مستودع البيانات التقليدي. إنها في الأساس مجموعة مكونة من مستودع بيانات ومستودع بيانات.

 

بالإضافة إلى نوع البيانات والفروق في العملية المذكورة أعلاه، إليك بعض التفاصيل التي تقارن مستودع بيانات بحل مستودع بيانات.

مستودع البيانات
مستودع البيانات
بيانات
أي نوع بيانات من أي مصدر
ارتباطي أو بنيوي
المخطط
المخطط عند القراءة (وقت التحليل)
كتابة المخطط (محدد مسبقًا)
تكاليف التخزين
تكلفة أقل - مقياس بيتابايت
تكلفة أعلى - مقياس تيرابايت
جودة البيانات
بيانات مجمّعة أو غير مجمّعة
بيانات مُجمَّعة
المستخدمون
علماء البيانات ومطورو البيانات (باستخدام Python، على سبيل المثال)، ومحللي الأعمال (باستخدام SQL للبيانات المجمّعة)
محللو الأعمال الذين يستخدمون SQL
التحليلات
تدريب الآلة، والتحليلات التنبؤية، وإنشاء ملفات تعريف/اكتشاف البيانات
إعداد تقارير الدُفعة، التحليل الذكي للأعمال، العروض

وفي نهاية المطاف، فإن حجم البيانات وأداء قاعدة البيانات وتسعير التخزين ستلعب دورًا مهمًا في اختيار حل التخزين المناسب.

العناصر الأساسية لحل مستودع البيانات

  • حركة البيانات: تسمح بحيرات البيانات باستيراد أي نوع بيانات من مصادر متعددة في تنسيقها الأصلي. وهذا يسمح للشركات بالتدرج إلى حجم البيانات حسب الحاجة دون الحاجة إلى تحديد بُنى البيانات والمخطط والتحويلات، مما قد يؤدي إلى توفير التكاليف العامة.

  • بيانات الدليل والمخزن بأمان: تقوم مستودع البيانات بتخزين البيانات البنيوية وشبه البنيوية وغير البنيوية من مجموعة متنوعة من المصادر مثل بيانات الأعمال من برامج إدارة علاقات العملاء أو تخطيط موارد المؤسسة أو أجهزة إنترنت الأشياء أو الوسائط الاجتماعية أو حتى البيانات القديمة من الأنظمة القديمة. وتسمح لك بحيرات البيانات بالتقاط بيانات الدفعات والدفق أثناء تطبيق الإدارة والأمان والتحكم. يمكن الاستعلام عن البيانات مباشرة أو تناولها في مستودع بيانات بالأدوات الصحيحة.

  • التحليلات وتدريب الآلة: تتيح بحيرات البيانات الوصول على أساس الدور إلى المعلومات لتشغيل التحليلات وتحليل تدريب الآلة دون الحاجة إلى نقل البيانات إلى قاعدة بيانات تحليلات منفصلة. بالإضافة إلى ذلك، تسمح بحيرات البيانات بدمج البيانات القديمة مع البيانات في الوقت الفعلي لتنقيح تدريب الآلة أو نماذج التحليلات التنبؤية لتوفير نتائج جديدة و/أو أفضل.

كيفية عمل بحيرات البيانات

يحتوي مستودع البيانات الحديث على ثلاث ميزات رئيسية:

  1. منطقة مقصودة لبياناتك الأولية
  2. منطقة تخزين مؤقت يتم فيها تحويل البيانات مع مراعاة غرض تحليلي
  3. منطقة استكشاف بيانات حيث يتم استخدام البيانات بواسطة التحليلات والتطبيقات وتغذية نماذج تدريب الآلة

من مستودع البيانات، يتم تغذية المعلومات بمجموعة متنوعة من المصادر - مثل التحليلات أو تطبيقات الأعمال الأخرى، أو إلى أدوات تدريب الآلة لمزيد من التحليل.

 

حالة استخدام مستودع البيانات

فيما يلي مثالان لحالة استخدام مستودع البيانات في البيع بالتجزئة.

 

يتم تخزين بيانات المبيعات طويلة الأمد في مستودع بيانات جنبًا إلى جنب مع البيانات غير البنيوية مثل تدفقات النقرات بموقع الويب والطقس والأخبار والبيانات الجزئية/بيانات الاقتصاد الكلي. إن تخزين هذه البيانات معًا وإمكانية الوصول إليها يسهل على عالم البيانات دمج مصادر المعلومات المختلفة هذه في نموذج من شأنه توقع الطلب لمنتج أو خط منتجات محدد. ثم يتم استخدام هذه المعلومات كمدخلات لنظام تخطيط موارد المؤسسة للبيع بالتجزئة لتوجيه خطط الإنتاج المتزايدة أو المنخفضة.

 

وبالتوازي مع ذلك، قد يصل خبير التسويق إلى نفس مستودع البيانات هذا وينظر إلى تحليل المشاعر لموقع الويب والتفاعل عبر وسائل التواصل الاجتماعي مع بيانات سجل الأخبار والاقتصاد الكلي والمبيعات لتحديد المنتجات التي سيتم التركيز عليها وأفضل طريقة لتحقيق أقصى قدر من المبيعات والربح و/أو الاعتماد.

أنواع بحيرات البيانات

يمكن لبحيرات البيانات أن تكون موجودة في أماكن أو على الشبكة السحابية أو مختلطة من كليهما أو عبر العديد من أجهزة السحابة الفائقة، مثل Amazon Web Services (AWS) أو Microsoft Azure أو Google Cloud.

 

إلى حد بعيد، فإن النوع الأكثر شعبية من مستودع البيانات هو مستودع بيانات سحابي. يوفر مستودع البيانات السحابية جميع ميزات مستودع البيانات المعتادة، ولكن في خدمة سحابية مُدارة بالكامل.

  • مستودع البيانات الموضعي: باستخدام مستودع بيانات موضعي، تدير موارد هندسة تكنولوجيا المعلومات الداخلية الأجهزة والبرامج والعمليات. وينطوي هذا النهج على التزام أعلى بالنفقات الرأسمالية، وتميل البيانات إلى أن تكون منعزلة.

  • مستودع البيانات السحابية: في مستودع بيانات سحابية، يتم الاستعانة بمصادر خارجية للبنية الأساسية في مكان العمل. وهناك التزام أعلى بالنفقات التشغيلية (OPEX)، ولكن نهج النشر هذا يسمح للشركات بالتدرج بسهولة أكبر، إلى جانب العديد من الفوائد الأخرى (انظر أدناه).

  • مستودع البيانات المختلط: في حالات محددة، تختار بعض الشركات صيانة كل من بحيرات البيانات في مكان العمل والسحابة في آن واحد. وهذا الوضع نادر جدًا ويظهر في الغالب أثناء سيناريوهات الترحيل من مكان العمل إلى السحابة.

  • مستودع بيانات متعدد الشبكات السحابية: في مستودع بيانات متعدد الشبكات السحابية، يتم تجميع عرضين أو أكثر من العروض السحابية؛ على سبيل المثال، قد تستخدم شركة AWS وAzure معًا لإدارة بحيرات البيانات السحابية وصيانتها. وهذا يتطلب خبرة أكبر لضمان تواصل هذه المنصات المتباينة مع بعضها البعض.

أهم ست مزايا لمستودع بيانات سحابي

لماذا تختار مستودع بيانات سحابية؟ يؤدي تحويل البيانات إلى أصول أعمال عالية القيمة إلى تحفيز التحول الرقمي. وتوفر نقاط قوة السحابة المدمجة مع مستودع بيانات هذه البنية الأساسية. يسمح مستودع البيانات السحابية للشركات بتطبيق التحليلات على البيانات القديمة بالإضافة إلى مصادر البيانات الجديدة، مثل ملفات السجل وتدفقات النقرات والوسائط الاجتماعية والأجهزة المتصلة بالإنترنت وغير ذلك الكثير، للحصول على رؤى قابلة للتنفيذ.

 

فيما يلي بعض المزايا الرئيسية التي يجب أن تتوقعها:

  1. كفاءة التكلفة: يقدم مزودو التخزين السحابي العديد من خيارات التخزين والتسعير.
  2. التدريج التلقائي: تم تصميم الخدمات السحابية لتوفير وظيفة التدريج للسماح للشركات باحتساب قدرة التخزين عند الطلب والاستفادة منها.
  3. مستودع البيانات المركزي: يجمع مستودع البيانات السحابي المعلومات معًا، حيث يعمل كمصدر واحد للحقائق مع وصول محكوم للبيانات يسمح بكفاءة العمليات بين الفرق.
  4. أمان البيانات: يضمن مزوِّدو التخزين السحابي أمان البيانات من خلال نموذج مسؤولية مشترك.
  5. الأدوات: يوفر مزودو التخزين السحابي وبائعون آخرون أدوات ETL التي تزحف البيانات وإنشاء دليل بيانات وتنفيذ تحضير البيانات وتحويل البيانات واستيعاب البيانات لجعل البيانات قابلة للاستعلام.
  6. تحسين التحليلات للحصول على رؤى جديدة ونتائج أعمال أفضل: يمكن لمستودع بيانات الشبكة السحابية تجميع البيانات بطرق جديدة. على سبيل المثال، يمكن أن توفر بيانات إدارة علاقات العملاء وتحليلات الوسائط الاجتماعية رؤى جديدة للعملاء حول سبب فقد العملاء أو إظهار الترويجات التي تزيد من الولاء. كذلك، يمكن تحسين الكفاءة التشغيلية من خلال تحليل بيانات إنترنت الأشياء.

الأسئلة المتكررة في مستودع البيانات

استكشف بعض أسئلتنا الشائعة حول بحيرات البيانات أدناه، واستعرض مسرد إدارة البيانات لدينا للحصول على مزيد من التعريفات.

تطور مصطلح "مستودع البيانات" ليعكس مفهوم المخزن السائل، والمخزن الأكبر للبيانات - مقارنة بمستودع البيانات المنعزل، والمحدد جيدًا، والمنظم للبيانات، على وجه التحديد.

 

قبل أكثر من عقد من الزمن، ومع نمو مصادر البيانات، تغيرت بحيرات البيانات لمعالجة الحاجة إلى تخزين البيتابايت من البيانات غير المحددة للتحليل اللاحق. استندت بحيرات البيانات المبكرة على نظام ملفات هادوب (HDFS) وأجهزة السلع القائمة في مراكز البيانات الموضعية. ومع ذلك، فإن التحديات الكامنة مع بنية موزعة والحاجة إلى تحويل البيانات المخصصة وتحليلها ساهمت في الأداء دون المستوى الأمثل للأنظمة القائمة على هادوب.

 

أصبحت تقنيات الحوسبة السحابية وتخزين البيانات الآن الأساس الرئيسي لتجمع البيانات الحديثة – ولبحيرات البيانات السحابية.

مستودع البيانات (DW) هو نظام تخزين رقمي يربط وينسق بين كميات كبيرة من البيانات المنظمة والمنسقة من العديد من المصادر المختلفة. في المقابل، مستودع البيانات يخزن البيانات في شكله الأصلي – وغير بنيوي أو منسق.

إدارة البيانات هي عملية جمع البيانات وتنظيمها والوصول إليها لدعم الإنتاجية والكفاءة واتخاذ القرارات.

يضيف مركز تخزين البيانات إدارة البيانات وقدرات المستودعات أعلى قدرات مستودع البيانات التقليدي. هذا مجال جديد ومتطور ويتغير بسرعة.

السحابة المتعددة هي استخدام الحوسبة السحابية المتعددة وخدمات التخزين في بنية واحدة غير متجانسة. وهذا يشير إلى توزيع الأصول السحابية والبرامج والتطبيقات، على سبيل المثال، عبر العديد من بيئات استضافة السحابة.

يقوم تخزين الملفات بتنظيم البيانات وتمثيلها كتسلسل هرمي للملفات في مجلدات؛ وحظر بيانات مقاطع التخزين في أحجام منظمة بشكل عشوائي ومتساوي الحجم؛ ويقوم تخزين الكائنات بإدارة البيانات وربطها ببيانات التعريف المرتبطة. تسمح أنظمة تخزين الكائنات بالاحتفاظ بكميات هائلة من البيانات غير البنيوية.

placeholder

بدء استخدام حلول مستودع البيانات

استكشاف إمكانات مستودع البيانات ضمن SAP HANA Cloud.

placeholder

الأفكار التي لن تجدها في أي مكان آخر

اشترك للحصول على جرعة من ذكاء الأعمال يتم تسليمها مباشرة إلى صندوق الوارد الخاص بك.

twitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixel