ما هي البيانات الضخمة؟

البيانات الضخمة هي محيط المعلومات التي نسبح فيها كل يوم – زيتابايت واسعة من البيانات المتدفقة من حواسيبنا وأجهزتنا المحمولة وأجهزة الاستشعار الآلية.

تعريف البيانات الضخمة بالتفصيل

البيانات الضخمة هي محيط المعلومات التي نسبح فيها كل يوم - زيتابايت واسعة من البيانات المتدفقة من حواسيبنا وأجهزتنا المحمولة وأجهزة الاستشعار الآلية. يتم استخدام هذه البيانات من قبل المؤسسات لدفع القرارات وتحسين العمليات والسياسات وإنشاء منتجات وخدمات وتجارب تركز على العملاء. تعرف البيانات الضخمة بأنها "كبيرة" ليس فقط بسبب حجمها، ولكن أيضًا بسبب تنوع وتعقيد طبيعتها. وعادة ما تتجاوز سعة قواعد البيانات التقليدية لالتقاطها وإدارتها ومعالجتها. ، يمكن أن تأتي البيانات الضخمة من أي مكان أو أي شيء على وجه الأرض يمكننا مراقبته رقميًا. أقمار الطقس الصناعية وأجهزة إنترنت الأشياء (IoT) وكاميرات المرور واتجاهات وسائل التواصل الاجتماعي – هذه مجرد عدد قليل من مصادر البيانات التي يتم استخراجها وتحليلها لجعل الشركات أكثر مرونة وتنافسية.

أهمية تحليلات البيانات الضخمة

يتم قياس القيمة الحقيقية للبيانات الضخمة حسب درجة قدرتك على تحليلها وفهمها. يسمح الذكاء الاصطناعي (AI) وتدريب الآلة وتقنيات قاعدة البيانات الحديثة بعرض البيانات الضخمة وتحليلها بتقديم رؤى قابلة للتنفيذ – في الوقت الفعلي. تساعد تحليلات البيانات الضخمة الشركات على وضع بياناتها في العمل – لتحقيق فرص جديدة وبناء نماذج أعمال. وكما قال جيفري مور، المؤلف والمحلل الإداري، بصراحة، “بدون تحليلات البيانات الضخمة، تكون الشركات عمياء وصماء، وتتجول في الشبكة مثل الغزلان على طريق حر.”

تطور البيانات الضخمة

كما لا يمكن تصوره كما يبدو اليوم، أخذ حاسوب أبولو التوجيهي أول سفينة فضاء إلى القمر مع أقل من 80 كيلوبايت من الذاكرة. ومنذ ذلك الحين، نمت تكنولوجيا الكمبيوتر بمعدل أسي – وتوليد البيانات جنبا إلى جنب معها. وفي الواقع، فإن القدرة التكنولوجية في العالم على تخزين البيانات تتضاعف كل ثﻻث سنوات تقريبا منذ الثمانينات. قبل أكثر من 50 عاما فقط عندما رفعت أبولو 11، كان من الممكن أن تكون كمية البيانات الرقمية المتولدة في العالم بأسره مناسبة على الكمبيوتر المحمول المتوسط. في عام 2020، تم إنشاء تقديرات statista 64.2ZB من البيانات أو تكرارها و "كمية البيانات الرقمية التي تم إنشاؤها على مدى السنوات الخمس المقبلة ستكون أكبر من ضعف كمية البيانات التي تم إنشاؤها منذ ظهور التخزين الرقمي."

64.2

 زيتابايت

من البيانات الرقمية التي تم إنشاؤها في 2020

2

x

سيتم إنشاء حجم البيانات على مدى السنوات الخمس القادمة

ومع تقدم البرمجيات والتكنولوجيا بشكل أكبر وأكثر، فإن الأنظمة غير الرقمية الأقل قابلية للتطبيق تكون عن طريق المقارنة. تتطلب البيانات التي تم إنشاؤها وتجميعها رقميًا أنظمة إدارة بيانات أكثر تقدمًا لمعالجتها. بالإضافة إلى ذلك، ساعد النمو الأسي لمنصات التواصل الاجتماعي وتقنيات الهواتف الذكية وأجهزة إنترنت الأشياء المتصلة رقمياً في خلق عصر البيانات الضخمة الحالي.

أنواع البيانات الضخمة: ما هي البيانات المنظمة وغير البنيوية؟

عادة ما يتم تصنيف مجموعات البيانات إلى ثلاثة أنواع على أساس بنيتها ومدى وضوحها (أو عدم فهرستها).

الأنواع الثلاثة للبيانات الضخمة

  1. البيانات المهيكلة: هذا النوع من البيانات هو أبسط أنواع التنظيم والبحث. ويمكن أن تتضمن أشياء مثل البيانات المالية وسجلات الآلات والتفاصيل الديموغرافية. يعد جدول بيانات Excel، بمخططه للأعمدة والصفوف المحددة مسبقًا، طريقة جيدة لرؤية البيانات البنيوية. ويتم تصنيف مكوناتها بسهولة، مما يسمح لمصممي قواعد البيانات والمسؤولين بتحديد خوارزميات بسيطة للبحث والتحليل. حتى عندما توجد بيانات منظمة بحجم هائل، فإنها لا تكون بالضرورة مؤهلة كبيانات ضخمة لأن البيانات المنظمة من تلقاء نفسها بسيطة نسبيًا للإدارة وبالتالي لا تستوفي المعايير المحددة للبيانات الضخمة. تقليديا، استخدمت قواعد البيانات لغة برمجة تسمى لغة الاستعلام المهيكلة (SQL) من أجل إدارة البيانات المنظمة. تم تطوير SQL من قبل ibm في السبعينيات للسماح للمطورين ببناء وإدارة قواعد البيانات العلائقية (نمط جدول البيانات) التي كانت تبدأ في الإقلاع في ذلك الوقت.  
  2. البيانات غير المنظمة: يمكن أن تشمل هذه الفئة من البيانات أشياء مثل منشورات الوسائط الاجتماعية، والملفات الصوتية، والصور، وتعليقات العملاء المفتوحة العضوية. لا يمكن تسجيل هذا النوع من البيانات بسهولة في قواعد البيانات العلائقية القياسية لعمود الصف. تقليديًا، كان على الشركات التي ترغب في البحث عن أو إدارة أو تحليل كميات كبيرة من البيانات غير المنظمة استخدام عمليات يدوية شاقة. ولم يكن هناك أبدا أي سؤال عن القيمة المحتملة لتحليل هذه البيانات وفهمها، ولكن تكلفة القيام بذلك كثيرا ما تكون باهظة جدا بحيث لا تجعلها جديرة بالاهتمام. وبالنظر إلى الوقت المستغرق، كانت النتائج في كثير من الأحيان عتيقة قبل أن يتم تسليمها. بدلاً من جداول البيانات أو قواعد البيانات العلائقية، عادة ما يتم تخزين البيانات غير المنظمة في بحيرات البيانات ومستودعات البيانات وقواعد بيانات NoSQL.
  3. البيانات شبه المنظمة: كما يبدو، فإن البيانات شبه المنظمة هي هجين من البيانات المنظمة وغير المنظمة. تعد رسائل البريد الإلكتروني مثالاً جيدًا لأنها تتضمن بيانات غير بنيوية في نص الرسالة، بالإضافة إلى مزيد من الخصائص التنظيمية مثل المرسِل والمستلِم والموضوع والتاريخ. كما يمكن للأجهزة التي تستخدم العلامات الجغرافية أو الطوابع الزمنية أو العلامات الدلالية تقديم بيانات منظمة إلى جانب محتوى غير بنيوي. صورة هاتف ذكي غير محدد الهوية، على سبيل المثال، لا يزال بإمكانها إخبارك بأنها سيلفي، والوقت والمكان الذي التقطت فيه. لا يمكن لقاعدة بيانات حديثة تعمل بتقنية الذكاء الاصطناعي تحديد أنواع مختلفة من البيانات على الفور فحسب، بل يمكنها أيضًا إنشاء خوارزميات في الوقت الفعلي لإدارة مجموعات البيانات المختلفة المعنية وتحليلها بشكل فعال. 

مصادر البيانات الضخمة

وينمو نطاق الأشياء المولدة للبيانات بمعدل ظاهري – من أقمار الطائرات بدون طيار إلى أجهزة السحب. ولكن لأغراض التصنيف، يتم تقسيم مصادر البيانات بشكل عام إلى ثلاثة أنواع:

 

البيانات الاجتماعية

وكما هي الأصوات، يتم توليد البيانات الاجتماعية من خلال تعليقات وسائل التواصل الاجتماعي، والمنشورات، والصور، وبشكل متزايد، الفيديو. ومع الانتشار العالمي المتنامي لشبكات الجيل الرابع والخلايا 5جي، يقدر عدد الأشخاص في العالم الذين يشاهدون بانتظام محتوى الفيديو على هواتفهم الذكية سيرتفع إلى 2.72 مليار شخص بحلول عام 2023. وعلى الرغم من أن الاتجاهات في وسائل التواصل الاجتماعي واستخدامها تميل إلى التغيير بسرعة وبشكل غير متوقع، إلا أن ما لا يتغير هو نموها المطرد كمولد للبيانات الرقمية.

 

بيانات الجهاز

يتم تزويد أجهزة وآلات إنترنت الأشياء بأجهزة استشعار ولديها القدرة على إرسال واستقبال البيانات الرقمية. تساعد أجهزة استشعار إنترنت الأشياء الشركات على جمع ومعالجة بيانات الآلات من الأجهزة والمركبات والمعدات في جميع أنحاء الأعمال. على الصعيد العالمي، فإن عدد الأشياء المولدة للبيانات ينمو بسرعة – من الطقس وأجهزة استشعار المرور إلى المراقبة الأمنية. وتشير تقديرات IDC إلى أنه بحلول عام 2025 سيكون هناك أكثر من 40 مليار جهاز إنترنت الأشياء على وجه الأرض، مما يولد ما يقرب من نصف إجمالي البيانات الرقمية في العالم.

 

بيانات المعاملة

هذه هي بعض من أسرع البيانات تحركا وتناميا في العالم. على سبيل المثال، من المعروف أن بائع التجزئة الدولي الكبير يعالج أكثر من مليون معاملة للعميل كل ساعة. وعندما تضيف في جميع المعاملات الشرائية والمصرفية في العالم، تحصل على صورة للحجم المذهل للبيانات التي يتم إنشاؤها. وعلاوة على ذلك، تتكون بيانات المعاملات بشكل متزايد من بيانات شبه منظمة، بما في ذلك أشياء مثل الصور والتعليقات، مما يجعلها أكثر تعقيدًا للإدارة والمعالجة.

القيم الخمس التي تحدد البيانات الضخمة

فقط لأن مجموعة البيانات كبيرة، فهي ليست بالضرورة بيانات ضخمة. وللتأهيل على هذا النحو، يجب أن تحتوي البيانات على الصفات المميزة الخمس التالية على الأقل:

الخصائص الخمس للبيانات الضخمة، التي تسمى البيانات الضخمة

  1. الحجم: في حين أن الحجم لا يكون بأي حال من الأحوال المكون الوحيد الذي يجعل البيانات الضخمة "كبيرة"، إلا أنها بالتأكيد ميزة أساسية. لإدارة البيانات الضخمة واستخدامها بشكل كامل، يلزم وجود خوارزميات متقدمة وتحليلات موجَّهة بالذكاء الاصطناعي. ولكن قبل أي من ذلك يمكن أن يحدث، لا بد من وجود وسيلة آمنة وموثوقة لتخزين وتنظيم واسترجاع العديد من تيرابايت البيانات التي تحتفظ بها الشركات الكبرى.
  2. السرعة: في الماضي، كان لا بد من إدخال أي بيانات تم توليدها في وقت لاحق في نظام قاعدة بيانات تقليدي - غالبًا يدويًا - قبل أن يمكن تحليلها أو استرجاعها. اليوم، تسمح تقنية البيانات الضخمة لقواعد البيانات بمعالجة البيانات وتحليلها وتكوينها أثناء توليدها - في بعض الأحيان خلال مللي ثانية. وبالنسبة للشركات، فإن ذلك يعني أنه يمكن استخدام البيانات في الوقت الفعلي لالتقاط الفرص المالية والاستجابة لاحتياجات العملاء وإحباط الاحتيال ومعالجة أي نشاط آخر تكون فيه السرعة بالغة الأهمية.
  3. التنوع: مجموعات البيانات التي تتكون فقط من بيانات منظمة ليست بالضرورة بيانات كبيرة، بغض النظر عن حجم حجمها. وتتكون البيانات الضخمة عادة من مجموعات من البيانات المنظمة وغير المنظمة وشبه المنظمة. وتفتقر قواعد البيانات التقليدية وحلول إدارة البيانات إلى المرونة والنطاق لإدارة مجموعات البيانات المعقدة والمتباينة التي تشكل البيانات الضخمة.
  4. veracity: في حين أن تقنية قواعد البيانات الحديثة تجعل من الممكن للشركات تجميع وإضفاء معنى على كميات وأنواع مذهلة من البيانات الضخمة، إلا أنها لا تكون ذات قيمة إلا إذا كانت دقيقة وذات صلة وفي الوقت المناسب. بالنسبة لقواعد البيانات التقليدية التي كانت مملوءة فقط بالبيانات المنظمة، كانت الأخطاء النحوية والطباعية هي المذنبين المعتادين عندما وصلت إلى دقة البيانات. مع البيانات غير المنظمة، هناك مجموعة جديدة كاملة من تحديات صحة. التحيز البشري والضوضاء الاجتماعية وقضايا مصدر البيانات يمكن أن يكون لها جميعها تأثير على جودة البيانات.
  5. القيمة: بدون سؤال، غالباً ما تكون النتائج التي تأتي من تحليل البيانات الضخمة رائعة وغير متوقعة. ولكن بالنسبة للشركات، يجب أن تقدم تحليلات البيانات الضخمة رؤى يمكن أن تساعد الشركات على أن تصبح أكثر تنافسية ومرونة – وأن تقدم خدمة أفضل لعملائها. تتيح تقنيات البيانات الضخمة الحديثة القدرة على جمع واسترجاع البيانات التي يمكن أن توفر فائدة قابلة للقياس لكل من الخطوط السفلية والمرونة التشغيلية.

مزايا البيانات الضخمة

تتيح حلول إدارة البيانات الضخمة الحديثة للشركات تحويل البيانات الأولية إلى رؤى ذات صلة – بسرعة ودقة غير مسبقتين.

  • تطوير المنتجات والخدمات: تتيح تحليلات البيانات الضخمة لمطوري المنتجات تحليل البيانات غير المهيكلة، مثل مراجعات العملاء والاتجاهات الثقافية، والاستجابة بسرعة.

  • الصيانة التنبؤية: في استطلاع دولي، وجدت ماكينزي أن تحليل البيانات الضخمة من الآلات المزودة بإنترنت الأشياء خفض تكاليف صيانة المعدات بنسبة تصل إلى 40٪.

  • تجربة العملاء: في استطلاع عام 2020 لقادة الأعمال العالميين، قررت جارتنر أن "الشركات النامية تقوم بجمع بيانات تجربة العملاء بشكل أكثر نشاطًا من الشركات غير ذات النمو." يتيح تحليل البيانات الضخمة للشركات تحسين تجربة عملائها وتخصيصها بعلامتهم التجارية. وبالإضافة إلى البيانات الضخمة، أخذت فرق تجربة العملاء بشكل متزايد "البيانات السميكة" في الاعتبار. وتعمل هذه الرؤى النوعية على ملاحظات العملاء ومشاعرهم وردود أفعالهم على تعزيز البيانات الضخمة ومنح الشركات فهمًا أكثر شمولاً لعملائها.

  • المرونة وإدارة المخاطر: كان جائحة كوفيد-19 صحوة حادة للعديد من قادة الأعمال حيث أدركوا مدى ضعف عملياتهم. يمكن أن تساعد رؤى البيانات الضخمة الشركات على توقع المخاطر والاستعداد لما هو غير متوقع.

  • توفير التكاليف وزيادة الكفاءة: عندما تطبق الشركات تحليلات متقدمة للبيانات الضخمة عبر جميع العمليات داخل مؤسستها، فإنها لا تستطيع فقط تحديد أوجه القصور، ولكن لتنفيذ حلول سريعة وفعالة.

  • تحسين القدرة التنافسية: يمكن أن تساعد الرؤى المستخلصة من البيانات الضخمة الشركات على توفير الأموال، وإرضاء العملاء، وتقديم منتجات أفضل، والابتكار في عمليات الأعمال.

الذكاء الاصطناعي والبيانات الضخمة

تعتمد إدارة البيانات الضخمة على الأنظمة التي لديها القدرة على معالجة وتحليل كميات هائلة من المعلومات المتباينة والمعقدة بشكل معقول. وفي هذا الصدد، فإن للبيانات الضخمة والذكاء الاصطناعي علاقة متبادلة إلى حد ما. البيانات الضخمة لن يكون لها الكثير من الاستخدام العملي دون الذكاء الاصطناعي لتنظيمها وتحليلها. ويعتمد الذكاء الاصطناعي على اتساع مجموعات البيانات الموجودة ضمن البيانات الضخمة لتقديم تحليلات قوية بما يكفي لتكون قابلة للتنفيذ. وكما يقول براندون بورسيل المحلل لدى شركة Forrester Research، فإن "البيانات هي شريان الحياة للذكاء الاصطناعي. يحتاج نظام الذكاء الاصطناعي إلى التعلم من البيانات من أجل التمكن من إنجاز وظيفته.”

"البيانات هي عمر الذكاء الاصطناعي. يحتاج نظام الذكاء الاصطناعي إلى التعلم من البيانات حتى يكون قادرًا على إنجاز وظيفته."

 

براندون بورسيل، محلل، شركة Forrester Research

بالإضافة إلى البيانات الضخمة، تستخدم المؤسسات بشكل متزايد "البيانات الصغيرة" لتدريب خوارزميات الذكاء الاصطناعي وتدريب الآلة الخاصة بها. غالبًا ما يتم تجاهل مجموعات البيانات الصغيرة - مثل استطلاعات التسويق وجداول البيانات ورسائل البريد الإلكتروني وملاحظات الاجتماعات وحتى منشورات الوسائط الاجتماعية الفردية - ولكنها يمكن أن تحتوي على معلومات قيمة. في نهاية المطاف، كلما زادت المواد التي يجب أن تتعلم منها الخوارزميات، كلما كان الناتج أفضل.

تدريب الآلة والبيانات الضخمة

تحدد خوارزميات تدريب الآلة البيانات الواردة وتحدد الأنماط داخلها. يتم تقديم هذه الرؤى للمساعدة في إعلام قرارات الأعمال وأتمتة العمليات. يزدهر تدريب الآلة على البيانات الضخمة لأنه كلما زادت قوة مجموعات البيانات التي يتم تحليلها، زادت فرصة النظام للتعلم والتطوير المستمر لعملياته وتكييفها.

تقنيات البيانات الضخمة

بنية البيانات الضخمة

 

وكما هو الحال مع الهندسة المعمارية في بناء المباني، توفر بنية البيانات الضخمة مخططًا للبنية التأسيسية لكيفية إدارة الشركات لبياناتها وتحليلها. تربط بنية البيانات الضخمة العمليات اللازمة لإدارة البيانات الضخمة في رحلتها عبر أربع "طبقات" أساسية، من مصادر البيانات، إلى تخزين البيانات، ثم إلى تحليل البيانات الضخمة، وأخيرًا من خلال طبقة الاستهلاك التي يتم فيها تقديم النتائج المحللة على أنها ذكاء الأعمال.

 

تحليلات البيانات الضخمة

 

تسمح هذه العملية بعرض البيانات ذات المغزى من خلال استخدام إعداد نماذج البيانات والخوارزميات الخاصة بالصفات المميزة للبيانات الضخمة. وفي دراسة واستطلاع متعمق من كلية الإدارة في معهد ماساتشوستس للتكنولوجيا سلون، سُئل أكثر من 2000 من قادة الأعمال عن تجربة شركتهم فيما يتعلق بتحليل البيانات الضخمة. ومن غير المستغرب أن أولئك الذين شاركوا ودعموا تطوير استراتيجياتهم في إدارة البيانات الضخمة حققوا نتائج أعمال مفيدة للغاية.

 

البيانات الضخمة وأباتشي هادوب

 

صورة 10 ديمات في صندوق كبير واحد ممزوجة في مع 100 نيكل. ثم صورة 10 صناديق أصغر، جنبا إلى جنب، كل منها مع 10 نيكل ودمية واحدة فقط. في أي سيناريو سيكون من الأسهل تحديد الآلام؟ يعمل هادوب بشكل أساسي على هذا المبدأ. وهو إطار مفتوح المصدر لإدارة معالجة البيانات الضخمة الموزعة عبر شبكة من العديد من أجهزة الكمبيوتر المتصلة. لذلك بدلاً من استخدام حاسوب كبير واحد لتخزين ومعالجة جميع البيانات، فإن hadoop تجمّع حواسيب متعددة في شبكة قابلة للتطوير بشكل لا نهائي تقريباً وتحلل البيانات بالتوازي. وعادة ما تستخدم هذه العملية نموذج برمجة يسمى MapReduce، الذي ينسق معالجة البيانات الضخمة عن طريق تنظيم أجهزة الكمبيوتر الموزعة.

 

بحيرات البيانات ومستودعات البيانات وNoSQL

 

يتم استخدام قواعد البيانات التقليدية على نمط جداول بيانات SQL لتخزين البيانات المنظمة. تتطلب البيانات الضخمة غير المنظمة وشبه المنظمة نماذج تخزين ومعالجة فريدة، لأنها لا تصلح لفهرستها وتصنيفها. بحيرات البيانات ومستودعات البيانات وقواعد بيانات NoSQL هي جميع مستودعات البيانات التي تدير مجموعات البيانات غير التقليدية. مستودع البيانات هو مجموعة كبيرة من البيانات الأولية التي لم تتم معالجتها بعد. مستودع البيانات هو مستودع للبيانات التي تمت معالجتها بالفعل لغرض محدد. توفر قواعد بيانات NoSQL مخططًا مرنًا يمكن تعديله ليتناسب مع طبيعة البيانات المطلوب معالجتها. ولكل نظام من هذه الأنظمة نقاط قوته وضعفه وتستخدم العديد من الشركات مزيجًا من مستودعات البيانات المختلفة هذه لتناسب احتياجاتها على أفضل وجه.

 

قواعد بيانات الذاكرة الضمنية

 

تم تطوير قواعد البيانات التقليدية المستندة إلى القرص مع sql وتقنيات قواعد البيانات العلائقية في الاعتبار. في حين أنها قد تكون قادرة على التعامل مع كميات كبيرة من البيانات المنظمة، فإنها ببساطة ليست مصممة لتخزين ومعالجة البيانات غير المنظمة على أفضل وجه. مع قواعد البيانات في الذاكرة، تتم المعالجة والتحليل بالكامل في ذاكرة الوصول العشوائي، بدلا من الحاجة إلى استرجاع البيانات من نظام قائم على القرص. كما أن قواعد البيانات في الذاكرة مبنية على أبنية موزعة. وهذا يعني أنها يمكن أن تحقق سرعات أكبر بكثير من خلال استخدام المعالجة المتوازية، على عكس العقدة الواحدة، ونماذج قواعد البيانات المستندة إلى القرص.

كيفية عمل البيانات الضخمة

تعمل البيانات الضخمة عندما يقدم تحليلها رؤى ذات صلة وقابلة للتنفيذ تعمل على تحسين الأعمال بشكل ملموس. استعدادًا لتحويل البيانات الضخمة، يجب أن تضمن الشركات أن أنظمتها وعملياتها جاهزة بما فيه الكفاية لتجميع البيانات الضخمة وتخزينها وتحليلها.

الخطوات الثلاث الرئيسية التي ينطوي عليها استخدام البيانات الضخمة

  1. تجميع البيانات الضخمة. ويتألف جزء كبير من البيانات الضخمة من مجموعات ضخمة من البيانات غير المنظمة، التي تفيض من مصادر متباينة وغير متناسقة. قواعد البيانات التقليدية المستندة إلى القرص وآليات تكامل البيانات ببساطة لا تساوي مهمة التعامل مع ذلك. تتطلب إدارة البيانات الضخمة اعتماد حلول قاعدة البيانات في الذاكرة وحلول البرامج الخاصة باكتساب البيانات الضخمة.
  2. تخزين البيانات الضخمة. وباسمها ذاته، فإن البيانات الضخمة ضخمة الحجم. العديد من الشركات لديها حلول تخزين في مكان العمل لبياناتها الحالية وتأمل في الاقتصاد من خلال إعادة استخدام تلك المستودعات لتلبية احتياجاتها في معالجة البيانات الضخمة. ومع ذلك، تعمل البيانات الضخمة بشكل أفضل عندما تكون غير مقيدة بالحجم وقيود الذاكرة. وغالبًا ما تندم الشركات التي تفشل في دمج حلول التخزين السحابي في نماذج البيانات الضخمة الخاصة بها منذ البداية على هذا الأمر بضعة أشهر أسفل الطريق.
  3. تحليل البيانات الضخمة. وبدون تطبيق تقنيات الذكاء الاصطناعي وتدريب الآلة على تحليل البيانات الضخمة، فإنه ببساطة ليس من المجدي تحقيق كامل إمكاناتها. واحدة من الخمسة v's من البيانات الضخمة هي "السرعة". ولكي تكون رؤى البيانات الضخمة قابلة للتنفيذ وقيمة، يجب أن تأتي بسرعة. يجب أن تكون عمليات التحليلات ذاتية التحسين وقادرة على التعلم من الخبرة بشكل منتظم - وهي نتيجة لا يمكن تحقيقها إلا باستخدام وظائف الذكاء الاصطناعي وتقنيات قواعد البيانات الحديثة.

تطبيقات البيانات الضخمة


يمكن أن توفر الرؤى الشاملة والتعلم العميق الذي توفره البيانات الضخمة فائدة لأي أعمال أو صناعة تقريبًا. ومع ذلك، غالبًا ما تكون المنظمات الكبيرة ذات الميول التشغيلية المعقدة قادرة على تحقيق أقصى استفادة من البيانات الضخمة.

  • الماليات في مجلة البيانات الضخمة، تشير دراسة أجريت عام 2020 إلى أن البيانات الضخمة “تلعب دورًا مهمًا في تغيير قطاع الخدمات المالية، لا سيما في مجال التجارة والاستثمار، والإصلاح الضريبي، والكشف عن الاحتيال والتحقيق فيه، وتحليل المخاطر، والأتمتة”. كما ساعدت البيانات الضخمة على تحويل الصناعة المالية من خلال تحليل بيانات العملاء وتعليقاتهم للحصول على الرؤى القيّمة اللازمة لتحسين رضا العملاء وخبراتهم. مجموعات بيانات المعاملات هي بعض من أسرع مجموعات البيانات تحركا وأكبرها في العالم. وسيساعد الاعتماد المتزايد لحلول إدارة البيانات الضخمة المتقدمة البنوك والمؤسسات المالية على حماية هذه البيانات واستخدامها بطرق تفيد وتحمي كل من العميل والأعمال.

  • الرعاية الصحية يسمح تحليل البيانات الضخمة للمتخصصين في مجال الرعاية الصحية بإجراء تشخيصات أكثر دقة وقائمة على الأدلة. بالإضافة إلى ذلك، تساعد البيانات الضخمة مسؤولي المستشفيات على تحديد الاتجاهات وإدارة المخاطر وتقليل الإنفاق غير الضروري إلى الحد الأدنى - مما يدفع أعلى الميزانيات الممكنة إلى مجالات رعاية المرضى والأبحاث. في خضم الجائحة، يتسابق علماء البحث في جميع أنحاء العالم نحو طرق أفضل لعلاج وإدارة كوفيد-19 - وتلعب البيانات الضخمة دورًا هائلاً في هذه العملية. يصف مقال نشر في يوليو 2020 في مجلة the Scientist كيف تمكنت الفرق الطبية من التعاون وتحليل البيانات الضخمة للمساعدة في مكافحة فيروس كورونا: "قد نقوم بتغيير طريقة عمل العلوم السريرية، والاستفادة من أدوات وموارد البيانات الضخمة وعلوم البيانات بطرق لم تكن ممكنة."

  • النقل واللوجستيات تأثير أمازون هو مصطلح يصف كيف قامت أمازون بتعيين الشريط لتوقعات التسليم في اليوم التالي إلى حيث يطلب العملاء الآن هذا النوع من سرعة الشحن لأي شيء يطلبونه عبر الإنترنت. وتشير مجلة رواد الأعمال إلى أنه كنتيجة مباشرة لتأثير أمازون، "سينمو سباق الخدمات اللوجستية "الميل الأخير" بشكل أكثر تنافسية." تعتمد شركات الإمداد والتموين بشكل متزايد على تحليلات البيانات الضخمة لتحسين تخطيط المسارات ودمج الأحمال ومقاييس كفاءة استهلاك الوقود.

  • التعليم خلال الوباء، اضطرت المؤسسات التعليمية في جميع أنحاء العالم إلى إعادة ابتكار مناهجها وطرق التدريس لدعم التعلم عن بعد. ومن التحديات الرئيسية التي واجهتها هذه العملية إيجاد طرق موثوقة لتحليل وتقييم أداء الطلاب والفعالية العامة لأساليب التدريس عبر الإنترنت. مقال عام 2020 حول تأثير البيانات الضخمة على التعليم والتعلم عبر الإنترنت يجعل ملاحظة حول المعلمين: "البيانات الضخمة تجعلهم يشعرون بثقة أكبر بكثير في تخصيص التعليم، وتطوير التعلم المختلط، وتحويل أنظمة التقييم، وتعزيز التعلم مدى الحياة."

  • الطاقة والمرافق وفقا للولايات المتحدة. مكتب إحصاءات العمل، تنفق شركات المرافق أكثر من 1.4 مليار دولار أمريكي على قراء العدادات وتعتمد عادة على العدادات التناظرية والقراءات اليدوية غير المتكررة. توفر قراء العدادات الذكية بيانات رقمية عدة مرات في اليوم، ومن خلال الاستفادة من تحليل البيانات الضخمة، يمكن لهذه المعلومات أن تفيد في استخدام الطاقة بكفاءة أكبر والتسعير والتوقع الأكثر دقة. علاوة على ذلك، عندما يتم تحرير العمال الميدانيين من قراءة العداد، يمكن أن يساعد التقاط البيانات وتحليلها على إعادة تخصيصها بسرعة أكبر إلى حيث تكون هناك حاجة ماسة إلى الإصلاحات والترقيات.

الأسئلة المتكررة حول البيانات الضخمة

تتكون البيانات الضخمة من جميع البيانات ذات الصلة بالأعمال المحتملة - سواء أكانت منظمة أو غير منظمة - من مجموعة متنوعة من المصادر المتباينة. وبمجرد تحليلها، يتم استخدامها لتوفير رؤية أعمق ومعلومات أكثر دقة حول جميع المجالات التشغيلية للأعمال وسوقها.

تنطبق تقنية البيانات الضخمة على جميع الأدوات والبرامج والتقنيات التي يتم استخدامها لمعالجة البيانات الضخمة وتحليلها - بما في ذلك (على سبيل المثال لا الحصر) التنقيب عن البيانات وتخزين البيانات ومشاركة البيانات وعرض البيانات.

أباتشي هادوب (Apache Hadoop) هو حل برمجي للمعالجة الموزعة مفتوح المصدر. يتم استخدامه لتسريع وتسهيل إدارة البيانات الضخمة عن طريق ربط عدة أجهزة كمبيوتر والسماح لهم بمعالجة البيانات الضخمة بالتوازي.

أباتشي سبارك (Apache Spark) هو حل برمجي للمعالجة الموزعة مفتوح المصدر. يتم استخدامه لتسريع وتسهيل إدارة البيانات الضخمة عن طريق ربط عدة أجهزة كمبيوتر والسماح لهم بمعالجة البيانات الضخمة بالتوازي. يتم استخدام سابقتها هادوب بشكل أكثر شيوعًا، ولكن سبارك تكتسب شعبية بسبب استخدامها لتعلم الآلة والتقنيات الأخرى، والتي تزيد من سرعتها وكفاءتها.  

مستودع البيانات هو مستودع يمكن فيه تخزين واسترجاع كميات كبيرة من البيانات الخام وغير المنظمة. بحيرات البيانات ضرورية لأن الكثير من البيانات الضخمة غير منظمة ولا يمكن تخزينها في قاعدة بيانات ارتباطية تقليدية لعمود الصف.

البيانات المظلمة هي جميع البيانات التي تجمعها الشركات كجزء من عملياتها التجارية المنتظمة (مثل، لقطات المراقبة وملفات سجل المواقع). يتم حفظه لأغراض الالتزام ولكن عادة لا يتم استخدامه مطلقًا. وتكلف مجموعات البيانات الكبيرة هذه تخزين أكثر من القيمة التي تجلبها.

نسيج البيانات هو تكامل بنية البيانات الضخمة وتقنياتها عبر نظام بيئي للأعمال بأكمله. والغرض منه هو ربط البيانات الضخمة من جميع المصادر ومن جميع الأنواع، مع جميع خدمات إدارة البيانات في جميع أنحاء الأعمال.

placeholder

استكشاف حلول إدارة البيانات من SAP

إدارة البنية الأساسية للبيانات المتنوعة لديك وتوحيد بياناتك لرؤى الأعمال.

placeholder

الأفكار التي لن تجدها في أي مكان آخر

اشترك للحصول على جرعة من ذكاء الأعمال يتم تسليمها مباشرة إلى صندوق الوارد الخاص بك.

twitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixeltwitter pixel