الحلقة التاسعة: البيانات الكبيرة – البيانات الكبيرة ثروة وطاقة تدفع المكونات الاقتصادية للنمو

Share On:

د. م. علي محمد الخوري
كما بدأنا وأوضحناه في المقالة السابقة، فقد أصبحت البيانات اليوم هي الوسيلة الأساسية والمحركة لسلاسل القيمة المضافة وشبكة القيمة الاقتصادية، بل أصبحت ثروة وقيمة اقتصادية في حد ذاتها.

ومع ظهور مفهوم البيانات الكبيرة (Big Data) كعلم له أدواته وأهدافه، فقد انتبه العالم بشكل متصاعد خلال العقد الأول من القرن الواحد والعشرين لأهمية البيانات، والاستفادة من تراكماتها اليومية الضخمة، كثروة مادية تتميز بأنها تزداد في قيمتها كلما تم استخدامها، ولا تنضب مثل الثروات الطبيعية الأخرى كالنفط والذهب والحديد والنباتات وغيرها. والتعريف العلمي يصف البيانات الكبيرة بأنها مجموعة من البيانات كبيرة الحجم ومعقدة التركيب، بحيث لا تتمكن برامج معالجة البيانات التقليدية من التعامل معها، بل تحتاج إلى أنظمة متقدمة لإدارتها وتحليلها خلال فترة زمنية معقولة.

أنواع البيانات وأقسامها

يمكن أن تتضمن مجموعات البيانات الكبيرة أشكال مختلفة: مثل (1) بيانات منظمة (Structured Data) كالمتوفرة في قواعد البيانات، و(2) بيانات غير منظمة (Unstructured Data) مثل بيانات مواقع الإنترنت والتواصل الاجتماعي والصحف، والتي يمكن من خلال تحليلها المتعمق الوصول لمفاهيم واستنتاجات هامة. ووفقا للنماذج العالمية فإن البيانات الكبيرة لها صفات مختلفة، مثل:

  1. كبيرة الحجم (Volume)، والتي يمكن أن تصل أحجامها لملايين التريليونات من السجلات والبيانات.
  2. عالية التنوع (Variety)، ويقصد بها تنوع البيانات المستخرجة، وتتضمن الملفات الإلكترونية، وقواعد البيانات، وصفحات الإنترنت، وتسجيلات الفيديو، وغيرها،وتتطلب وقتاً وجهداً لتهيئتها في شكل مناسب للتحليل.
  3. عالية السرعة (Velocity)، وتشير إلى سرعة إنتاج واستخراج البيانات، حيث تتطلب هذه البيانات أنظمة معالجة وتحليل فورية (Real Time Processing)، كعناصر حاسمة لدعم اتخاذ القرار.
  4. الدقة والموثوقية (Veracity): وتشير إلى مدى الاعتمادية على البيانات.
  5. القيمة (Value): وهي تمثل الهدف الحقيقي للمزج بين الصفات الأربعة الأولى، كأن تنشئ المعلومات التي تم جمعها وتحليلها خط إنتاج أو فرص بيع جديدة أو إجراءات لخفض التكاليف.

وبهذه الصورة، فإنه يمكن اعتبار أن البيانات مثلها مثل المواد الخام، فهي تحتاج للتحليل واستخراج ما تحمله هذه البيانات من حقائق ومعارف، للاستفادة منها كما هو حال النفط؛ فمجرد استخراجه من باطن الأرض لا يعني بأنه جاهز كوقود للاستخدام الصناعي، بل يحتاج للتكرير والتصفية لينتج المواد المفيدة القابلة للاستخدام.

فكيف يستفيد الاقتصاد من البيانات الكبيرة؟ ينظر الاقتصاد الرقمي للبيانات الكبيرة على أنها أحد أهم أسس بناء أي اقتصاد مستدام بالحاضر والمستقبل، لأنه سيكون معتمداً على المعرفة والتحليل الحقيقي والفهم الواقعي، ولا يتركه للصدفة أو الحظ، ومن أجل تحويل البيانات الكبيرة لمعلومات واضحة ومعارف قابلة للاستخدام. وهناك فرعين من العلوم يتم توظيفهما كمنهاج  لنمذجة البيانات ومعالجة البيانات الكبيرة، وهما علم البيانات وعلم تحليل البيانات.

علم البيانات (Data Science) هو مجال يجمع بين تخصصات متعددة مثل الإحصاء، والرياضيات، وتقنيات جمع البيانات الذكية، ومواءمتها للتحليل بهدف استخلاص رؤى ومعلومات. ويركز هذا العلم بشكل أساسي على استكشاف الأشياء التي لا نعرفها وإيجاد طرق أفضل لتحليل المعلومات، من خلال طرح أسئلة وفرضيات محتملة، وربطها مع مصادر بيانات مختلفة ومتباينة وغير مترابطة.

أما علم تحليل البيانات (Big Data Analytics) فهو يركز على إجراءات التحليل الإحصائي لمجموعات البيانات المتوفرة للكشف عن الأنماط الخفية والعلاقات غير المعروفة – كاتجاهات السوق وتفضيلات المتعاملين – وعلى تصميم طرق مبسطة لعرض البيانات والمعلومات لحل المشكلات والإجابة على التساؤلات التي تهم صانع القرار، وإيجاد نتائج يمكن أن تؤدي إلى تحسينات فورية.

ولفهم الفرق بين علم البيانات وتحليل البيانات، فإنه يمكن وصف علم البيانات بالمظلة الشمولية التي تتضمن الطرق العلمية والرياضيات والإحصاءات وغيرها من الأدوات المستخدمة لتحليل البيانات ومعالجتها. وعادةً ما تكون تحليلات البيانات أكثر تركيزًا من علم البيانات لأنه بدلاً من مجرد البحث عن العلاقات بين المتغيرات ومجموعات البيانات، يكون لمحللي البيانات هدف محدد في عرض ملخصات البيانات الإحصائية وعرضها بالصورة التي تدعم متخذ القرار.

ويعتبر تطبيق ذكاء الأعمال (Business Intelligence) أحد التطبيقات الشهيرة لتحليل البيانات اليوم، فنجد أن الكثير من المؤسسات الحكومية والخاصة لا يمكن أن تستغني عن تطبيقات ذكاء الاعمال بل وتتعامل معها كلوحات لقياس الأداء (Dashboard) وأداة لدعم اتخاذ القرار.

وترتبط البيانات الكبيرة بالعديد من التكنولوجيات الحديثة مثل تعلم الآلة والذكاء الاصطناعي، وتعتبر مدخلاً أساسياً لهذه التقنيات، خاصة في مجال تعلم الآلة (Machine Learning)، والذي يعتبر الذكاء الاصطناعي فرعاً من علم البيانات.

ومن الصعب وضع خطوطاً فاصلة بين هذه التقنيات، بل يوجد بينها العديد من المساحات المشتركة، وهي تتكامل بشكل متجذر وكبير.

وإجمالاً، فإن المراحل الأساسية لعمليات إدارة وتحليل البيانات الكبيرة يمكن ترتيبها وفق الخطوات التالية:

  1. تجميع البيانات وتحديد مصادرها المختلفة وأنواعها، وآليات نقلها وتخزينها.
  2. معالجة البيانات وتجهيزها لعملية التحليل، وتشمل معالجة أية نواقص أو أخطاء بالبيانات وتحديد آليات تصحيحها، لتكون في صورة معيارية جاهزة للتحليل، وهي مرحلة بغاية الأهمية وخاصة في حالات البيانات ذات الطبيعة غير المنظمة (Unstructured Data)، والتي تستوجب وضع معايير واضحة للتصنيف وتحديد الحقول والمتغيرات والثوابت.
  3. مرحلة التحليل وفيها يتم تحديد الأهداف من التحليل وطريقتها، وتنقسم هنا أنواع التحليل لأربعة أنواع:
  • التحليل الوصفي (Descriptive analytics): ويهتم هذا التحليل بالتعرف على المؤشرات الإحصائية العامة التي تصف البيانات التي حدثت بالماضي، ومن أشهر هذه المؤشرات (المتوسط الحسابي – الانحراف المعياري – المجموع – العدد – النسب – إلخ).
  • التحليل الاستقصائي (Diagnostic analytics): وهذا التحليل يبحث أسباب الظواهر التي حدثت والعلاقات البينية بين المتغيرات مثل العلاقة بين ضغط البخار ودرجة حرارته، او العلاقة بين وفرة المنتج وسعره.
  • التحليل التنبؤي (Predictive Analytics): وهذا النوع من التحليل يحاول فهم طبيعة العلاقات بين المتغيرات بعضها البعض وأن يضع لها نموذجها التشغيلي في صورة رياضية، ومن ثم يمكن التنبؤ بالنتائج المستقبلية قبل حدوثها. وهذا التحليل وثيق العلاقة مع تعلم الآلة (Machine Learning).
  • التحليل الافتراضي (Prescriptive Analytics): ويجمع هذا التحليل بين التحليلين الاستقصائي والتنبؤي ليضع حلولاً افتراضية للتنبؤات المستقبلية. وهذا التحليل وثيق الصلة بتقنيات الذكاء الاصطناعي (Artificial Intelligence).
  1. مرحلة التنفيذ، وفيها يتم نقل المعرفة المستخرجة من البيانات لتصبح في خدمة متخذ القرار، وقد يكون هذا القرار آنيا يمكن أن تنفذه الآلة مباشرة، مثل القرار الذي يتخذه الذكاء الاصطناعي أثناء قيادة السيارة ذاتية القيادة.

وتتوفر اليوم العديد من التطبيقات المتخصصة في البيانات الكبيرة، ومنها ما هو متاح مجاناً للمبرمجين والمطورين، ومن أشهر هذه التطبيقات هو تطبيق أباتشي هادوب (Apache Hadoop) وهي الأداة الأكثر بروزًا والأكثر استخدامًا في صناعة البيانات الكبيرة مع قدرتها الهائلة على معالجة البيانات على نطاق واسع. ويعتبر هادوب إطار عمل (مجاني) مفتوح المصدر (Open Source) بنسبة 100٪، ويمكن تشغيله على خوادم مركز البيانات، أو يمكن أن يعمل من خلال الخدمات السحابية. ويأتي أباتشي سبارك (Apache Spark) كثاني أهم تطبيق متخصص بالبيانات الكبيرة. والجدير بالذكر أنه يمكن لـ (Spark) التعامل مع البيانات سواء كانت آنية (ٌReal-Time Data) أو على هيئة دفعات (Batch Files Data). ونظرا لكون هذ التطبيق يعتمد على التشغيل السريع من خلال الذاكرة، فيمكنه معالجة البيانات بشكل أسرع بكثير من معالجات الأنظمة التقليدية. وتأتي لغة البايثون (python) ولغة الآر (R) كأهم لغتين في مجال البيانات الكبيرة والمستخدمة على نطاق واسع من أجل البرمجة إلا أن هذا لا يعني الاقتصار عليهما، ولكنهما الأشهر وذلك نظراً لأنها متاحة مجاناً وتوفر التخصصات في هذا المجال منذ فترة طويلة، مما أدى لتوفر مكتبات كبيرة ومتنوعة لتنفيذ المهام المعقدة الخاصة بالبيانات الكبيرة من خلال برمجيات جاهزة وناضجة.

وبعيداً عن هذا الحديث الفني، فإن التساؤل الأهم، هو كيف يمكن تقييم مدى استفادة قطاعات الأعمال المختلفة للبيات الكبيرة؟

نجد أن استخدامات البيانات الكبيرة في الميدان الصناعي ذا أثر كبير يفيد في تحسين جودة المنتج وتطوير خصائصه بناء على فهم أكثر دقة لمتطلبات السوق، كما أن له دور كبير في توفير المعلومات اللازمة لتخطيط وإدارة شبكة التزويد (Supply-Chain Management).

ففي دراسة لماكينزي، أعلنت أن أثر تطبيقات البيانات الكبيرة في مجال الرعاية الصحية بالولايات المتحدة الأمريكية يتراوح ما بين 12% إلى 17% من تخفيض للنفقات، أي ما بين 300 إلى 400 مليار دولار. والمثير في الأمر، أن التقرير أشار أن هذه النسب متحفظة جداً نظرا لكون الابتكارات التكنولوجية سيكون لها آثاراُ أكبر بكثير في المستقبل.

كما ويشير تقرير آخر لماكينزي حول أهمية البيانات الكبيرة في البحوث الطبية والمتابعة الحثيثة للمريض، حيث أن البيانات المتوفرة لدى المستشفيات وشركات التأمين أصبحت ذات قيمة مادية كبيرة ويتم بيعها وشرائها مع الجهات البحثية ومصنعي الأدوية والعقاقير، والتي حلت بشكل كبير محل البحوث الميدانية الموجهة والمكلفة جداُ والتي تطول لسنوات طويلة، حيث أن البيانات الكبيرة تعتبر بشكل كبير جاهزة ومتوفرة ويمكنها الكشف عن العديد من العلاقات السببية بين المريض والمرض وأسبابه واحتمالات الاستجابة لعلاجه، وهو ما سيكون له أثر كبير في اختصار الكثير من الوقت وتقديم علاجات جديدة كنتيجة لتحليل هذه البيانات، وكنتيجة لثورة الأجهزة الرقمية -المتصلة بالإنترنت- والتي يمكن ارتداؤها وسيكون لها دور كبير في حماية المرضى من المفاجآت المرضية أو التعامل السريع مع أي تغيرات مقلقة، فضلا عن التنبؤ بها قبل وقوعها.

وأصبحت البيانات الكبيرة سلعة تجارية في حد ذاتها، تباع وتشترى، ولها سوق عالمي كبير حيث يتعدد مزايا استخدامها بكافة أنواع الأعمال الخاصة أو الحكومية على حد سواء. ففي تقرير لشركة (IDC) الاستشارية المتخصصة في مجالات التكنولوجيا، أوضحت بأن إيرادات البيانات الكبيرة في جميع أنحاء العالم ستنمو من 130.1 مليار دولار في عام 2016 إلى أكثر من 203 مليارات دولار في عام 2020، أي بمعدل نمو سنوي مركب قدره 11.7٪.

والآراء العالمية العامة للمؤسسات التي تعاملت مع البيانات الكبيرة في القطاعين العام والخاص إيجابي جداً. ففي دراسة حديثة لشركة اكسنشر (Accenture) الاستشارية، شملت العديد من المؤسسات التي أجرت مشروعاُ أو أكثر في مجال البيانات الكبيرة، أكد فيها المسؤولون أن العائد من الاستثمار في البيانات الكبيرة وصل إلى نسب تفوق 92%، كما وأن 89% من الردود أجمعت على أن هذه المشاريع كانت هامة جداُ لنجاح أعمالهم وتطورها وربحيتها. ثم أن 85% من الردود أكدت على أن البيانات الكبيرة كان لها دور ثوري في إعادة تهيئة وتطوير الأعمال لمؤسساتهم.

لكن كيف هو وضع البيانات في العالم العربي؟ تشير الاحصائيات المتعددة أن المنطقة العربية ورغم تباين مستويات النضوج الرقمي بها، ترتفع نسب توظيف هذه التقنية في دول الخليج عن غيرها، إلا أنه يمكن الجزم أن الاقتصاد العربي لم يستفد جدياً حتى الآن من البيانات الكبيرة، وأن مساحات الاستفادة من هذه التكنولوجيا مازالت محدودة وتستخدم فقط على مستويات بعض المؤسسات الكبيرة كالبنوك وشركات الطيران والحكومات على نطاق محدود.

ثم أننا ولنصل إلى نتائج اقتصادية إيجابية حقيقية في العالم العربي، فنحن بحاجة للإسناد التشريعي -وهو دور حكومي أساسي- يشجع على حركة البيانات ويراعي التوازن بين ضرورة الانفتاح على البيانات الكبيرة والاستفادة منها مقابل الحفاظ على الحقوق الشخصية.

كما ويجب النظر بعين الاعتبار لحقيقة السوق العربية المشتركة أنها لا تخص البضائع فقط بل يجب ان تنسحب أيضا على البيانات والتي يجب ان ينتعش سوقها سواء على مستوى البيانات الخام أو المعلومات التي تم تحليلها والتقارير المستخلصة من هذه البيانات، وأن يتم الاستفادة من هذه البيانات على المستوى الاقتصادي، ولا سيما في مجالات دراسات الجدوى وهذا البند في حد ذاته من شأنه أن يوفر المليارات في النفقات وفرص اقتصادية بأضعاف هذه القيمة.

كما أننا نناشد بدعم الشركات الناشئة والتي تتخصص في مجالات تكنولوجيات الجيل الرابع ولا سيما البيانات الكبيرة، لأنها وببساطة هي المحرك الذي يجب أن نعتمد عليه بالمستقبل القريب في المنطقة العربية.

ونحن على ثقة بأن الطريق مُمهد وأن القدرات العربية وخاصة الشبابية يمكن تطويرها، ليكون لهم دور أكبر في تحسين الواقع الاقتصادي العربي، فكل ما يحتاجونه اليوم هو أن ندعم قدراتهم ومعارفهم لكي يتمكنوا من دخول السوق والمنافسة والتطوير الحقيقي.