علم البيانات يطلق أخيرا في مصر
وأخيرا أصبحت دراسة علم البيانات في الجامعة أمرا مهما في مصر: البيانات الضخمة تغير كل شيء، بدءا من الخدمات وحتى التسويق والطب. ومع وجود المزيد من البيانات في كل جانب من جوانب حياتنا بشكل أكبر من أي وقت مضى، فإن فرصة استخراج معلومات مفيدة من تلك البيانات أصبحت أكبر من أي وقت مضى. تحدثنا مع الدكتور علي هادي، رئيس قسم الرياضيات والعلوم الاكتوارية في الجامعة الأمريكية بالقاهرة، ومؤسس أول تخصص في علم البيانات لطلاب الجامعة في مصر، والذي سيجري إطلاقه هذا الخريف. وفيما يلي مقتطفات من حديثنا مع هادي حول البرنامج وأهمية علم البيانات في مصر:
إطلاق البرنامج هذا العام يأتي نتيجة للحاجة الكبيرة لعلماء البيانات. ويرجع هذا في جزء منه إلى عدم وجود برامج في مصر لتخريج علماء للبيانات في وقتنا الحالي. وحتى في الخارج، يوجد عدد قليل جدا من برامج علوم البيانات ومعظمها تكون برامج للدراسات العليا. هذا هو المكان الذي أضاف فيه برنامجنا قيمة مضافة: إنه واحد من عدد قليل جدا من الشهادات الجامعية لمدة أربع سنوات في علم البيانات. سيكون البرنامج صغيرا – 15 طالبا في السنة الأولى و25 طالبا بعد ذلك – وذلك لأننا نريد اختبار السوق والتأكد من أن خريجينا يمكنهم الحصول على وظائف. كما أننا بحاجة أيضا لملء بعض الوظائف الشاغرة بالكلية، كما أننا نبقي على أحجام الفصول الصغيرة لضمان جودة التعليم. لقد قمت بتأسيس برنامج العلوم الاكتوارية في عام 2004 وأعرف كل الأشخاص الذين استخدموه بالاسم. وأتوقع أن يكون هناك ارتفاعا في الطلب، ولكن إذا رأينا غير ذلك، فسنقوم بالتعديل. فنحن نستعد لأسوأ الظروف ونتمنى الأفضل.
يمكن القول باختصار إن علم البيانات هو العلم الخاص باستخراج المعرفة من البيانات من أجل اتخاذ القرارات المستنيرة. توافر البيانات في حد ذاته ليس أمرا مفيدا، فعليك أن تدرك كيفية استخراج المعرفة منها. وقطاع التأمين مثال جيد على هذا الأمر، فلديك الكثير والكثير من مطالبات التأمين التي يمكن أن تكون احتيالية أو ناتجة عن سوء تصرف طبي. ولكن هذه بيانات أولية، ولا يمكنك استخراج المعرفة منها لاتخاذ قرارات مستنيرة. وهنا يأتي دور عالم البيانات كرابط بين البيانات ومتخذي القرار.
ونظرا لأن علم البيانات يتطلب معرفة بالمجال، فإن عالم البيانات يعمل عادة مع أحد الخبراء في مجال معين. فإذا كنا نتحدث عن الطب، فإنه سيعمل مع الأطباء، وإذا كنا نتحدث عن مشكلة اجتماعية، فإنه سيعمل مع علماء الاجتماع. وسيقوم الخبير في ذلك المجال بأخذ النتائج التي يقدمها عالم البيانات ويتخذ القرارات بناء عليها. وفي بعض الأحيان يكون متخذ القرار هو خبير اكتواري، والذي يتخذ القرارات بناء على النماذج الاكتوارية التي يجري استخلاص معلوماتها من البيانات بواسطة عالم البيانات.
تتزايد أهمية دور عالم البيانات نظرا لما لدينا من بيانات متاحة أكثر من أي وقت مضى. فقبل 20 أو 25 عاما، كان عدد الملاحظات في تجربة ما يتراوح ما بين 500 إلى 1000 ملاحظة. أما الآن، أصبح لدينا ملايين الملاحظات – وهو كم معلومات يتجاوز الإحصاءات التقليدية. يستغرق إنشاء مخطط الانتشار باستخدام ملايين النقاط بعض الوقت ويبدو كنقط الحبر. ليس له نمط أو بنية، وهذا هو التحدي وهو كيفية استخراج المعرفة من هذا الرسم البياني الأسود بالسرعة التي نحتاجها لاتخاذ القرارات.
تشهد الشركات نقصا في التفكير الكمي: نفتقر في مصر إلى المعرفة الكمية، وهي القدرة على التوصل إلى الاستنتاج الصحيح، وهناك العديد من الشركات المصرية متعطشة لمثل هذه المعرفة، وخاصة البنوك وشركات تكنولوجيا المعلومات وحتى بعض المؤسسات الحكومية.
وعلى الرغم من هذا الطلب، فإن عدد القطاعات في مصر التي تستخدم علم البيانات يعد على الأصابع. تستخدم وزارة الصحة علم البيانات لتحديد وثائق التأمين الصحي، وخلافه. ولكن بخلاف ذلك، وحتى لو كانت الصناعة بحاجة إلى علماء البيانات، فإنها لن تجد أيا منهم. يقوم المحللون الماليون أو مديرو المخاطر بتلك بالمهمة، ولكنهم ليسوا مدربين تدريبا جيدا على علم البيانات. وتكمن الصعوبة في أن علم البيانات متعددة التخصصات، ويستند إلى الرياضيات والاحتمالات والإحصاءات وعلوم الحاسب.
سيكون لجميع الصناعات والقطاعات طريقتها الخاصة لتطبيق علم البيانات. فلنأخذ شركات التأمين على سبيل المثال. يعمل عالم البيانات مع خبير التأمين وعالم اكتواري للتأكد من أن شركة التأمين لديها احتياطيات كافية للمطالبات غير المتوقعة، ومراقبة السياسات الاحتيالية، وتسعير وثائق التأمين بشكل صحيح.
أما بالنسبة لقطاع البنوك، إذا أراد أحد البنوك تسويق بطاقة ائتمان جديدة، فسيقوم عالم البيانات بتقسيم السوق إلى شرائح ويقرر خبير الصناعة إرسال البريد الدعائي إلى أشخاص بعينهم دون آخرين. وسيؤدي ذلك إلى توفير المال وزيادة معدل الاستجابة.
وأما بالنسبة للحكومة، فإن وزارة المالية تستعين بعلماء البيانات من أجل تقدير الضرائب، وهذا أمر مهم لأن سجل مصر في تحديد المبالغ الصحيحة للضريبة ليس رائعا. هناك مثال آخر، وهو تقدير قيمة الجنيه مقارنة بالعملات الأجنبية في موازنة الدولة، والتي تكون في جزء منها بالجنيه وفي جزء آخر بالعملة الأجنبية.
إذا كانت لدي القدرة على إحداث ثورة في صناعة ما باستخدام علم البيانات، فستكون تلك الصناعة هي التأمين، وذلك لأن شركات التأمين قادرة على استخدام القليل جدا من البيانات الضخمة المتاحة لها. لدى هذه الشركات أطنان وأطنان من البيانات ولكن هناك القليل من الناس الذين يعرفون أنها موجودة، وهناك عدد أقل من الناس يمكنه استخدامها. لدى شركات التأمين البيانات ولكن ليس لديها الخبرة اللازمة لاستخراج المعرفة منها.
علم البيانات أصبح مجالا متأصلا منذ وقت طويل، ولكن مصر حديثة العهد به. هناك أمور كثيرة تأخرت مصر في التعرف عليها، ولكن أن تأتي متأخرا خير من ألا تأتي أبدا. وكان لا بد من أن يقوم شخص ما باتخاذ المبادرة. فمنذ عامين، شعرت بالحاجة إلى علماء بيانات، لذلك قررت إنشاء هذا البرنامج. وقمت بنفس الشيء بالنسبة لبرنامج العلوم الاكتوارية قبل سنوات عديدة. وأتمنى أن ينجح مثل برنامج العلوم الاكتوارية، والذي يعد واحدا من أفضل البرامج لدى الجامعة الأمريكية بالقاهرة حاليا من حيث جودة الطلاب.
هناك أيضا في مصر صعوبات تتعلق بإمكانية الوصول إلى البيانات ومدى جودتها. تعتبر قطاعات الحكومة أن هذه البيانات حساسة للغاية، أو يمكن أن يكون للوزارات المختلفة أرقام مختلفة. وفي القطاع الخاص، تتعامل الشركات مع البيانات باعتبارها ثروتها السرية وتحرص على كتمانها. لذا يجب أن تعمل داخل الشركة للوصول إلى تلك البيانات أو أن توقع اتفاقية عدم إفصاح. وهذه التحديات ليست مقصورة على علوم البيانات بل لمتخذي القرارات بشكل عام. فيمكن أن تكون وزيرا يريد بيانات من وزارة أخرى وستجد صعوبة في الحصول عليها.
هناك تداعيات أخلاقية لهذا العمل، إذ يمكن أن تؤدي نفس البيانات إلى نتائج مختلفة، مما قد يؤدي إلى اتخاذ قرارات مختلفة تماما. وهذا الأمر مهم تحديدا عندما يكون متخذ القرار ليس على دراية بالأرقام ولا يمكنه التحقق من نتائج عالم البيانات. وفي معظم الأوقات، تحدث نتائج مختلفة لأن الأساليب التي يتبعها عالم البيانات تقوم على افتراضات مختلفة، فإن محلل البيانات الذي لديه دراية سيفهم الافتراضات الكامنة وراء مثل هذا الأسلوب ويتأكد أولا من التحقق من صحة الافتراضات قبل المضي قدما في تلك الوسيلة، ناهيك عن تفسير النتائج. كما يستخدم بعض الأشخاص البيانات لمحاولة تضليل الآخرين، لذلك نعلم الطلاب كيفية اكتشاف مثل هذه التحيزات.
هل مصر تمر بمرحلة تحتاج فيها إلى شيء مماثل للوائح العامة لحماية البيانات في الاتحاد الأوروبي؟ في الحقيقة مثل هذه الأشياء لا تضر عادة ما لم تتم بصورة مبالغ فيها. فعلى سبيل المثال، إذا كان هناك مستثمرون يفكرون في الاستثمار بمصر، ولكن البيانات التي يحتاجون إليها لاتخاذ مثل هذا القرار غير متوفرة، فإن هذا يمكن أن يكون بمثابة عائق. ومن ناحية أخرى، إذا قرر هؤلاء المستثمرون أنفسهم الاستثمار بمصر، فيجب عليك حماية خصوصيتهم. التشريعات هي كأي أداة، يمكن استخدامها على نحو صحيح ويمكن أيضا إساءة استخدامها، ويمكن المبالغة أو التقصير فيها.