يُعد مجال علم البيانات تخصصًا ومن أكثر المجالات نموًا، وقد بدأت بعض الجامعات العريقة بالولايات المتحدة مثل هارفارد ومعهد ماساتشوستس للتكنولوجيا، في تدريس ماجستير في علم البيانات.
يُراد من علم البيانات، تطوير العلوم والأعمال عبر استخدام تقنيات للمعلومات. الإنسان هو المحرك الرئيسي لهذا العلم، وهو عنصر أساسي في تصميم الخوارزميات وإدارة تقنية المعلومات. وتخصص علم البيانات هو مزيج الإداري والفني، ويُعد علماء البيانات هم الممارسون في هذا المجال، ولا يشترط مشاركتهم في كافة العمليات. فمثلا، ميليسا آنجل، عالمة البيانات السابقة في تويتر، لديها دكتوراه في الفلسفة وماجستير في علم البيانات، وقد عملت في تصميم خوارزمية لمراقبة المحتوى للتأكد من التوافق مع قواعد المنصة ومكافحة المعلومات المضللة.
الذكاء الاصطناعي جزء من علم البيانات. وبعد الضجة التي أحدثها تطبيق ChatGPT، سيزداد الإنفاق العالمي على الأنظمة التي تركز على الذكاء الاصطناعي ليصل إلى 154 مليار دولار، وفقًا لمؤسسة البيانات الدولية (IDC). وفي نهاية مايو الماضي، قال البروفيسور جيريمي سيغل: “إن هوس الذكاء الاصطناعي، ليس فقاعة بعد. لقد بدأ عصر الذكاء الاصطناعي للتو”، حسبما أوردت “Fortune”.
هناك مبادئ أساسية في علم البيانات وهي أساس في تصميم الخوارزميات، منها، الروابط الخفية: ويقصد بها القرائن، وهي الدلالات التي ترتبط بجذور النص، أو العلامات التي يمكن استنتاجها من الجوانب المختلفة، والتي تساعد في فهم النص لتعميق المضمون، والبرهان على توافقها أو أوجه الشبه بينها والتأثيرات المتبادلة.
يُسيء البعض استخدام قانون الانتقال في عملية الاستنتاج. قانون الانتقال هو قانون في الرياضيات للمتغيرات الرقمية، إذا كان أ=ب، ب=ج، إذن أ=ج. أما في المنطق، يعبر عنه بالعلاقة العابرة، تصلح للبعض دون الآخر.
مثال آخر: ارتفع سهم PDD Holding من بداية عام 2023 وحتى 16 مارس بنسبة 11.8%، ثم بدأ ينزل الى ان انخفض بنسبة 36.5% في 25 مايو. وكان تقييم MarketWatch للسهم ضمن أعلى سبعة أسهم في مؤشر Nasdaq 100. وكانت التوصية بعد نزول السهم في النصف الثاني من مارس وحتى منتصف مايو، هو الشراء، لقوة الأداء المالي للشركة، وأن السهم يستحق قيمة أعلى.
خلال شهر أبريل، انخفض السهم بنحو 9%، في حين ارتفع مؤشر Nasdaq 100 بنسبة 0.5%، والعديد من الشركات التكنولوجيا ارتفعت أسهمها، وظلت شركة PDD ضمن أفضل سبع الشركات. فلماذا انخفض السهم! اتباع قانون الانتقال قد يسبب خسائر كارثية، فالمنطق هنا ليس رقمي. شركة PDD هي شركة تجزئة صينية عبر الإنترنت، والشركات الصينية المدرجة في الولايات المتحدة قد خسرت مئة مليار دولار خلال شهر أبريل بسبب العقوبات والقيود الغربية. فالمسألة لها جذور عميقة لا تتعلق فقط بقوة الشركة.
الارتباط بالسياق: غالبًا ما ينظر إلى العلاقات المنطقية على أنها متمسكة بين المفاهيم عبر وجود سياق معين وليس بالقواعد النحوية.
فمثلًا، اذا استخدمنا قانون الانتقال وقلنا، إن عبدالله يحب عبيدالله، وعبيدالله يحب زوجته، إذن عبدالله يحب زوجة عبيدالله.
لا نستطيع القول إن معنى الحب في العبارة الأولى يختلف عن الثانية من الناحية اللغوية. ولو قلنا إن عبدالله هو أب لعبيدالله، فلا نستطيع التعميم أن كل أب يحب زوجة ابنه. وأيضا إذا اعتبرنا هذه حالة خاصة، فيتطلب تفريق معنى الحب عبر السياق، ككلمة “طالب”، فهل هي اسم، أم طالب علم، أم مشتقة من الفعل، ماضيا كان أو أمرا. والتفريق يتم عبر وجود كلمات تميز المعنى المطلوب.
وهذا هو المنطق المتبع في النماذج اللغوية Large Language Models (LLMs). فقد قامت شركة جوجل بوضع النموذج اللغوي الخاص بها في 2013 لفهم الاستفسارات عبر تحليل ملايين الوثائق، ثم قامت بتمثيلها رقميا. قد يكون لكلمة واحدة أكثر من رقم، والكلمات المرتبطة بالسياق لها تسلسل متقارب.
السلوكيات الشاذة، وهذا الموضوع شبيه بكيفية التعامل مع القيم المتطرفة في الأبحاث العلمية، حيث يتطلب بيان تأثيرها على النتيجة، وهي خاصية للتوقع المستخدمة في الذكاء الاصطناعي.
فمثلا: فشلت استراتيجية مناعة المجتمع، نظرية مناعة القطيع، التي تبنتها بعض الدول في المرحلة الاولى من جائحة كورونا. فقد أفاد العلماء انه مع ترك انتشار الفيروس، سوف تحدث مناعة لدى الغالبية لنقل 95% من السكان، مقابل حدوث مضاعفات قد تكون كبيرة لدى 5% الآخرين. ولكن الواقع كان مغايرا، نسبة المتضررين كان أكبر من المتوقع، وكما ان وزن الضرر كان أكبر من نسبته.
هذا التعامل يستخدم في مكافحة الهجمات العدائية على النماذج اللغوية في تطبيقات الذكاء الاصطناعي التوليدي، كالذي يطلب خطوات للتحايل على قانون معين. فكما قيل، أن النماذج اللغوية عرضة لتلفيق المعلومات، وإنتاج استجابات غريبة. وقال مسئول بشركة جوجل، ان لدى الشركة مجموعة من التدابير المعمول بها لاختبار النماذج والعثور على نقاط الضعف، وهي مستمرة بالعمل على تحسينها (wired.com).
الوضع الاعتيادي والمتغير: صرح إيلون ماسك في مقابلة بمنتصف مايو، ان القيادة الذاتية في تسلا تستخدم الذكاء الاصطناعي. نشرت واشنطن بوست تقريرا في 11 يونيو عن الحوادث المميتة للقيادة الذاتية لتلك السيارات التي وقعت في الولايات المتحدة، حيث تظهر البيانات أن عدد هذه الحوادث قد ارتفع على مدى السنوات الأربع الماضية. فمن ضمنها، الحافلة المدرسية كانت تعرض علامة التوقف الخاصة بها وأضواء تحذير حمراء وامضة، وكانت سيارة تسلا من طراز Y تسير بسرعة 45 ميل بالساعة، لم تخفف سرعتها، واصطدمت بولد عمره 17 عاما.
عند التحليل، يظهر ضعف في تمييز بين الحالة الاعتيادية للباص وبين اضاءة علامة حمراء، وهذا قد يعود لعدم وجود مسبقا صورا للحالات الاعتيادية، او لوجود خلل في تصميم الخوارزمية، او لقصور في الحصول على صور متعددة في لحظة معينة ومعالجتها، او الخلل في معدات وخدمات طرف ثالث.
تقدير الخطأ: في الأسبوع الحاسم من الدوري الإنجليزي الممتاز بنهاية ابريل 2023، كانت دقة الكمبيوتر العملاق المزود بالذكاء الاصطناعي التابع لمؤسسة “اوبتا”، ثلاث من أصل سبع مباريات، أي بنسبة 42.8%.
هناك عوامل يمكن التحكم بها، بينما العديد منها تخضع لظروف متغيرة. وفقا لنتائج غارتنر نشرتها في مارس 2023، فإنه بحلول عام 2025، ستستخدم 70% من المنظمات تقنيات تمكين خط البيانات بما في ذلك تحليلات الرسوم البيانية وتعليم الآلة والذكاء الاصطناعي والبلوكشين كمكونات حاسمة لنمذجتها الدلالية. ويتطلب منها مراعاة هذا الجانب وتقدير نسبة الخطأ لأخذه بعين الاعتبار.
يتضح مما سبق أهمية علم البيانات في تطوير مختلف الوظائف في ادارة الاعمال. ولذلك، هناك طلب كبير على أدوار مثل علماء البيانات ومتخصصي الأمن السيبراني ومهندسي الذكاء الاصطناعي. وحسب تقرير “FastCompany” في 25 يوليو، أنه ببساطة لا يوجد عدد كاف من الأشخاص ذوي المهارات اللازمة لملء هذه الأدوار، مما يوسع فجوة المهارات.
** دكتوراه في التخطيط الاستراتيجي المالي