استخدام التعلم الآلي وعلم الشبكات للتنبؤ بالتصنيفات النهائية لكأس العالم
الغوص في عالم نجوم كرة القدم والأندية وكيف يبدو النظام البيئي لنجوم اللعبة

علم الشبكات هو دراسة الظواهر الفيزيائية والبيولوجية والاجتماعية والظواهر الأخرى من خلال إنشاء تمثيلات الشبكة.
يمكن أن تقدم هذه التمثيلات في بعض الأحيان رؤى قيمة للغاية، وتكشف النقاب عن أنماط مثيرة للاهتمام في البيانات والعلاقات بين الكيانات المتصلة.
ميلان جانوسوف، باتريك زيجيتي، اثنان من علماء البيانات العاملين في جامعة أوروبا الوسطى، واستخدموا مؤخرًا علوم الشبكات لفحص كأس العالم لكرة القدم 2022.
تمثيلات الشبكة التي أنشأوها، الموضحة في ورقة نُشرت على Research Gate ، سمحت لهم إلقاء بعض الضوء الجديد على العالم الرائع المترابط لنجوم كرة القدم والأندية.
قال جانوسوف” لست من كبار المعجبين بكرة القدم، لذا لم أتابع عن كثب بطولة FIFA الأخيرة أيضًا، ومع ذلك، من واقع خبرتي، تعتبر علوم الشبكات وتصورات الشبكة رائعة في تلخيص الأنظمة المعقدة وشرحها في صورة واحدة بطريقة سريعة وموضوعية، لذلك، بدأت أتساءل عن مقدار المعرفة الكروية التي يمكنني الحصول عليها من شبكة واحدة، من خلال الإجابة على الأسئلة مثل، من هم اللاعبون الرئيسيون، وكيف يبدو النظام البيئي الكامل لنجوم كرة القدم؟ ”

وأوضح” بالتالي فقد تواصلت مع صديقي عالم البيانات والمؤلف المشارك لهذه الورقة، باتريك زيجيتي، وهو أيضًا خبير كرة قدم متعلم ذاتيًا، لتبادل الأفكار حول كيفية بناء هذه الشبكة.”
الشبكة هي في الأساس كائن يتكون من عدة عقد وروابط تربط هذه العقد، يقوم علماء الشبكات مثل يانوسوف ببناء هذه الشبكات باستخدام البيانات التي تتعلق بظواهر معينة تشمل أطرافًا أو كيانات مختلفة مترابطة.
أوضح جانوسوف: “لبناء شبكة ، نحتاج إلى مصدر بيانات يُظهر العلاقات بين الكيانات التي ندرسها”، “في مثال كرة القدم، يمكن أن يكون هذا فريقًا تمامًا مثل اللاعبين الفرديين، لذلك، أول الأشياء أولاً – نحتاج إلى البيانات، هذا هو المكان الذي يتطلب معرفة الخبراء، مما قادنا إلى موقع Transfermarkt.com”.
جمعا جيانوسوف وزيجيتي، البيانات اللازمة لبناء شبكات كأس العالم لكرة القدم 2022 من موقع transfermarkt.com ، وهو موقع مرتبط بكرة القدم مملوك لشركة Axel Springer SE يحتوي هذا الموقع على قدر هائل من المعلومات حول لاعبي كرة القدم والأندية، بما في ذلك عضويات فريق اللاعبين وتاريخ الانتقالات، بالإضافة إلى نتائج البطولة الحالية والسابقة.
830 لاعبًا مرتبطون ببعضهم البعض
قال جيانوسوف: “هذا النوع من البيانات غني إلى حد كبير، لذا يمكن أن يكون بمثابة مدخلات مثالية لعلوم الشبكة- وليس من المستغرب أن يكون بناء شبكة عضوية الفريق من اللاعبين أمرًا بسيطًا للغاية”، “بشكل أساسي، إذا كان هناك لاعبان في نفس الفريق خلال نفس العام، فإننا نعتبرهما مرتبطين”.
احتوى تمثيل شبكة اللاعب الذي أنشأه الباحثون على 830 لاعبًا ، وُجد أنهم مرتبطون ببعضهم البعض من خلال ما يقرب من 6400 من العلاقات السابقة أو الحالية مع زملائهم في الفريق (أي أنهم كانوا يلعبون أو كانوا يلعبون حاليًا مع نفس الفريق).
كان متوسط طول المسار المزعوم هو 3، وهو ما يعني بشكل أساسي أنه إذا تم اختيار لاعبين بشكل عشوائي من بين جميع اللاعبين الذين يلعبون في كأس العالم، فمن المرجح أن يكون لكلاهما زملاء في الفريق لعبوا مع نفس النادي في مرحلة ما.

وأوضح جيانوسوف أن “بناء شبكة من أندية كرة القدم كان أكثر صعوبة”، “في هذه الحالة، أردنا تحديد أي الأندية هي مراكز الجاذبية الرئيسية بناءً على الاتجاهات النموذجية التي يقوم اللاعبون بتسجيل الدخول والخروج منها.”
لتمثيل أندية كرة القدم بشكل مرئي، استخرج جيانوسوف وزيجيتي تاريخ النادي للاعبين الفرديين ثم نظما الروابط في شبكتهما لاتباع المسار الاحترافي الفريد لكل لاعب (أي من الفرق وإلى أي فرق ينتقلون)، سمح لهم ذلك بالكشف عن بعض الأنماط الشيقة للغاية.
وقال جيانوسوف: “من أكثر الملاحظات إثارة التي جمعناها عند النظر إلى شبكة الأندية أنه، على ما يبدو ، هناك مجموعتان رئيسيتان من الأندية: المنفقون والموجهون”، “عادةً ما يكتسب الموجهون لاعبين في مرحلة مبكرة من حياتهم المهنية وبأموال أقل، ثم يبيعونهم لاحقًا مقابل دولارات كبيرة، ومن ناحية أخرى، يقوم المنفقون بعكس تدفق الأموال والمواهب، وبدلاً من تدريبهم ، فإنهم ببساطة إنفاق مبلغ هائل على توظيف النجوم “.

استخدام التعلم الآلي للتنبؤ ببعض التصنيفات
في النهاية، حاول جيانوسوف وزيجيتي أيضًا استخدام التعلم الآلي للتنبؤ ببعض التصنيفات النهائية لكأس العالم، لم تكن تنبؤات نموذجهم دقيقة بشكل خاص، حيث أسفرت عن دقة متواضعة تبلغ 60%، حددت تحليلاتهم بعض السمات الأكثر صلة عند محاولة التنبؤ بترتيب النادي، مثل القيمة السوقية الحالية للاعبين.
وقال جيانوسوف: “على الرغم من أننا لسنا وكلاء مراهنات بالتأكيد، فقد حاولنا شرح بعض أجزاء الترتيب النهائي لكأس العالم باستخدام نموذج بسيط للتعلم الآلي، مدعوم بخصائص الشبكة والقيمة السوقية للاعبين”، “لم يسفر هذا التحليل عن دقة عالية بشكل خاص، ومع ذلك كان من الرائع بالتأكيد أن نرى أن ميزات الشبكة تتمتع بقوة تنبؤية كبيرة مقارنة بالمعلومات المالية.”
هذه الدراسة الأخيرة هي مجرد أحدث سلسلة من أعمال جيانوسوف التي نظرت في ظواهر الثقافة الشعبية، بما في ذلك المسلسلات التلفزيونية والأفلام، من خلال عدسة علم الشبكة.
وأوضح جيانوسوف” تُظهر جهوده مدى أهمية هذا المجال البحثي الناشئ عند محاولة فهم الروابط التي تقوم عليها الظواهر الاجتماعية بشكل أفضل، في أعمالي التالية، أخطط لاستخدام علم الشبكات للتعمق أكثر في الاستدامة”.