أكبر تصنيف للبروتينات في التاريخ يكشف عن 700 ألف بنية جديدة

الذكاء الاصطناعي يكشف آلاف البروتينات الغامضة ويحصرها في مجموعات هيكلية

نظم العلماء للتو مجموعة ضخمة من أشكال البروتينات المتوقعة ضمن عائلات باستخدام الذكاء الاصطناعي وطريقة جديدة قوية للمقارنة.

اعتمادًا على نماذج AlphaFold لمخلوقات متنوعة عبر شجرة الحياة، اكتشفوا نحو 700 ألف مجموعة شكلية لم تكن معروفة سابقًا، بالإضافة إلى 13 مجموعة تبدو فريدة للبشر.

تُخزن هذه البنى في قاعدة بيانات AlphaFold Protein Structure Database، وهي كتالوج عام لبنى البروتينات المتوقعة بالذكاء الاصطناعي.

من خلال ترتيب هذه المكتبة الهيكلية الهائلة ضمن مجموعات مترابطة، يحصل الباحثون على رؤية أوضح لكيفية عمل البروتينات وتطورها عبر شجرة الحياة.

قاد العمل مارتن ستاينحر، أستاذ مساعد في كلية العلوم البيولوجية بجامعة سول الوطنية، ويتركز بحثه على بناء طرق فائقة السرعة لمقارنة مجموعات ضخمة من تسلسلات وبنى البروتينات باستخدام اختصارات حسابية مبتكرة.

قبل هذا المشروع، كانت معظم مقارنات أشكال البروتين تتم على دفعات صغيرة، حيث يدرس العلماء عائلة بروتينية واحدة أو مجموعة ضيقة في كل مرة.

خريطة ثلاثية الأبعاد لمجموعة من البروتينات تكشف الروابط بين البشر والميكروبات

تجميع كل النماذج المتاحة معًا يوفر رؤية بانورامية لعالم البروتين، ويكشف أنماطًا هيكلية تظهر فقط عند النظر إلى مجموعة البيانات بأكملها.

وقال ستاينجر: “لقد دخلنا عصرًا جديدًا في علم الأحياء الهيكلي، حيث تتيح الطرق الحسابية وصولًا غير مسبوق لاستكشاف الكون البروتيني”.

ويقدر هو وزملاؤه أنه باستخدام تقنيات أقدم، كان تصنيف نفس البيانات قد استغرق حوالي عقد كامل من الحوسبة المستمرة.

يستخدم AlphaFold الذكاء الاصطناعي وشبكات عصبية عميقة لتحويل تسلسلات الأحماض الأمينية إلى بنى بدقة تقترب من القياسات التجريبية.

مع قاعدة البيانات، يوفر هذا النهج الآن نماذج هيكلية لأكثر من 200 مليون بروتين، تغطي معظم التسلسلات الموثقة في علم الأحياء.

في هذه الدراسة، استخدم الفريق Foldseek Cluster، وهو خوارزمية لمحاذاة البنى تقوم بترميز أشكال البروتين في أبجدية مدمجة، لتنظيم نماذج AlphaFold بكفاءة.

تلتقط هذه العائلات تقريبًا كامل تنوع البنى البروتينية في قاعدة البيانات، موضحة مجموعة هائلة من النماذج في نحو 2.3 مليون مجموعة ممثلة.

الكثير من أصغر العائلات لم يكن لها تسميات وظيفية من الموارد الحالية، ما يجعلها مواقع محتملة لبنى وأنشطة لم تُعرف سابقًا.

نظرًا لأن الطريقة تعمل بزمن خطي تقريبًا بالنسبة لحجم قاعدة البيانات، فهي قابلة للتوسع بسهولة لمئات الملايين من الإدخالات دون توقف.

تصنيف شامل للبروتينات البشرية والميكروبية يكشف روابط تطورية غير متوقعة

المجموعات الغامضة والبروتينات الجديدة

ركز الفريق اهتمامًا خاصًا على المجموعات الغامضة، وهي بروتينات لا تتطابق مع أي بنية معروفة.

اختاروا من بينها عشرات الآلاف ذات التوقعات الدقيقة جدًا وفحصوها للبحث عن جيوب قد ترتبط بجزيئات صغيرة أو تحفز تفاعلات كيميائية.

بعض المجموعات الصغيرة بدت محدودة بنوع واحد فقط، ما يتوافق مع توقعات ولادة الجينات الجديدة من الحمض النووي غير المشفر.

أما بالنسبة للبشر، فقد لاحظ الفريق أن المجموعات التي تحتوي على بروتينات بشرية فقط نادرة، مما يشير إلى أن البنى الخاصة بالبشر نادرة الحدوث.

بدلاً من ذلك، تقع معظم بروتينات الإنسان ضمن مجموعات تمتد عبر شجرة الحياة، مؤكدة أن التطور يعيد استخدام أجزاء جزيئية قديمة في تركيبات جديدة.

للباحثين التجريبيين، تسلط المجموعات الغامضة الضوء على مواقع لم تُقاس بعد في المختبر، ما يجعلها أهدافًا جذابة للعمل المستقبلي.

أكبر تصنيف للبروتينات في التاريخ يكشف عن 700 ألف بنية جديدة

جذور الجهاز المناعي البشري

تربط بعض المجموعات اللافتة بروتينات الجهاز المناعي البشري بالبروتينات البكتيرية، مما يشير إلى حلول هيكلية مشتركة تعود لما قبل ظهور الحيوانات المعقدة.

أحد الأمثلة البارزة يركز على الغاسدرمينات، وهي عائلة بروتينية تشكل مسامًا في أغشية الخلايا خلال بعض الاستجابات المناعية، ما يؤدي إلى عملية تعرف بالـ “بيروبتوسيس”، حيث تنفجر الخلايا المصابة وتفرز إشارات التهابية.

تضع المقارنات الهيكلية في المجموعات الجديدة الغاسدرمينات البشرية بجانب نظيراتها البكتيرية، مما يظهر أن المجال الأساسي لتشكيل المسام مشترك بين فروع الحياة البعيدة جدًا.

شكل البروتين مشترك مع الميكروبات

مثال آخر هو بروتين BPI البشري، وهو بروتين مناعي فطري يرتبط بالسموم البكتيرية.

داخل المجموعات الهيكلية، يقع BPI بجانب بروتينات بكتيرية تشترك في هندستها العامة، ما يوحي بأن الميكروبات قد تعيد استخدام تصاميم مشابهة في بيولوجيا أغشيتها.

ترتبط مجموعات البروتين أيضًا ببروتينات استشعار الحمض النووي لدى البشر مثل AIM2 مع بروتينات في بكتيريا الأمعاء، مما يشير إلى أن أجزاء من جهاز المناعة لدينا قد تكون من سلالات ميكروبية قديمة.

نظرًا لانخفاض التشابه التسلسلي بين هؤلاء الأقارب البعيدين، فإن البنى المشتركة كانت لتصعب ملاحظتها بالبحث التسلسلي وحده.

ما يفتح هذا الأطلس الهيكلي

تعد هذه الروابط الهيكلية بعيدة المدى مهمة لأن شكل البروتين يتغير أبطأ من التسلسل، ما يجعل البنية تحافظ على العلاقات التطورية بعد أن تتلاشى التشابهات التسلسلية.

للباحثين الراغبين في وظيفة معينة، تعمل قاعدة بيانات AlphaFold Clusters الآن كأطلس، يتيح لهم العثور على جيران هيكليين وتوليد فرضيات جديدة حول البروتينات غير المعروفة.

بالنسبة لفرق اكتشاف الأدوية، تبدو المجموعات الغامضة التي تحتوي على جيوب محتملة للارتباط جذابة للغاية، لأنها قد تخفي إنزيمات أو مستقبلات لا تستهدفها أي أدوية حالية.

نُشرت الدراسة في مجلة Nature.

Exit mobile version