مقابلة مع مؤسس DeepMind: بنية الذكاء الاصطناعي العام، حالة الوكيل، والاختراق العلمي في العقد القادم

عنوان الفيديو الأصلي: ديميس هاسابيس: الوكلاء، الذكاء الاصطناعي العام والاختراق العلمي الكبير القادم

مصدر الفيديو الأصلي: Y Combinator
ترجمة النص: Deep潮 TechFlow

مقدمة التحرير

الرئيس التنفيذي لشركة DeepMind، الحائز على جائزة نوبل في الكيمياء ديميس هاسابيس يزور Y Combinator، ويتحدث عن التقدمات الرئيسية التي لا تزال ضرورية للوصول إلى الذكاء الاصطناعي العام، ويقدم نصائح لرواد الأعمال حول كيفية الحفاظ على التقدم، وأين قد يظهر الاختراق العلمي الكبير القادم.

أكثر حكم عملي لرواد الأعمال في التكنولوجيا العميقة هو أنه إذا أطلقت مشروعًا تكنولوجيًا عميقًا يمتد لعشر سنوات، فيجب أن تضع في خطتك ظهور الذكاء الاصطناعي العام. بالإضافة إلى ذلك، كشف عن أن شركة Isomorphic Labs (التي انفصلت عن DeepMind، وهي شركة أدوية تعتمد على الذكاء الاصطناعي) ستصدر أخبارًا مهمة قريبًا.

مقتطفات مهمة

مسار و جدول زمني للذكاء الاصطناعي العام

· «هذه المكونات التقنية الحالية ستصبح بالتأكيد جزءًا من الهيكل النهائي للذكاء الاصطناعي العام.»

· «مشاكل التعلم المستمر، والاستنتاج على المدى الطويل، والذاكرة لم تُحل بعد، والذكاء الاصطناعي العام يحتاج إلى حلها جميعًا.»

· «إذا كان جدولك الزمني للذكاء الاصطناعي العام حول عام 2030، وبدأت مشروعًا تكنولوجيًا عميقًا اليوم، فعليك أن تضع في اعتبارك أن الذكاء الاصطناعي العام قد يظهر في منتصف الطريق.»

الذاكرة ونوافذ السياق

· «نافذة السياق تعادل تقريبًا الذاكرة العاملة. متوسط ذاكرة العمل البشرية حوالي سبع وحدات رقمية، بينما لدينا نوافذ سياق بملايين أو حتى عشرات الملايين من الرموز. لكن المشكلة أننا نضع كل شيء فيها، بما في ذلك المعلومات غير المهمة والخاطئة، وهذا الأسلوب حالياً هو أسلوب خشن جدًا.»

· «إذا أردنا معالجة تدفقات الفيديو الحية وتخزين جميع الرموز، فإن مليون رمز يكفي تقريبًا لمدة 20 دقيقة فقط.»

عيوب الاستنتاج

· «أحب أن ألعب الشطرنج باستخدام Gemini. أحيانًا يدرك أن خطوته سيئة، لكنه لا يجد خيارًا أفضل، فيدور حول نفسه ويختار تلك الخطوة السيئة. لكن نظام استنتاج دقيق لا ينبغي أن يحدث معه هذا.»

· «هو من ناحية يستطيع حل أسئلة بمستوى ميداليات أولمبياد الرياضيات الدولية، ومن ناحية أخرى، عند طرح الأسئلة بطريقة مختلفة، يرتكب أخطاء رياضيات ابتدائية. يبدو أن هناك شيئًا مفقودًا في عملية التفكير الداخلي لديه.»

الوكيل والإبداع

· «لتحقيق الذكاء الاصطناعي العام، يجب أن يكون لديك نظام قادر على حل المشكلات بشكل نشط نيابة عنك. الوكيل هو الطريق، وأعتقد أننا بدأنا للتو.»

· «لم أرَ بعد أحدًا يستخدم برمجة vibe لإنشاء لعبة AAA تتصدر قوائم التطبيقات. مع الجهد المبذول حالياً، هذا ممكن، لكنه لم يحدث بعد. هذا يدل على أن هناك شيئًا مفقودًا في الأدوات أو العمليات.»

التقطير والنماذج الصغيرة

· «افترض أن نموذج Pro متقدم يُطلق بعد نصف سنة إلى سنة، قدراته يمكن ضغطها إلى نموذج صغير جدًا يمكن تشغيله على الأجهزة الطرفية. حتى الآن، لم نصل إلى الحد الأقصى من كثافة المعلومات نظريًا.»

اكتشافات علمية و«اختبار أينشتاين»

· «أحيانًا أسميه «اختبار أينشتاين»، أي هل يمكن تدريب نظام باستخدام معرفة عام 1901، ثم يشتق بشكل مستقل النتائج التي توصل إليها أينشتاين عام 1905، بما في ذلك النظرية النسبية الخاصة. إذا تمكنت من ذلك، فهذه الأنظمة ليست بعيدة عن اختراع أشياء جديدة حقًا.»

· «حل مشكلة من جوائز الألفية الكبرى أمر رائع، لكن الأصعب هو أن تتمكن من طرح مجموعة جديدة من أسئلة جوائز الألفية، ويعتبرها كبار الرياضيين عميقة وتستحق البحث مدى الحياة.»

نصائح لرواد الأعمال في التكنولوجيا العميقة

· «السعي وراء المشكلات الصعبة والسهلية في الواقع متشابهان، فقط بأساليب صعوبة مختلفة. الحياة قصيرة، فمن الأفضل أن تركز طاقتك على الأمور التي لن ينجزها أحد غيرك إذا لم تفعلها.»

مسار تحقيق الذكاء الاصطناعي العام

Gary Tan: أنت تفكر في الذكاء الاصطناعي العام منذ وقت أطول من معظم الناس. بالنظر إلى النموذج الحالي، كم تعتقد أن لدينا من الهيكل النهائي للذكاء الاصطناعي العام؟ وما الذي ينقصنا جوهريًا الآن؟

Demis Hassabis: أنا متأكد أن التدريب المسبق على نطاق واسع، RLHF، وسلسلة التفكير، ستصبح جزءًا من الهيكل النهائي للذكاء الاصطناعي العام. هذه التقنيات أثبتت جدواها حتى الآن. لا أستطيع تصور أن نكتشف بعد عامين أنها طريق مسدود، فهذا غير منطقي بالنسبة لي. لكن، على ما يبدو، ما زال هناك واحد أو اثنين من الأمور التي يتعين حلها، مثل التعلم المستمر، والاستنتاج على المدى الطويل، وبعض جوانب الذاكرة، لم تُحَل بعد.

الذكاء الاصطناعي العام يحتاج إلى حل كامل. ربما يمكن للتقنيات الحالية مع بعض الابتكارات التدريجية أن تصل إلى ذلك، لكن قد يتبقى واحد أو اثنان من المفاتيح الكبرى التي يجب كسرها. أعتقد أن الاحتمال كبير أن هناك مفاتيح غير محسومة، بنسبة حوالي 50-50. لذلك، في DeepMind، نحن نعمل على كلا المسارين.

Gary Tan: أتعامل مع العديد من أنظمة الوكيل، وأدهشني أن الوزن الأساسي يتكرر في الأساس. لذا فإن مفهوم التعلم المستمر مثير جدًا، لأننا نستخدم حاليًا طرقًا مؤقتة، مثل دورات الأحلام الليلية.

Demis Hassabis: نعم، تلك الدورات الأحلامية مثيرة جدًا. لقد فكرنا في هذا الأمر سابقًا عند دمج الذاكرة السياقية. دكتورتي كانت تدرس كيف يدمج الحُصين المعرفة الجديدة بشكل أنيق مع المعرفة الموجودة. الدماغ يفعل ذلك بشكل ممتاز.

يتم ذلك خلال النوم، خاصة أثناء النوم السريع (REM sleep)، حيث يعيد تشغيل التجارب المهمة للتعلم منها. برنامجنا المبكر على Atari، DQN (شبكة Q العميقة التي نشرتها DeepMind في 2013، والتي حققت مستوى بشري في ألعاب Atari باستخدام التعلم المعزز العميق)، تعلم السيطرة على ألعاب Atari عبر تقنية إعادة التشغيل التجريبي (experience replay).

هذه التقنية مستوحاة من علم الأعصاب، حيث يعيد الدماغ تكرار المسارات الناجحة. كانت تلك في 2013، زمن قديم في مجال الذكاء الاصطناعي، لكنها كانت حاسمة جدًا في ذلك الوقت.

أتفق معك، نحن نستخدم الآن طرقًا مؤقتة. نضع كل شيء في نافذة السياق. هذا الأسلوب غير مثالي. حتى لو كنا نعمل على آلة وليس دماغًا بشريًا، من الناحية النظرية يمكن أن نصل إلى نوافذ سياق بملايين أو عشرات الملايين من الرموز، ويمكن أن تكون الذاكرة مثالية، لكن تكلفة البحث والاسترجاع لا تزال قائمة. في اللحظة التي نحتاج فيها لاتخاذ قرار محدد، من الصعب العثور على المعلومات ذات الصلة حقًا، حتى لو استطعنا تخزين كل شيء. لذلك، أرى أن مجال الذاكرة لا يزال مليئًا بالفرص للابتكار.

Gary Tan: بصراحة، نافذة سياق بمليون رمز أكبر مما توقعت، ويمكن أن يؤدي العديد من المهام.

Demis Hassabis: نعم، بالنسبة لمعظم الحالات التي ينبغي أن يستخدم فيها، فهي كافية. لكن فكر في الأمر، نافذة السياق تعادل تقريبًا الذاكرة العاملة. الإنسان لديه حوالي سبع وحدات رقمية في ذاكرته العاملة، ونحن نمتلك نوافذ سياق بملايين أو حتى عشرات الملايين من الرموز. المشكلة أننا نضع كل شيء فيها، بما في ذلك المعلومات غير المهمة والخاطئة، وهذا أسلوب خشن جدًا. وإذا أردت معالجة تدفق فيديو حي، فببساطة، وضع كل الرموز في النافذة، بمليون رمز، يكفي حوالي 20 دقيقة فقط. لكن إذا أردت أن يفهم النظام حياتك على مدى شهر أو شهرين، فهذا بعيد جدًا عن الكفاية.

Gary Tan: DeepMind دائمًا يركز على التعلم المعزز والبحث، هل هذا النهج متأصل في بناء Gemini الآن؟ هل لا زلتم تبالغون في تقدير أهمية التعلم المعزز؟

Demis Hassabis: ربما، نعم. الاهتمام به يتغير ويعود. منذ تأسيس DeepMind، ونحن نعمل على أنظمة الوكيل. كل أعمالنا على AlphaGo و Atari كانت في جوهرها أنظمة تعلم معزز، قادرة على اتخاذ القرارات، وتحديد الأهداف، وتخطيط المسارات بشكل مستقل. بالطبع، اخترنا الألعاب كمجال للتحكم، لأنها معقدة بما يكفي، وبدأنا تدريجيًا في تطوير ألعاب أكثر تعقيدًا، مثل AlphaStar بعد AlphaGo، وحققنا نجاحات في معظم الألعاب.

السؤال التالي هو، هل يمكن تعميم هذه النماذج لتصبح نماذج عالمية أو نماذج لغوية، وليس فقط نماذج للألعاب؟ لقد كنا نعمل على ذلك خلال السنوات الماضية. اليوم، نماذجنا الرائدة تعتمد على أنماط تفكير وسلاسل استنتاجات تشبه إلى حد كبير ما بدأ به AlphaGo.

أعتقد أن الكثير من العمل الذي قمنا به منذ ذلك الحين ذو صلة كبيرة اليوم، ونحن نعيد تقييم تلك الأفكار القديمة، ونستخدم مقاييس أكبر، وأساليب أكثر عمومية، بما في ذلك البحث باستخدام أشجار مونت كارلو (Monte Carlo tree search) وطرق التعلم المعزز المختلفة. أفكار AlphaGo وAlphaZero مرتبطة جدًا بالنماذج الأساسية الحالية، وأعتقد أن جزءًا كبيرًا من التقدم في السنوات القادمة سيأتي من هذا.

التقطير والنماذج الصغيرة

Gary Tan: الآن، لكي نكون أذكى، نحتاج إلى نماذج أكبر، لكن تقنيات التقطير تتقدم أيضًا، والنماذج الصغيرة يمكن أن تصبح سريعة جدًا. نماذج Flash الخاصة بكم قوية جدًا، وتصل إلى حوالي 95% من أداء النماذج الرائدة، ولكن بتكلفة أقل بعشر مرات. هل هذا صحيح؟

Demis Hassabis: أعتقد أن هذا أحد ميزاتنا الأساسية. عليك أن تبني أكبر نموذج ممكن للحصول على قدرات رائدة. أحد أكبر ميزاتنا هو أننا نستطيع بسرعة تقليل تلك القدرات إلى نماذج أصغر وأسرع. تقنية التقطير التي ابتكرناها هي من اختراعنا، ونحن لا نزال في الطليعة عالميًا. ولدينا دافع قوي للقيام بذلك، فنحن أكبر منصة تطبيقات ذكاء اصطناعي في العالم.

نحن نمتلك نظرة عامة على الذكاء الاصطناعي ونماذج الذكاء الاصطناعي، بالإضافة إلى Gemini، وكل منتجات Google الحالية، بما في ذلك الخرائط وYouTube، تدمج Gemini أو تقنيات ذات صلة. هذا يشمل مئات الملايين من المستخدمين، ومنتجات بمليارات المستخدمين. يجب أن تكون سريعة جدًا، وفعالة، ومنخفضة التكلفة، وذات زمن استجابة منخفض. هذا يمنحنا دافعًا كبيرًا لتحسين نماذة Flash وFlash-Lite بشكل فعال، وأتمنى أن يخدم ذلك المستخدمين في مختلف مهامهم.

Gary Tan: أنا فضولي حول مدى ذكاء هذه النماذج الصغيرة. هل التقطير له حدود؟ هل يمكن لنماذج بحجم 50 مليار أو 400 مليار أن تكون بنفس ذكاء النماذج الرائدة اليوم؟

Demis Hassabis: لا أعتقد أننا وصلنا بعد إلى الحد النظري للمعلومات، على الأقل لا أحد يعلم إن كنا قد وصلنا إليه. ربما في يوم من الأيام نواجه سقفًا من كثافة المعلومات، لكن فرضيتنا الحالية أن بعد إصدار نموذج Pro متقدم، يمكن ضغط قدراته إلى نموذج صغير جدًا يمكن تشغيله على الأجهزة الطرفية خلال ستة أشهر إلى سنة.

يمكنكم أن تروا ذلك أيضًا في نموذج Gemma، حيث أداء نموذج Gemma 4 قوي جدًا بالنسبة لنفس الحجم. هذا يعتمد على تقنيات التقطير وتحسين كفاءة النماذج الصغيرة. لذلك، لم أجد حدودًا نظرية واضحة، وأعتقد أن المسافة إلى ذلك الحد لا تزال بعيدة جدًا.

Gary Tan: هناك ظاهرة غريبة الآن، وهي أن المهندسين يمكنهم إنجاز عمل يعادل 500 إلى 1000 ضعف ما كانوا يفعلونه قبل ستة أشهر. بعض الأشخاص هنا يقومون بعمل يعادل ألف مرة عمل مهندس Google في التسعينيات. ستيف ييجي قال ذلك.

Demis Hassabis: أشعر بالحماس. النماذج الصغيرة لها العديد من الاستخدامات. أحدها هو انخفاض التكلفة وسرعة الأداء، مما يتيح التكرار بشكل أسرع، خاصة عند التعاون مع أنظمة أخرى. أنظمة سريعة، حتى لو لم تكن في قمة الأداء، مثل أن تكون 90% أو 95% من الأفضل، فهي كافية تمامًا، والتكرار السريع يحقق أرباحًا تفوق تلك العشرة بالمئة المفقودة.

جانب آخر مهم هو تشغيل هذه النماذج على الأجهزة الطرفية، ليس فقط من أجل الكفاءة، ولكن أيضًا من أجل الخصوصية والأمان. فكر في الأجهزة التي تتعامل مع معلومات شخصية جدًا، والروبوتات، فبالنسبة للروبوتات المنزلية، تود أن يكون لديك نموذج فعال وقوي يعمل محليًا، ويُعهد إليه بالمهمة فقط في الحالات الخاصة، مع عدم الاعتماد على السحابة إلا عند الضرورة. معالجة الصوت والفيديو محليًا، والبيانات تبقى على الجهاز، وأتخيل أن هذا سيكون الحالة المثالية.

الذاكرة والاستنتاج

Gary Tan: نعود إلى السياق والذاكرة. النماذج حاليًا غير ذات حالة، وإذا أُضيفت القدرة على التعلم المستمر، كيف ستكون تجربة المطورين؟ كيف ستوجه مثل هذه النماذج؟

Demis Hassabis: سؤال مهم جدًا. نقص التعلم المستمر هو أحد العقبات الرئيسية التي تمنع الوكيل من إكمال المهام بشكل كامل. الوكيل الحالي مفيد جدًا في أجزاء معينة من المهمة، ويمكنك تجميعها معًا لعمل أشياء رائعة، لكنه غير قادر على التكيف بشكل جيد مع البيئة المحددة التي أنت فيها. هذا هو السبب في أنه لا يمكنه أن «يطلق النار ولا يراقب»، فهو بحاجة إلى أن يتعلم من بيئتك الخاصة. لحل مشكلة الذكاء العام الحقيقي، يجب أن يُعالج هذا الأمر.

Gary Tan: أين وصلنا في مجال الاستنتاج؟ نماذج التفكير الحالية قوية، لكن لا تزال ترتكب أخطاءً لا يرتكبها طلاب المرحلة الابتدائية. ما الذي يحتاج إلى تحسين؟ وما المتوقع من التقدم في الاستنتاج؟

Demis Hassabis: هناك الكثير من الابتكار في نمط التفكير. ما نفعله لا يزال بدائيًا جدًا، وأساليبنا قاسية جدًا. يمكن تحسينه بعدة طرق، مثل مراقبة سلسلة التفكير أثناء التنفيذ، والتدخل أثناء عملية التفكير. أحيانًا أعتقد أن أنظمتنا، أو أنظمة المنافسين، تتفكر بشكل مفرط، وتدخل في حلقات لا تنتهي.

أحب أن أستخدم لعبة الشطرنج مع Gemini كمثال. جميع النماذج الأساسية الرائدة ضعيفة جدًا في الشطرنج، وهذا مثير للاهتمام.

مراقبة مسارات التفكير مهمة جدًا، لأنها تسمح لنا برؤية ما إذا كانت النماذج تتجه في الاتجاه الصحيح، وإذا كانت تتعثر، يمكن التدخل. نرى أحيانًا أنها تفكر في خطوة، وتدرك أنها خطوة سيئة، لكنها لا تجد خيارًا أفضل، فتدور حول نفسها وتختار تلك الخطوة السيئة. نظام استنتاج دقيق لا ينبغي أن يحدث معه هذا.

هذا الفارق الكبير لا يزال قائمًا، لكن إصلاحه قد يتطلب تعديلًا أو اثنين فقط. لهذا السبب نرى أحيانًا «ذكاء مسنن» (jagged intelligence)، حيث يمكن للنموذج أن يحل مسائل بمستوى ميداليات أولمبياد الرياضيات، لكنه عند طرح الأسئلة بطريقة مختلفة، يرتكب أخطاء رياضيات ابتدائية. يبدو أن هناك شيئًا مفقودًا في عملية التفكير الداخلي لديه.

القدرات الحقيقية للوكيل

Gary Tan: الوكيل هو موضوع كبير. البعض يراه مجرد دعاية. أنا أعتقد أنه بدأ للتو. ما هو تقييمكم الحقيقي لقدرات الوكيل، مقارنةً بالإعلانات الخارجية؟

Demis Hassabis: أتفق معك، نحن في البداية فقط. لتحقيق الذكاء الاصطناعي العام، يجب أن يكون لديك نظام قادر على حل المشكلات بشكل نشط نيابة عنك. هذا دائمًا كان واضحًا بالنسبة لنا. الوكيل هو الطريق، وأعتقد أننا بدأنا للتو.

الجميع يحاول تحسين تكامل الوكيل في سير العمل، ونحن أجرينا الكثير من التجارب الشخصية، والكثير من الناس هنا ربما أيضًا. كيف نجعل الوكيل يندمج في سير العمل، ويقوم بأشياء أساسية وليس فقط تحسينات إضافية، بل أشياء ذات جوهر؟ نحن لا زلنا في مرحلة التجريب، وربما فقط خلال الشهرين أو الثلاثة الماضية بدأنا نكتشف سيناريوهات ذات قيمة حقيقية. التقنية الآن وصلت إلى مرحلة لا تعتبر مجرد عرض تجريبي، بل تضيف قيمة حقيقية لوقتك وكفاءتك.

أرى كثيرين يطلقون عشرات الوكلاء ويشغلونهم لساعات طويلة، لكني لست متأكدًا من أن الناتج يبرر هذا الجهد.

لم نرَ بعد لعبة AAA تتصدر قوائم التطبيقات باستخدام برمجة vibe. أنا كتبت نماذج صغيرة، والكثير من الموجودين هنا قاموا ببعض النماذج الممتازة. أستطيع الآن أن أصنع نموذجًا مبدئيًا للعبة Theme Park خلال نصف ساعة، بينما استغرقت مني ستة أشهر عندما كنت في السابعة عشرة.

أشعر أنه إذا قضيت صيفًا كاملًا في العمل على ذلك، يمكنك أن تصنع شيئًا مذهلاً حقًا. لكن ذلك يتطلب الحرفية، وروح الإنسان، والذوق، ويجب أن تضمن إدخال هذه العناصر في أي منتج تبنيه. في الواقع، لم يصنع طفل حتى الآن لعبة ناجحة بيعت بملايين النسخ، ومع الأدوات الحالية، من المفترض أن يكون ذلك ممكنًا. إذن، هناك شيء مفقود، ربما يتعلق بالعملية، أو بالأدوات. أتوقع أن نرى مثل هذه الإنجازات خلال 6 إلى 12 شهرًا القادمة.

Gary Tan: إلى أي مدى سيكون ذلك تلقائيًا بالكامل؟ أعتقد أنه لن يكون تلقائيًا بالكامل من البداية. المسار الأكثر احتمالية هو أن يحقق الأشخاص هنا كفاءة 1000 ضعف، ثم يظهر من يستخدم هذه الأدوات لصنع تطبيقات وألعاب ناجحة، ثم يتم أتمتة المزيد من العمليات بعد ذلك.

Demis Hassabis: بالضبط، هذا هو ما يجب أن تراه أولاً.

Gary Tan: هناك أيضًا جزء من الحقيقة، وهو أن بعض الأشخاص فعلوا ذلك بالفعل، لكنهم لا يرغبون في الكشف عن مدى مساهمة الوكيل.

Demis Hassabis: ربما، لكن أود أن أتناول موضوع الإبداع. أستخدم دائمًا مثال AlphaGo، خاصة الجولة الثانية، الخطوة 37. بالنسبة لي، كنت أنتظر ظهور تلك اللحظة، وعندما حدثت، بدأت مشاريع علمية مثل AlphaFold. بدأنا بعد عودتنا من سول مباشرة في العمل على AlphaFold، وكان ذلك قبل عشر سنوات. زرت كوريا للاحتفال بمرور عشر سنوات على AlphaGo.

لكن مجرد الخروج من Move 37 ليس كافيًا. هو رائع ومفيد، لكنه لا يتيح للأنظمة اختراع لعبة Go نفسها. إذا أعطيت النظام وصفًا عالي المستوى، مثل «لعبة تتعلم قواعدها خلال خمس دقائق، لكن من المستحيل إتقانها خلال حياة كاملة، وتتمتع بجمال فني، ويمكن أن تنتهي خلال ظهيرة واحدة»، ثم يعود النظام بنتيجة تقول إنها لعبة Go، فهذه مشكلة. لماذا؟

Gary Tan: ربما يكون هناك شخص بين الحضور يمكنه فعل ذلك.

Demis Hassabis: إذا تمكن أحدهم من ذلك، فالإجابة ليست أن النظام يفتقر إلى شيء، بل ربما أن طريقة استخدامنا له خاطئة. ربما هذا هو الحل الصحيح. ربما أنظمة اليوم لديها القدرة، فقط بحاجة إلى مبدع عبقري يقودها، ويعطيها روح المشروع، ويكون متكاملًا معها بشكل كبير. إذا قضيت لياليك وأيامك في العمل على هذه الأدوات، وكنت تملك إبداعًا عميقًا، فربما تستطيع أن تصنع أشياء لا تُصدق.

المصادر المفتوحة والنماذج متعددة الوسائط

Gary Tan: لنتحدث عن المصادر المفتوحة. مؤخرًا، إصدار Gemma سمح بتشغيل نماذج قوية على الأجهزة المحلية. ما رأيك؟ هل ستتحول الذكاء الاصطناعي إلى شيء يملكه المستخدمون أنفسهم، بدلاً من أن يظل في السحابة؟ هل سيغير ذلك من من يمكنه بناء منتجات باستخدام هذه النماذج؟

Demis Hassabis: نحن من الداعمين بقوة للمصادر المفتوحة والعلوم المفتوحة. لقد أطلقنا AlphaFold مجانًا بالكامل. أبحاثنا العلمية لا تزال تُنشر في مجلات مرموقة. فيما يخص Gemma، نريد أن نخلق نماذج رائدة على مستوى العالم بنفس الحجم. حاليًا، تم تنزيل Gemma حوالي 40 مليون مرة، فقط بعد أسبوعين ونصف من إطلاقه.

أعتقد أن وجود تكنولوجيا مفتوحة المصدر في الغرب مهم جدًا. النماذج المفتوحة الصينية ممتازة، وتتصدر المجال حاليًا، لكننا نعتقد أن Gemma تنافس بقوة على نفس الحجم.

لدينا مشكلة موارد، لا أحد يملك طاقة حسابية فائضة لصنع نموذجين متقدمين كاملين. لذلك، قرارنا الحالي هو أن نماذج الأجهزة الطرفية تُستخدم في Android، والنظارات، والروبوتات، ويُفضل أن تكون نماذج مفتوحة، لأنه بمجرد نشرها على الأجهزة، فهي مكشوفة، والأفضل أن تكون مفتوحة تمامًا. لقد وحدنا استراتيجية الانفتاح على مستوى النانومتر، وهذا منطقي استراتيجيًا.

Gary Tan: قبل أن أقدم لك عرضًا، أظهرت لي نظام تشغيل AI الذي أنشأته، ويمكنني التفاعل معه صوتيًا مباشرة، وأعطيك مثالاً، على الرغم من أنني متوتر قليلاً، إلا أن الأمر نجح. Gemini من البداية كان متعدد الوسائط. لقد جربت العديد من النماذج، والتفاعل الصوتي المباشر مع النماذج، مع قدرات استدعاء الأدوات، وفهم السياق، لا يوجد حاليًا نموذج يقارن بـ Gemini.

Demis Hassabis: صحيح. أحد المزايا غير المعروفة بعد في سلسلة Gemini هو أننا من البداية بنيناها بشكل متعدد الوسائط. هذا جعل البداية أصعب من الاعتماد فقط على النص، لكننا نؤمن أن المدى الطويل سيعود بالنفع، وقد بدأنا بالفعل في تحقيق ذلك.

على سبيل المثال، في مجال النماذج العالمية، بنينا على Gemini نموذج Genie (نموذج بيئة تفاعلية توليدي من DeepMind). وفي مجال الروبوتات، ستعتمد Gemini Robotics على نماذج متعددة الوسائط، وميزتنا في هذا المجال ستصبح حاجزًا تنافسيًا. نحن نستخدم Gemini بشكل متزايد في Waymo (شركة القيادة الذاتية التابعة لألفابت).

تخيل أن يكون لديك مساعد رقمي يتبعك في العالم الحقيقي، ربما على هاتفك أو نظاراتك، ويفهم البيئة المادية من حولك. أنظمتنا قوية جدًا في هذا المجال. سنواصل الاستثمار في هذا الاتجاه، وأعتقد أن ميزتنا في هذا المجال كبيرة جدًا.

Gary Tan: مع انخفاض تكلفة الاستدلال بسرعة، ماذا أصبح ممكنًا الآن؟ هل ستتغير استراتيجيات تحسينكم؟

Demis Hassabis: لست متأكدًا أن الاستدلال سيكون مجانيًا تمامًا، هناك مفارقة جيفنز (Jevons’ Paradox) — أي أن زيادة الكفاءة تؤدي إلى زيادة الاستهلاك الإجمالي. أعتقد أن الجميع في النهاية سيستخدم كل القدرة الحاسوبية المتاحة.

يمكن تصور مجموعات من ملايين الوكلاء يتعاونون، أو فريق من الوكلاء يفكرون في اتجاهات متعددة ويقومون بالتكامل. نحن نختبر هذه الاتجاهات، وكل ذلك سيستهلك موارد الاستدلال المتاحة.

بالنسبة للطاقة، إذا حللنا بعض المشكلات مثل الاندماج النووي، أو الموصلية الفائقة في درجة الغرفة، أو البطاريات المثلى، أعتقد أنه من خلال علوم المواد، يمكننا أن نصل إلى تكاليف طاقة قريبة من الصفر. لكن، لا تزال هناك قيود في التصنيع الفيزيائي للرقائق، على الأقل في العقود القادمة. لذلك، لا تزال هناك حدود على استهلاك الاستدلال، ويجب أن نستخدم الموارد بكفاءة عالية.

الاختراق العلمي القادم

Gary Tan: من الجيد أن النماذج الصغيرة أصبحت أكثر ذكاءً. هناك العديد من رواد الأعمال في مجالات الأحياء والتكنولوجيا الحيوية هنا. لقد تجاوز AlphaFold البروتينات، وامتد إلى جزيئات حيوية أوسع. كم تبعدنا عن نمذجة نظام خلية كامل؟ هل هو مشكلة من مستوى مختلف تمامًا من الصعوبة؟

Demis Hassabis: تقدم Isomorphic Labs ممتاز جدًا. AlphaFold هو مجرد جزء من عملية اكتشاف الأدوية، ونحن نعمل على أبحاث كيميائية حيوية مجاورة، وتصميم مركبات ذات خصائص صحيحة، وسنصدر أخبارًا مهمة قريبًا.

هدفنا النهائي هو إنشاء خلية افتراضية كاملة، يمكن أن تتعرض لاضطرابات، ومحاكاة خلية ذات وظيفة كاملة، وتكون مخرجاتها قريبة جدًا من النتائج التجريبية، وتكون ذات فائدة عملية. يمكنك تخطي العديد من خطوات البحث، وتوليد بيانات تركيبية كثيرة لتدريب نماذج أخرى تتنبأ بسلوك الخلايا الحقيقية.

أقدر أن الوصول إلى خلية افتراضية كاملة قد يستغرق حوالي عشر سنوات. نحن نعمل على ذلك من خلال الجانب العلمي في DeepMind، بدءًا من نواة الخلية، لأنها أكثر أنظمة ذاتية الاكتمال. المشكلة الأساسية هي: هل يمكننا تحديد مقطع معقد بشكل مناسب، يكون ذاتي المحتوى، ويمكننا تقريب مدخلاته ومخرجاته بشكل معقول، ثم نركز على هذا النظام الفرعي؟ نواة الخلية من هذا المنظور مناسبة جدًا.

مشكلة أخرى هي نقص البيانات. تحدثت مع علماء يستخدمون المجهر الإلكتروني وتقنيات التصوير الأخرى. إذا تمكننا من تصوير خلايا حية دون قتلها، فسيكون ذلك ثورة. لأنه يمكن تحويل ذلك إلى مشكلة بصرية، ونحن نعرف كيف نحل المشكلات البصرية.

لكن، حسب علمي، لا توجد تقنية حاليًا تتيح تصوير خلايا حية بدقة نانوية دون تدميرها. يمكننا الآن التقاط صور ثابتة عالية الدقة جدًا، وهو أمر مثير جدًا، لكنه غير كافٍ لتحويله إلى مشكلة بصرية مباشرة.

لذا، هناك مساران: أحدهما يعتمد على الأجهزة والبيانات، والآخر على بناء محاكيات قابلة للتعلم بشكل أفضل لمحاكاة هذه الأنظمة الديناميكية.

Gary Tan: أنت لا تقتصر على البيولوجيا فقط. في علوم المواد، اكتشاف الأدوية، نمذجة المناخ، والرياضيات، إذا كان لا بد من ترتيب، فما هو المجال الذي سيشهد أكبر ثورة خلال الخمس سنوات القادمة؟

Demis Hassabis: كل مجال يثير الحماس، ولهذا السبب كانت دائمًا شغفي الأكبر، ولهذا السبب أعمل في الذكاء الاصطناعي منذ أكثر من 30 عامًا. لطالما اعتقدت أن الذكاء الاصطناعي هو الأداة النهائية للعلم، لدفع فهمنا العلمي، والاكتشافات العلمية، والطب، ومعرفتنا بالكون.

بدأنا بمهمة من خطوتين. أولاً، حل الذكاء، أي بناء الذكاء الاصطناعي العام؛ ثانيًا، استخدامه لحل جميع المشكلات الأخرى. ثم اضطررنا لتعديل التعبير، لأن البعض سأل: «هل تعني حقًا حل كل شيء؟»

نعم، نحن نعني ذلك. الآن، بدأ الناس يفهمون ما يعنيه ذلك. بالتحديد، أعني حل «المشكلات الجذرية» في العلوم، تلك التي إذا تم تجاوزها، ستفتح فروعًا جديدة من الاكتشافات. مثال على ذلك هو AlphaFold، وهو نموذج أولي لما نريد تحقيقه.

أكثر من ثلاثة ملايين باحث، تقريبًا كل الباحثين في علم الأحياء يستخدمون AlphaFold الآن. سمعت من بعض مديري شركات الأدوية أن كل دواء يُكتشف في المستقبل تقريبًا سيستخدم AlphaFold في مرحلة من مراحل اكتشافه. نحن فخورون بذلك، وهو التأثير الذي نأمل أن يحققه الذكاء الاصطناعي. لكن هذا مجرد البداية.

لا أستطيع أن أتصور أن هناك مجالًا علميًا أو هندسيًا لا يمكن للذكاء الاصطناعي أن يساعد فيه. تلك المجالات التي ذكرتها، أعتقد أنها لا تزال في «لحظة AlphaFold»، أي أنها تبدو واعدة جدًا، لكن لم يتم التغلب على التحدي الكبير فيها بعد. خلال العامين المقبلين، سنحقق تقدمًا كبيرًا في جميع هذه المجالات، من علوم المواد إلى الرياضيات.

Gary Tan: يبدو الأمر كأننا نمنح البشرية قدرة جديدة تمامًا، كأننا بروميثيوس.

Demis Hassabis: بالضبط. وكما يحمل قصة بروميثيوس عبرة، يجب أن نكون حذرين جدًا بشأن كيفية استخدام هذه القدرات، وأين نضعها، ومخاطر إساءة استخدامها بنفس الأدوات.

خبرات النجاح

Gary Tan: هناك الكثير من الأشخاص هنا يحاولون تأسيس شركات تستخدم الذكاء الاصطناعي في العلم. برأيك، ما هو الفرق بين الشركات الناشئة التي تدفع حدود العلم، وتلك التي تكتفي بتغليف النماذج الأساسية بواجهات برمجية وتدعي «الذكاء الاصطناعي للعلم»؟

Demis Hassabis: أفكر في لو أنني مكانكم، وأشاهد المشاريع في Y Combinator، كيف سأتصرف. أحد الأمور هو أن تتوقع مسار تطور الذكاء الاصطناعي، وهذا أمر صعب جدًا. لكن، أعتقد أن الجمع بين الذكاء الاصطناعي ومجال تكنولوجي عميق آخر يحمل فرصًا هائلة. هذا التقاطع، سواء كان في المواد، الطب، أو مجالات علمية صعبة أخرى، خاصة تلك التي تتعلق بالعالم الذري، لن يكون هناك طرق مختصرة في المستقبل القريب. هذه المجالات لن تتعرض للاندثار مع تحديثات النماذج الأساسية القادمة. لكن، إذا أردت أن تتجه نحو مسار مقاوم، فهذه نصيحتي.

أنا شخصيًا أفضّل التكنولوجيا العميقة. الأشياء الحقيقية المستدامة والقيمة ليست سهلة. دائمًا ما أجد نفسي منجذبًا للتكنولوجيا العميقة. عندما بدأنا في 2010، كان الذكاء الاصطناعي مجالًا عميقًا — قال لي المستثمرون «نحن نعلم أن هذا لن ينجح»، وكان المجتمع العلمي يعتقد أنه مجال فاشل من التسعينيات.

لكن، إذا كنت تؤمن بأفكارك — لماذا ستكون هذه المرة مختلفة، وما هو مزيج خبرتك الفريد — من الأفضل أن تكون خبيرًا في التعلم الآلي والتطبيقات، أو أن تكون قادرًا على تشكيل فريق مؤسس من خبراء، فهناك إمكانيات هائلة من التأثير والقيمة التي يمكن خلقها.

Gary Tan: هذه المعلومة مهمة جدًا. إنجاز شيء ما يبدو واضحًا بعد أن يتم، لكنه كان معارضة من الجميع قبل ذلك.

Demis Hassabis: بالطبع، لذلك عليك أن تفعل شيئًا أنت متحمس له حقًا. بالنسبة لي، سأظل دائمًا أعمل على الذكاء الاصطناعي، منذ أن كنت صغيرًا، لأنه الشيء الأكثر تأثيرًا الذي يمكنني التفكير فيه. وقد أثبتت التجربة ذلك، لكن ربما لم يكن الوقت مناسبًا، وربما كان مبكرًا بخمسين عامًا.

وأيضًا، هو الشيء الأكثر إثارة بالنسبة لي. حتى لو ظللنا في مرآب صغير، ولم نحقق بعد الذكاء الاصطناعي، سأواصل البحث عنه. ربما أعود للأكاديمية، لكني سأجد طريقة للاستمرار.

Gary Tan: AlphaFold هو مثال على أنك اتبعت اتجاهًا ونجحت في الرهان. ما الذي يجعل مجالًا علميًا مناسبًا لتحقيق اختراق مثل AlphaFold؟ هل هناك قواعد، مثل وظيفة هدف معينة؟

Demis Hassabis: أعتقد أنني بحاجة إلى كتابة ذلك بشكل منظم. من خلال خبرتي مع مشاريع مثل AlphaGo وAlphaFold، تعلمت أن أنجحها عندما تتوفر ثلاثة شروط:

أولًا، أن يكون للمشكلة مساحة بحث ضخمة جدًا، بحيث لا يمكن حلها إلا باستخدام طرق غير تقليدية، سواء كانت بحثًا عن طريق القوة الغاشمة أو خوارزميات خاصة. مساحة البحث في الشطرنج والبنى الثلاثية للبروتينات تتجاوز بكثير عدد الذرات في الكون. ثانيًا، أن يكون لديك وظيفة هدف واضحة، مثل تقليل الطاقة الحرة للبروتين، أو الفوز في الشطرنج، بحيث يمكن للنظام أن يستخدم التدرج الصاعد. ثالثًا، أن يكون لديك بيانات كافية، أو محاكٍ يمكنه توليد بيانات تركيبية كثيرة ضمن التوزيع.

إذا توافرت هذه الشروط، فحتى الطرق الحالية يمكن أن تصل بعيدًا، وتجد «الإبرة في كومة القش». اكتشاف الأدوية يتبع نفس المنطق: وجود مركب فعال لعلاج مرض معين بدون آثار جانبية، طالما أن قوانين الفيزياء تسمح بوجوده، المشكلة فقط كيف نبحث عنه بكفاءة. أعتقد أن AlphaFold أثبتت أن هذه الأنظمة قادرة على العثور على «الإبرة» في مساحة بحث هائلة.

Gary Tan: أريد أن أرتقي بمستوى النقاش. نحن نتحدث عن أن البشر يستخدمون هذه الطرق لخلق AlphaFold، لكن هناك مستوى أعلى، وهو أن البشر يستخدمون الذكاء الاصطناعي لاستكشاف فضاء الافتراضات المحتملة. كم نحن بعيدون عن أن تكون أنظمة الذكاء الاصطناعي قادرة على التفكير العلمي الحقيقي، وليس مجرد نمطية البيانات؟

Demis Hassabis: أعتقد أن ذلك قريب جدًا. نحن نعمل على أنظمة عامة من هذا النوع. لدينا نظام يسمى AI co-scientist، وخوارزمية مثل AlphaEvolve، التي تتجاوز ما يقدمه Gemini. جميع المختبرات الرائدة تستكشف هذا الاتجاه.

لكن، حتى الآن، لم أرى اكتشافًا علميًا حقيقيًا وذو أهمية كبيرة يتم بواسطة هذه الأنظمة. أعتقد أن ذلك سيحدث قريبًا، وربما يرتبط بالإبداع الحقيقي، وتجاوز الحدود المعروفة. عند ذلك، لن يكون الأمر مجرد مطابقة أنماط، لأنه لن يكون هناك أنماط للمطابقة. سيكون نوعًا من الاستنتاج بالمقارنة (analogical reasoning)، وأعتقد أن هذه الأنظمة لا تملكها بعد، أو أننا لم نستخدمها بشكل صحيح.

أحكم على العلم بمعيار واحد، وهو: هل يمكنها أن تطرح فرضية مثيرة للاهتمام حقًا، وليس فقط أن تتحقق من فرضية موجودة؟ فاختبار فرضية هو إنجاز عظيم، مثل إثبات فرضية ريمان أو حل أحد مسائل الألفية. لكن، ربما، نحن على بعد سنوات من تحقيق ذلك.

الأصعب هو أن تطرح مجموعة جديدة من مسائل الألفية، ويعتبرها كبار العلماء عميقة وتستحق البحث مدى الحياة. أعتقد أن هذا أصعب بكثير، ونحن لا نعرف كيف نصل إليه بعد. لكن، لا أعتقد أن الأمر س

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت