كشفت شركة جوجل النقاب عن منتجها الجديد جيميني (Gemini)، وهو أكبر نموذجٍ لغويٍّ قائمٍ على الذكاء الاصطناعيّ أنتجته الشركة حتى الآن، وقد حقق أداءً غير مسبوقٍ وفق المعايير الأكاديمية. ويَعِدُ Gemini بتحقيق قفزةٍ ثوريةٍ في الإمكانيّات من حيث تحسينات مجموعةٍ من منتجات Google بدءاً من بوت الدردشة بارد (Bard) وصولاً إلى هواتف بيكسل (Pixel).
ووصَف ساندر بيتشاي (Sundar Pichai) -الرئيس التنفيذيّ للشركة الأم لجوجل Alphabet (أو الشركة GOOG)– جيميني (Gemini) بأنه “أحد أكبر الجهود العلمية والهندسية التي أنجزتها الشركة”، في حين أشاد Demis Hassabis -رئيس قسم الذكاء الاصطناعي في Google- بقدرة النموذج الجديد على “إفادة البشرية بطرقٍ مدهشة”.
جيميني (Gemini) يتوفر على ثلاثة إصداراتٍ تلائم القدرات المتنوّعة للأجهزة
تم إطلاق Gemini بإصداراتٍ ثلاثةٍ جاءت تحت مسميّات Ultra وPro وNano. ويُعتبَر Gemini Ultra الإصدار الأكثر تعقيداً وقدرةً على التعامل مع المهامّ المتقدمة للغاية.
من ناحيةٍ أخرى، يركز إصدار Gemini Nano على الكفاءة الحاسوبية لتجنّب التأخير الزمني في الهواتف الذكية والأجهزة الإضافيّة. في حين يحقق Gemini Pro توازناً بين كفاءة تعدّد الاستخدامات مع متطلبات عتاديّةٍ متواضعةٍ خلال عمليات الاستدلال.
ويمكّن هذا النهج متعدّد الجوانب المستخدمين من تكييف Gemini بسهولةٍ مع التطبيقات الجديدة المختلفة دون الحاجة لإعادة تدريب نماذجَ منفصلةٍ في كلِّ مرة. كما يمكن أن تساعد المواءمة بين المزايا التي تعتمد على الإنترنت والمزايا المخزّنة على الجهاز أيضاً في تبسيط تطوير المنتَج باستخدام نموذج موحَّد قائمٍ على الذكاء الاصطناعي.
جيميني (Gemini) يحقق إنجازاتٍ غيرَ مسبوقةٍ في مختلف الاختبارات
من خلال تقييم الإصدار Gemini 1.0 على نطاقٍ واسع بناءً على 32 معياراً أكاديمياً رئيسياً، سجّل قسم الأبحاث Google Research نتائجَ متقدمةً في 30 منها، ما يُعتبر إنجازاً يكشف عن نقاط قوةٍ كبيرة ومتعدّدة التخصّصات يتمتع بها نموذج جيميني.
وشملت الاختبارات فئاتٍ متنوّعةً من المعايير مثل استيعاب اللغة، والتفكير الرياضي، والتمييز البصري، والاستنتاج المنطقي، وجوانب أخرى من الذكاء. وأظهر التفوّقُ في الأداء على ما تمَ تسجيله من قيمٍ سابقةٍ تلك القدرات الهائلة التي يتمتع بها نموذج جيميني (Gemini) في التعامل مع معظم المهام المُوكلة إليه.
ولعلَّ أحد الإنجازات الجديرة بالملاحظة بشكلٍ خاص هو تغلُّب Gemini Ultra على مشكلة MMLU، والتي تعني القدرة على تحقيق فهمٍ هائلٍ للغةٍ متعدّدة المهام، الأمر الذي كان يشكل عقبةً كبرى أمام جميع أنظمة الذكاء الاصطناعي حتى الآن، وتم التحقق من ذلك عبرَ اختبار المعرفة في مواضيعَ متعدّدة من قبل خبراء بشريين. وبذلك، حقق نموذج Ultra درجةً متميّزةً بلغت 59.4% في اختبارات MMLU حول 57 موضوعاً متنوّعاً، ما يشير إلى قدرته على الاقتراب من مستوى الفهم الشامل الذي أصبَح مشابهاً للذكاء البشريّ متعدّد الأوجه.
وقال بيتشاي في بيانٍ صحفيٍّ رسميٍّ نشرته شركة جوجل بخصوص الإطلاق: “بعد ما يقرب من ثماني سنواتٍ من رحلتنا كشركةٍ تضع في أولويتها موضوع الذكاء الاصطناعي، يمكننا القول إن وتيرة التقدم في هذا المجال بدأت تتسارع: فالملايين باتوا يستخدمون الآن الذكاء الاصطناعي التوليديّ عبر منتجاتنا للقيام بأشياء لم تكن متاحةً لهم حتى قبل عامٍ من الآن”.
أنظار جوجل تتجه نحو تحقيق التوازن بين القوة والسلامة
تُفيد معايير الاختبار عن طريق النصوص البحتة في تسليط الضوء جزئياً فقط على قدرات نموذج جيميني، في حين أن تحقيق الإنجازات التقنية المتعدّدة يتمثّل في دعم الصور ومقاطع الفيديو والكلام والتعليمات البرمجية وأنواع البيانات الأخرى.
فبدلاً من الطريقة السابقة في تجميع مجموعاتٍ غير مترابطةٍ من الأدوات معاً، يحقق جيميني الاستيعاب من خلال نموذج متماسكٍ يتيح التفاعل السلس بين العناصر المرئية والكلمات والأصوات عند معالجة المُدخلات المتنوّعة للعالم الحقيقي.
وشدّد بيتشاي على مدى فعالية التعامل مع المدخلات المتنوّعة في فتح المجال لوظائفَ جديدة -وهو شرطٌ أساسيٌّ لواجهات الذكاء الاصطناعي المُساعِدة وذات الفوائد الشاملة التي يتصوّرها في المستقبل. ومن المتوقع أن تمتد فوائد قدرات نموذج جيميني على تقديم حلولٍ رقميةٍ لتشمل مجالات الطب والعلوم والتعليم والفنون الإبداعية.
وعلى الرغم من تفوّق نموذج جيميني المتوقّع على ما سبقه من نماذجَ في الكفاءة الأولية، يظل التطوير المسؤول لنموذج Gemini الأولويةَ القصوى لشركة جوجل، نظراً للمخاطر المرتبطة به. ولتحقيق هذه الغاية، قام المهندسون ببناء إطار تحقٌّقٍ نموذجيٍّ مُخصّصٍ لمعالجة اعتبارات السلامة الخاصّة بهذا المشروع بشكلٍ استباقيّ.
فعلى سبيل المثال، أصبحت مكافحة التهديدات الناجمة عن محتوى الوسائط المتعددة الآن -مثل الصور العنيفة أو الفيديوهات المؤذية- تشكل أولويةً بعد أن كان التركيز قليلاً عليها سابقاً. وأكّد بيتشاي أن بناء نماذجَ قويةٍ وآمنةٍ على حدٍّ سواء كان هدفاً وضعته الشركة نُصب عينيها خلال تطويرها للمنتج.
وقال بيتشاي حول ذلك: “نحن نتعامل مع هذا الأمر بجرأةٍ ومسؤولية. وهذا يعني أن نكون طموحين في أبحاثنا وفي متابعة تحقيق الإنجازات التي ستجلب فوائدَ هائلةً للناس والمجتمع، مع الأخذ بعين الاعتبار -في الوقت ذاته- معايير الأمان والعمل بشكلٍ تعاونيٍّ مع الحكومات والخبراء لمعالجة المخاطر المحتملة والناتجة عن تعاظم إمكانات الذكاء الاصطناعي.
سيتم دمج Gemini في جميع منتجات جوجل وهواتف بيكسل (Pixel) قريباً
تهدف شركة Google إلى نشر نموذج جيميني (Gemini) عبر نظامها التقنيّ خلال ما تبقى من العام الحاليّ وطوال عام 2024، ابتداءً من تطبيق الدردشة Bard الذي سيكون أولَ تطبيق يتم إطلاق النموذج عبرَه واختباره عليه.
ويتضمّن ذلك طرحاً كاملاً لخدمة الإعلانات والخدمات السحابية وبرامج الإنتاجية مثل المستندات النصيّة، وعروض المستهلك مثل خدمات الخرائط والترجمة Google Lens.
إضافةً لذلك، فإن Gemini سيكون قادراً على مساعدة المبرمجين أيضاً، حيث تم تدريبه على تحليل واقتراح التعليمات البرمجيّة لأهم لغات البرمجة، بما في ذلك بايثون (Python) وجافا (Java) وC++. وصدَرَت نسخةٌ جديدةٌ من أداة البرمجة المتخصّصة للشركة تحت اسم AlphaCode 2 اعتماداًعلى جيميني، وقد تمكّنت هذه الأداة من حلِّ 85% من الاختبارات التي خضعت لها، والتي لم تقتصر فقط على حل المشاكل البرمجية البسيطة نسبياً، وإنما أيضاً حلّ المعادلات المعقدة في الرياضيات وعلوم الحاسوب؛ في حين كانت النسخة الأولى من أداة AlphaCode قادرةً على حلِّ 50% فقط من تلك المعادلات نفسها.
يُشار إلى أنه تم طرح نسخة Gemini Pro في 7 كانون الأول/ديسمبر الجاري، والتي ستعمل على تحسين تجربة المستخدم الشاملة لتطبيق الدردشة Bard، كما ستكون متاحةً في أكثرَ من 170 دولة، وستبدأ النسخة عملها باللغة الإنجليزية فقط، مع توقعاتٍ بإطلاقها بلغاتٍ أخرى في المستقبل القريب.
علاوةً على ذلك، تخطط جوجل لإطلاق Gemini على هواتف Pixel الخاصّة بها، بدءاً من هاتف Pixel Pro 8، والذي سيستخدم نسخة Gemini Nano لدعم ميزاتٍ مختلفةٍ، مثل إنشاء الخُلاصات والردود المباشرة على الرسائل.
وأشار بيتشاي في معرِض حديثه عن إطلاق هذه المنتجات بقوله: “هذه هيَ النماذج الأولى من عصر جيميني(Gemini) ، وأول مثالٍ يجسّد تحقيق ما حلمنا به عندما قمنا بتأسيس Google DeepMind في وقتٍ سابقٍ من هذا العام”. واختتم حديثه بالقول: “يمثل هذا العصر الجديد من النماذج اللغوية القائمة على الذكاء الاصطناعي أحدَ أكبر الجهود العلمية والهندسية التي أخذناها على عاتقنا في الشركة. أنا متحمّسٌ حقاً لما هو قادمٌ، وللآفاق التي سيفتحها نموذج جيميني أمام الناس في كلِّ مكان”.