رسالة Gate News، 17 أبريل — كشفت Google النقاب عن Gemini 3.1 Flash TTS، وهو نموذج متقدم لتحويل النص إلى كلام مع ميزات محسنة للتعبير العاطفي والتحكم، في 15 أبريل. سيتم طرح النموذج الجديد تدريجيًا عبر واجهات برمجة التطبيقات للمطورين، وVertex AI الخاص بالمؤسسات، وأدوات التعاون.

تشمل القدرات الأساسية للنموذج وسومًا صوتية تعتمد على اللغة الطبيعية لضبط السرعة والتنغيم والعاطفة بدقة، إلى جانب “Director Mode” لتحديد المشاهد وأدوار الشخصيات من أجل توليد مخرجات صوتية أكثر دقة. تُمكّن ميزة تعدد المتحدثين من توليد الحوار بشكل متزامن، ما يسمح بتدفقات محادثة أكثر طبيعية ومناسبـة للبودكاست والمحتوى الصوتي ومساعدي الذكاء الاصطناعي. يدعم النموذج أكثر من 70 لغة ولهجة، ما يعكس اللهجات والتعبيرات الإقليمية لتجارب صوتية مخصصة عالميًا.

أكدت Google على الأداء وكفاءة التكلفة، محققة نتائج مرتفعة على معايير تقييم البشر العمياء مع تقليل التكاليف الحاسوبية عبر بنية Flash—المصممة لاعتماد المؤسسات على نطاق واسع. يتضمن الصوت المُولَّد ترميزًا مائيًا SynthID لتحديد المحتوى المُولَّد بالذكاء الاصطناعي ومكافحة المعلومات المضللة.

تعكس هذه الخطوة اشتداد المنافسة في واجهات الصوت. تقوم OpenAI بدمج ميزات الصوت في الوقت الفعلي مع الذكاء الاصطناعي الحواري من أجل تفاعلات شبيهة بالبشر، بينما توسع Meta استثماراتها في شخصيات الذكاء الاصطناعي مع تجارب اجتماعية قائمة على الصوت. يلاحظ مراقبون في الصناعة أنه بينما قد يبقى مستوى عالٍ من التمثيل والعمل الإبداعي مدفوعًا بالبشر في الوقت الحالي، قد يشهد سوق الإنتاج المتكرر وعلى نطاق واسع تبنّيًا تدريجيًا للذكاء الاصطناعي في مجالات الدبلجة والإعلانات وسلاسل الكتب الصوتية.

عرض المصدر

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

فيترين؟ جاي تشو يربحون أكثر؟ شركة إدارة GD تجتمع سرًا مع العائلة المالكة في دبي لمناقشة الاكتتاب العام والذكاء الاصطناعي والروبوتات

الأسهم أخبار صناعة AI

شركة تكنولوجيا الترفيه في كوريا Galaxy Corporation دخلت مؤخرًا إلى سوق الشرق الأوسط، وأنشأت كيانًا قانونيًا في دبي باسم «Galaxy ME»، والتقت مع أفراد من العائلة المالكة في الإمارات العربية المتحدة لاستكشاف تكامل الذكاء الاصطناعي والمحتوى. وقد اختارت الشركة وسيطًا ماليًا لإجراء الطرح الأولي للاكتتاب (IPO)، وبلغت إيراداتها في العام الماضي 3000 مليار وون كوري، كما اجتذبت استثمارات من جاي تشو (周杰倫) وآداتا (威剛) وغيرها. تهدف هذه الخطة إلى دفع تطور نظام الترفيه في الشرق الأوسط، مع التأكيد على أهمية استراتيجيتها العالمية.

ChainNewsAbmediaمنذ 22 د

فريق صيني، EvoMap يثور على نسخة Hermes Agent المقلّدة المنتشرة فجأة: يوجد تشابه كبير بين أنظمة التطور الذاتي

وكيل AI أخبار صناعة AI

فريق صيني يدّعى EvoMap يوجّه اتهامات إلى وكيل Hermes التابع لشركة Nous Research بأنه قام بنسخ بنيته الخاصة Evolver/GEP، معتبرًا أن الاثنين يشتركان في درجة عالية من التشابه عبر عدة وحدات رئيسية. يشير EvoMap إلى أن تصميم Hermes لم يستشهد أو يقدّم شكرًا لمحتواه المنشور سابقًا، وقد أثار هذا الجدل اهتمامًا واسعًا من المجتمع؛ إذ أبدى بعض المستخدمين الصينيين على الإنترنت دعمًا لـ EvoMap، وانتقدوا سلوك النسخ المنسوب إلى Hermes. ورغم أن فريق أبحاث Nous لم يرد بعد على الاتهامات بندًا بندًا، فقد انتشر الحدث بسرعة في النقاشات الدائرة حول الذكاء الاصطناعي.

ChainNewsAbmediaمنذ 44 د

محبّذ لدى المستثمرين الأوائل في OpenAI! شركة ناشئة لواجهات الدماغ والكمبيوتر Sabi ستُسرّع التسليم بحلول نهاية العام «الكتابة بالthoughts» قبعة صوفية

أخبار صناعة AI

يعلن كل من شركة Sabi الناشئة من وادي السيليكون أنها تعمل على تطوير واجهة دماغ-حاسوب قابلة للارتداء دون الحاجة إلى تدخل جراحي اختراقي، حيث يمكن للمستخدمين إدخال النص على الشاشة بمجرد “التفكير”، مع توقع طرحها في أواخر عام 2026. سيحتوي هذا الجهاز على ما يصل إلى 100,000 من أجهزة الاستشعار الدقيقة، بما يساعد على تفسير نشاط الدماغ بدقة، كما تؤكد Sabi أيضًا حماية خصوصية البيانات.

ChainNewsAbmediaمنذ 52 د

كشف تسريب البيانات أن "كلود" قد لا يكون ذكيًا بشكل كافٍ، وأن ذلك ليس مجرد قصة شائعة في المدينة، فالنماذج الذكية غير مستقرة وتشكل مخاطر على الشركات

أخبار صناعة AI

يتناول المقال ظاهرة عدم استقرار أداء نماذج LLM (النماذج اللغوية الكبيرة) في تطبيقات الشركات للذكاء الاصطناعي، ويطلق عليها اسم «خفض القدرات»، ويقدم أمثلة توضح تأثيرها الفعلي على سير عمل الشركات. تُظهر البيانات أن أغلب النماذج السائدة تقع في حالة تراجع، ما يؤثر على إنتاجية الشركات واستقرارها، ويجب على الشركات البدء في إيلاء اهتمام لاستقرار النموذج بوصفه معيارًا جديدًا، وإلا فإنها ستواجه مخاطر على البنية التحتية.

ChainNewsAbmediaمنذ 1 س

تحدّث OpenAI Codex إلى وكيل ذكاء اصطناعي يتحكم في سطح المكتب، ويؤتمت سير عمل التطوير

وكيل AI أخبار صناعة AI

تتطور نسخة Codex المُطوّرة من OpenAI من مساعد برمجي إلى وكيل مستقل لبيئات سطح المكتب، قادر على إدارة التطبيقات، وأتمتة سير العمل، والتكامل مع أكثر من 100 تطبيق. يعزز هذا التحول استمرارية المهام وأتمتة سير العمل، ما يعكس مشهدًا تنافسيًا في أدوات ترميز الذكاء الاصطناعي.

GateNewsمنذ 1 س

Google تدمج البحث بالذكاء الاصطناعي في Chrome، مما يتيح التصفح عبر الويب بشكل حواري

أخبار صناعة AI

يعمل Google على تعزيز Chrome ببحث مدعوم بالذكاء الاصطناعي، مما يتيح التصفح التفاعلي والإجابات المستندة إلى السياق. كما تتضمن الوظيفة الجديدة تكاملًا عبر علامات تبويب متعددة، مما يحسن تجربة المستخدم لمختلف المهام من خلال توحيد علامات التبويب المفتوحة وتقديم معلومات مصممة خصيصًا.

GateNewsمنذ 1 س

تعليق

0/400

لا توجد تعليقات