يفان تشانغ يكشف عن المواصفات التقنية الكاملة لـ DeepSeek V4: 1.6T معلمات، 384 خبيرًا مع 6 تفعيلات

بوابة الأخبار: رسالة بتاريخ 22 أبريل — كشف طالب الدكتوراه في برينستون ييفان تشانغ عن المواصفات التقنية الكاملة لـ DeepSeek V4 على X، وذلك بعد عرضٍ مسبق في 19 أبريل. يتضمن V4 1.6 تريليون إجمالي المعلمات ونُسخة خفيفة الوزن، V4-Lite، بإجمالي 285 مليار معلمة.

يعتمد النموذج آلية انتباه DSA2، والتي تجمع بين انتباه DeepSeek Sparse (DeepSeek Sparse Attention) السابق من V3.2 وNSA (Native Sparse Attention) مع تضمينات رؤوس ذات بُعد 512، مقترنة بـ Sparse Multi-Query Attention (MQA) وSliding Window Attention (SWA). طبقة MoE (Mixture of Experts) تحتوي على 384 خبيرًا مع تفعيل 6 لكل تمريرة أمامية، باستخدام Fused MoE Mega-Kernel. تستخدم الاتصالات المتبقية بنية Hyper-Connections.

تفاصيل التدريب التي تم الكشف عنها لأول مرة تتضمن استخدام مُحسّن Muon (applying Newton-Schulz orthogonalization to momentum updates) لتحديثات الزخم، ونافذة سياق قبل التدريب بحجم 32K رمزًا، وGRPO (Group Relative Policy Optimization) مع تصحيح تباعد KL أثناء التعلم التعزيزي. تمتد نافذة السياق النهائية إلى مليون رمز. النموذج نصي فقط.

لا يعمل يانغ لصالح DeepSeek، ولم تعلّق الشركة رسميًا على المعلومات التي تم الكشف عنها.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

تطلق OpenAI نموذجًا لمرشح خصوصية مفتوح المصدر لكشف معلومات التعريف الشخصية وإخفائها

ملخص: مرشح الخصوصية من OpenAI هو نموذج مفتوح المصدر وقابل للتنفيذ محليًا يكتشف معلومات التعريف الشخصية ويقوم بإخفائها في النص. يدعم سياقات كبيرة، ويحدد العديد من فئات معلومات التعريف الشخصية، وهو مخصص لسير عمل يراعي الخصوصية مثل إعداد البيانات، والفهرسة، والتسجيل، والمراجعة. مرشح الخصوصية من OpenAI هو نموذج مفتوح المصدر يعمل محليًا (سياق 128k-token) يكتشف معلومات التعريف الشخصية ويقوم بإخفائها في النص، ويغطي بيانات الاتصال والبيانات المالية وبيانات الاعتماد الخاصة بسير عمل الخصوصية.

GateNewsمنذ 28 د

OpenAI تخطط لنشر 30GW من القدرة الحاسوبية بحلول 2030

تسعى OpenAI إلى توفير 30GW من القدرة الحاسوبية بحلول عام 2030 لتلبية الطلب المتزايد على الذكاء الاصطناعي، مع اكتمال 8GW من هدف 10GW لعام 2025. وتشير عملية التوسع إلى استراتيجية تهدف إلى توسيع البنية التحتية لتطوير ونشر الذكاء الاصطناعي من الجيل التالي. تعتزم OpenAI الوصول إلى 30GW من قدرة الحوسبة بحلول عام 2030 لاستيعاب الطلب المتزايد على الذكاء الاصطناعي، بعد أن تكون قد أنجزت بالفعل 8GW من هدف 10GW لعام 2025. وتعكس هذه الخطوة توسعًا استراتيجيًا للبنية التحتية لدعم تطوير ونشر الذكاء الاصطناعي من الجيل التالي.

GateNewsمنذ 28 د

360 AI 漏洞发现代理发现近 1,000 项零日漏洞,与 Mythos 展开竞争

360 Digital Security 的 AI 驱动代理声称已发现约 1,000 项新漏洞,包括 Office 和 OpenClaw 中的漏洞;AI 现在是发现与利用链准备的核心,直逼 Mythos。 摘要:据彭博社援引的一份报告称,360 Digital Security Group 的 AI 驱动漏洞发现代理在近几个月识别出将近 1,000 项此前未知的漏洞,其中包括 Microsoft Office 和 OpenClaw 框架。该公司表示,AI 已成为漏洞发现的核心引擎,并已宣布一款用于加速构建利用链的 AI 工具。Benincasa 认为,基于 Natto Thoughts 对该公司中文公告的审阅,360 是 Anthropic 的 Mythos 的竞争对手。

GateNewsمنذ 33 د

رئيس شركة أنثروبيك يزور البيت الأبيض لكسر الجمود: يلتقي مع رئيس الأركان ويبحث مع بيسنت حول Mythos

ذكرت صحيفة وول ستريت جورنال أن الرئيس التنفيذي لشركة أنثروبي أمودي التقى في 4/17 مع البيت الأبيض، مع التركيز على الحدود الأمنية لـ Mythos والنشر المسؤول؛ وقال البيت الأبيض إن الاجتماع كان بنّاءً، واعتبره السوق علامة على ذوبان العلاقات المتوترة. يتمثل جوهر الخلاف في أن الجيش يريد من كلود أن تكون الاستخدامات لأغراضه القانونية كافة، بينما تصر شركة أنثروبي على أن تقديرها لسياسات الاستخدام المقبول لدى الشركة. وأعرب الطرفان عن أنهما سيواصلان الحوار، وقبل إطلاق Mythos في مايو ستتم مناقشة الأمر مرة أخرى.

ChainNewsAbmediaمنذ 2 س

Google Ironwood TPU: أداء 10 أضعاف + أربع شركاء لمواجهة Nvidia

وفقًا لتقرير Bloomberg المتعمّق والإعلان الرسمي من Google، قامت Google في 22 أبريل بالتوسّع رسميًا في مجموعة رقائق الذكاء الاصطناعي المصممة داخليًا: توفير Ironwood المخصص للاستدلال (الجيل السابع من TPU) على نطاق واسع عبر Google Cloud، مع إطلاق في الوقت نفسه تعاونات التصميم للجيل التالي مع شركاء هم Broadcom وMediaTek وMarvell وIntel. ويهدف ذلك إلى مواجهة الهيمنة التي تتمتع بها Nvidia في سوق الحوسبة الخاصة بالذكاء الاصطناعي من خلال سلسلة توريد شرائح مخصصة. Ironwood: الجيل السابع من TPU، أول رقاقة مُصممة خصيصًا للاستدلال Ironwood هي منتج الجيل السابع من سلسلة Google TPU، وهي أيضًا أول رقاقة مخصصة للاستدلال ضمن استراتيجية “فصل التدريب والاستدلال”. المواصفات التي كشفت عنها Google: الأداء اللحظي الأعلى للرقاقة هو T

ChainNewsAbmediaمنذ 2 س

تتفاوض شركة DeepSeek بشأن جولة تمويل خارجية أولى وتقييم يبلغ 20 مليار دولار: الصين تحقق أعلى مستوى جديد لتقييمات الذكاء الاصطناعي

وفقًا لتقرير بلومبرغ بتاريخ 22 أبريل، نقلاً عن The Information حصريًا، تجري شركة DeepSeek الناشئة المتخصصة في مجال الذكاء الاصطناعي في الصين محادثات بشأن جولة تمويل خارجية أولى، مع تقييم يصل إلى 20 مليار دولار. وهذه أول مرة تقوم فيها DeepSeek بجمع تمويل خارجي منذ تأسيسها في عام 2023؛ إذ كان يتم تمويلها بالكامل سابقًا من خلال التمويل الداخلي لصندوق التحوط الكمي High-Flyer Capital Management. كما يُعد تقييم 20 مليار دولار أيضًا علامة فارقة لأول مرة تدخل فيها شركة ناشئة صينية في مجال الذكاء الاصطناعي إلى «المرحلة الثانية» من نطاق تقييمات «مئة مليار دولار» (100 مليار دولار). حجم التمويل واستخدامات الأموال تسعى DeepSeek إلى الحصول على تمويل أولي لا يقل عن 300 مليون دولار؛ وقد تضاعف تقييم 20 مليار دولار مقارنةً بتقييم «أكثر من 10 مليارات دولار» الذي تم الكشف عنه أول مرة في 17 أبريل بواسطة The Information

ChainNewsAbmediaمنذ 2 س
تعليق
0/400
لا توجد تعليقات