DeepSeek تطلق تحديثاً لنموذج V4 لتسريع الردود بنسبة 85%

أعلنت شركة DeepSeek الصينية الناشئة المتخصصة في الذكاء الاصطناعي عن تحديث كبير لنموذجها الرئيسي V4، يحتوي على تقنية جديدة تحمل اسم DSpark، قالت إنها تساهم في تسريع عملية توليد الردود بنسبة تصل إلى 85%.

يأتي هذا الإعلان في ظل المنافسة المتصاعدة بين شركات الذكاء الاصطناعي الصينية، إذ لم تعد المعركة تقتصر على تطوير نماذج أكثر قوة وقدرات أعلى، بل بدأت تتحول بشكل متزايد إلى سباق لخفض تكاليف التشغيل وتحسين سرعة الاستجابة للمستخدمين.

وأوضحت DeepSeek، في بيان، أن النظام الجديد يعتمد على ما وصفته بإطار عمل Speculative Decoding، أو "فك التشفير التنبؤي"، وهو أسلوب مصمم لمعالجة واحدة من أكبر المشكلات التي تواجه تشغيل النماذج اللغوية الكبيرة حالياً، وهي بطء إنتاج الإجابات عند التعامل مع الردود الطويلة.

وبحسب ورقة بحثية نشرتها الشركة، فإن النماذج الحالية تعتمد عادة على توليد المخرجات بشكل متسلسل، حيث يتم إنتاج كل توكن Token أو وحدة نصية على حدة.

هذا الأسلوب يؤدي إلى انخفاض معدل الاستفادة من وحدات معالجة الرسوميات GPU، كما يزيد من فترة الانتظار التي يشعر بها المستخدم أثناء انتظار اكتمال الإجابة.

ووصفت الشركة هذه المشكلة بأنها "عنق الزجاجة" في عملية تقديم خدمات الذكاء الاصطناعي للمستخدمين.

تعتمد آلية DSpark على استخدام نموذج صغير وخفيف الوزن يعرف باسم Draft Model، تكون مهمته اقتراح مجموعة من الردود أو الأجزاء المحتملة للإجابة بشكل سريع.

بعد ذلك يتولى نموذج أكبر وأكثر تطوراً مراجعة هذه المقترحات والتحقق منها على دفعات Batch Verification بدلاً من مراجعتها بشكل فردي ومتسلسل، وهو ما يساهم في تسريع عملية إنتاج المخرجات بشكل ملحوظ.

وأشارت الشركة إلى أن هذا النهج يسرّع ما يعرف بعملية AI Inference أو الاستدلال، وهي المرحلة التي يتم خلالها استخدام النموذج المدرب مسبقاً لتقديم إجابات فعلية على استفسارات المستخدمين.

ولم يتوقف التطوير عند هذا الحد، إذ أضافت DeepSeek تقنية أخرى ضمن DSpark تعرف باسم Semi-Autoregressive Generation، أو التوليد شبه التتابعي، والتي تسمح للنموذج بإنتاج مجموعات صغيرة من الرموز النصية دفعة واحدة، بدلاً من الالتزام بإنتاج رمز واحد فقط في كل خطوة كما يحدث في النماذج التقليدية.

وترى الشركة أن هذه الآلية توفر زيادة إضافية في سرعة توليد المحتوى دون التأثير بشكل كبير على جودة النتائج.

كما يتضمن النظام الجديد آلية جدولة ذكية تعتمد على مستوى الثقة في المخرجات Confidence-Based Scheduling، حيث يتولى النظام بشكل ديناميكي تعديل حجم عمليات التحقق والمراجعة المطلوبة وفقاً لمستوى الضغط على الموارد الحاسوبية ومتطلبات التشغيل في الوقت الفعلي.

ووفقاً لـ DeepSeek، تساعد هذه الآلية على تحقيق توازن أفضل بين سرعة الاستجابة وجودة النتائج، بحيث لا يتم استهلاك موارد حوسبية كبيرة في الحالات التي لا تستدعي ذلك، بينما يتم الحفاظ على مستوى الدقة المطلوب عند الحاجة.

ويرى أحد المبرمجين الذين اطلعوا على التقنية الجديدة أن مثل هذه الأساليب قد تؤدي إلى خفض حجم الموارد الحاسوبية اللازمة لتشغيل أنظمة الذكاء الاصطناعي بشكل ملحوظ، وهو ما قد ينعكس مباشرة على تكلفة تقديم الخدمات للمستخدمين والشركات.

ويُنظر إلى هذه التطورات على أنها جزء من اتجاه أوسع داخل قطاع الذكاء الاصطناعي في الصين، حيث بدأت الشركات تركز بصورة متزايدة على تحسين كفاءة التشغيل وتقليل الضغط على الشرائح الإلكترونية ومسرعات الذكاء الاصطناعي، بدلاً من الاكتفاء بزيادة حجم النماذج وعدد المعاملات.

Loading ads...

ومع استمرار القيود الأميركية على تصدير الرقائق المتقدمة إلى الصين، أصبحت الابتكارات البرمجية مثل DSpark تمثل أحد أهم المسارات التي تراهن عليها الشركات الصينية للحفاظ على قدرتها التنافسية، عبر تقديم نماذج أسرع وأقل تكلفة في التشغيل، حتى في ظل محدودية الوصول إلى أحدث العتاد المتخصص.