نموذج DeepSeek.. كل ما تريد معرفته عن الأداة الصينية المنافسة لـChatGPT
أصدر مختبر AI الصيني Deepseek عائلة R1 Models الجديدة بموجب ترخيص مفتوح من معهد ماساتشوستس للتكنولوجيا ، حيث تحتوي أكبر نسخة منها على 671 مليار مدرس ، وتزعم الشركة أن النموذج يعمل بمستويات مماثلة ل SR (SR (SR ) لـ Openai O1 ، النموذج وراء ChatGpt Chat Robot ، في العديد من معايير الرياضيات والترميز.
أيضًا ، بالإضافة إلى إصدار النماذج الرئيسية Deepseek-R1-Zero و Deepseek-R1 ، نشر Deepseek ستة إصدارات من “Deepseek-R1-Distill” تتراوح بين 1.5 مليار إلى 70 مليار مدرس.
تعتمد هذه النماذج على هياكل مفتوحة المصدر موجودة مثل Qwen و Llama ، المدربين على استخدام البيانات من نموذج R1 الكامل.
يمكن تشغيل أصغر إصدار على جهاز كمبيوتر محمول ، بينما يتطلب النموذج الكامل موارد الحوسبة الأكبر بكثير.
وقال سايمون ويليسون الباحث المستقل لسيمون ويليسون لرسالة آرس “إنه أمر ممتع للغاية ومشاهدته أمرًا مضحكًا”.
اختبر Willeson أحد النماذج الأصغر ووصف تجربته في منشور على مدونته: “كل استجابة تبدأ بعلامة تجارية تحتوي على سلسلة من الأفكار المستخدمة للمساعدة التفكير الداخلي قبل التوجيه.
محاكاة الاستدلال في العمل
يعمل نموذج R1 بشكل مختلف عن نماذج LLMS من خلال دمج ما يطلق عليه الأشخاص في الصناعة نهج الاستدلال.
يحاولون محاكاة سلسلة من الأفكار التي تشبه الإنسان بينما يعمل النموذج مع حل للتحقيق.
هذه الفئة من ما يمكن أن نسميه “نماذج الاستدلال المحاكاة” ، أو نماذج SR باختصار ، عندما أطلقت Openai نماذج O1 في سبتمبر 2024.
أعلنت Openai عن ترقية رئيسية تسمى “O3” في ديسمبر ، وعلى عكس نماذج LLM التقليدية ، تستغرق نماذج SR هذه وقتًا إضافيًا لإنتاج ردود ، ويشمل هذا الوقت الإضافي من الأداء للمهام الرياضيات والفيزياء والعلوم.
أحدث طراز مفتوح يتسبب في الملحق السريع إلى Openai. على سبيل المثال ، ذكرت Deepseek أن R1 تفوقت على Openai في العديد من المعايير والاختبارات ، بما في ذلك AIME (اختبار التفكير الرياضي) ، و MATH-500 (مجموعة من المشكلات اللفظية) ، ، تم التحقق من SWE-BENCED (أداة البرمجة).
يجب التعامل مع معايير الذكاء الاصطناعي بعناية ، ولم يتم التحقق من هذه النتائج بعد بشكل مستقل.
تشير تقارير echcrunch إلى أن ثلاثة مختبرات صينية ، ديبسيك ، وألبابا ، و Moonshot AI’s Kimi ، أصدرت الآن نماذج يقولون إنها مطابقة لقدرات O1 ، حيث قام Deepseek بمعاينة R1 لأول مرة في نوفمبر.
لكن نموذج Deepseek الجديد يأتي مع مشكلة إذا تم تشغيله في الإصدار المستضاف على السحابة ، نظرًا لأنها أصل صيني ، فإن R1 لن يقدم ردود على بعض المواضيع مثل استقلال تايوان ، لأنه يجب “تجسيد القيم الاشتراكية الأساسية “، وفقا للوائح الإنترنت الصينية.
يأتي هذا المرشح من طبقة تعديل إضافية لا تشكل مشكلة إذا تم تحويل النموذج محليًا خارج الصين ، وحتى مع الرقابة المحتملة ، فإن دين بول ، باحث من AI في جامعة جورج ماسون ، على X ، “الأداء المذهل لنماذج Deepseek ( الإصدارات الصغيرة من R1) وهذا يعني أن مفكري Alain سيستمرون في الانتشار على نطاق واسع ويمكنهم الركض على الأجهزة المحلية ، بعيدًا عن عيون أي نظام تحكم من أعلى إلى أسفل. “
لمطالعة المزيد: موقع السفير وللتواصل تابعنا علي فيسبوك السفير و يوتيوب السفير .