- ·يتصدر DeepSeek V4 Pro النماذج المفتوحة بدرجة 87 مقابل 93 لأفضل نموذج مغلق. الفرق لم يكن يوماً أصغر من هذا.
- ·الخيارات القوية كثيرة: Kimi K2.6 وGLM-5.1 وQwen3.5 وGemma 4 الجديد من Google، ولكل منها قوة وحجم وترخيص مختلف.
- ·الأجهزة تحسم أكثر من الاختبارات: نموذج بحجم 24B إلى 31B يعمل على معالج رسومي واحد، بينما النماذج العملاقة فوق 397B تحتاج 4 إلى 8 معالجات H100. اختاروا النموذج حسب شغلكم، لا حسب لوحة النتائج.
لسنوات كان تشغيل الذكاء الاصطناعي على خوادمك الخاصة يعني شيئاً واحداً: تحمي بياناتك لكنك تتنازل عن الأفضل. في يونيو 2026 لم يعد هذا صحيحاً تقريباً. أقوى النماذج المفتوحة صارت قريبة جداً من أفضل الأنظمة المغلقة، وبعضها يمكن تشغيله فعلاً داخل شبكة الشركة. هذه هي الصورة الحالية، بالأرقام.
الفئة العليا، بالقياس
لوحات النتائج المركبة تحسب متوسط الأداء في المعرفة والتفكير والبرمجة وتنفيذ التعليمات. على مؤشر BenchLM ليونيو 2026، الترتيب هكذا: DeepSeek V4 Pro في القمة بذاكرة سياق تتسع لمليون رمز، يليه Kimi K2.6 من Moonshot، ثم GLM-5.1 من Zhipu، ثم Qwen3.5 من Alibaba. أما قمة النماذج المغلقة على المقياس نفسه، جيل GPT-5.5 وGemini 3.5، فتسجل 93. ست نقاط فقط هي ثمن امتلاككم للنظام كاملاً.
النماذج المتخصصة تذهب أبعد. MiniMax M3 الصادر هذا الشهر هو الأول في اختبار البرمجة SWE-Bench Pro بين النماذج المفتوحة بنسبة 59%. وKimi K2 Thinking يحقق 99.1% في رياضيات AIME 2025 مع استخدام الأدوات. وLlama 4 Scout يملك أطول ذاكرة سياق: عشرة ملايين رمز. هذا هو نمط 2026: النماذج المفتوحة ليست نموذجاً واحداً، بل مجموعة واسعة تختارون منها حسب الحاجة.
العمالقة الصغار: Gemma 4 وGPT-OSS
إصداران غربيان يهمان الفرق التي لا تستطيع شراء ثمانية معالجات رسومية. Gemma 4 من Google (أبريل 2026) هو مفاجأة السنة: نسخة 31B تحتل المركز الثالث بين كل النماذج المفتوحة على لوحة Chatbot Arena بدرجة 1452، وتحقق 89.2% في رياضيات AIME 2026 و80% في برمجة LiveCodeBench v6، وهي أرقام تحرج نماذج أكبر منها بعشرين مرة. وتعمل على معالج رسومي واحد متقدم. أما سلسلة GPT-OSS من OpenAI (بحجمي 120B و20B وبترخيص Apache 2.0 الحر) فهي ما زالت أحدث نماذجها المفتوحة: نسخة 120B تعطي قدرة تفكير قريبة من o4-mini على معالج واحد بذاكرة 80 جيجابايت، ونسخة 20B تعمل على جهاز بذاكرة 16 جيجابايت فقط. لمعظم أعمال الشركات في المستندات والمساعدين، هذه الفئة هي التي تُنشر فعلاً.
كم تبلغ تكلفة التشغيل
الأجهزة، لا رسوم الترخيص، هي ما يكلف المال. هناك ثلاث فئات واقعية. الأولى: نموذج بين 24B و31B (مثل Gemma 4 أو Mistral Small 4 أو Qwen3.6-27B) يعمل على معالج رسومي واحد متقدم ويكفي لمعظم أعمال المستندات والمساعدين. الثانية: نماذج متوسطة تعطي جودة قريبة من القمة على جهاز متواضع. الثالثة: النماذج العملاقة فوق 397B وتحتاج 4 إلى 8 معالجات من فئة H100، أي نحو 2,000 إلى 5,000 دولار شهرياً بأسعار السحابة، أو شراء أجهزة لمرة واحدة تسترد تكلفتها بسرعة مع حجم عمل كبير. لمعظم الشركات المنظمة، الفئة الأولى تكفي وتزيد.
التراخيص: اقرأوا قبل النشر
النماذج المفتوحة لا تعني ترخيصاً واحداً للجميع. Mistral وGPT-OSS يصدران بترخيص Apache 2.0، وهو الأسهل والأكثر حرية. ترخيص Llama من Meta يمنع الاستخدام التجاري فوق 700 مليون مستخدم شهرياً، وهو شرط لا يمس معظم الشركات لكن يجب معرفته. وبعض المختبرات الصينية تستخدم تراخيص خاصة لها شروطها. لا شيء من هذا يمنع شركة عادية من النشر، لكن مراجعة الترخيص مع القانونيين يجب أن تتم في البداية، لا بعد إطلاق المشروع.
كيف تختارون عملياً
لا تربطوا أنفسكم بنموذج واحد. كل عمل يناسبه نموذج مختلف: قراءة المستندات العربية تناسبها عائلة، ومطابقة السجلات عائلة أخرى، والمساعد فوق بياناتكم الداخلية عائلة ثالثة. ولأن النموذج يعمل على أجهزتكم، فتغييره مجرد تعديل في الإعدادات، لا مشروع جديد. لوحة النتائج ستتغير بعد ستة أشهر. نظامكم لا يجب أن يتغير معها.
تشغيل النماذج على خوادمكم لم يعد تنازلاً عن الجودة مقابل التحكم. أفضل النماذج المفتوحة على خطوة واحدة من القمة، وتعمل داخل شبكتكم، وتكلفتها أجهزة تشترونها مرة واحدة لا رسوم على كل استخدام. إذا كان القانون يحدد أين تبقى بياناتكم، فهذه هي الطريقة التي تنجزون بها مشروعكم رغم ذلك.