- ·Four Arabic-native open models now matter: Jais from the UAE, ALLaM from Saudi Arabia, Fanar from Qatar, and Falcon-H1 Arabic from Abu Dhabi. Each publishes open weights you can download and run yourself.أربعة نماذج عربية المنشأ صارت مهمة: Jais من الإمارات، وALLaM من السعودية، وFanar من قطر، وFalcon-H1 Arabic من أبوظبي. وكل منها ينشر أوزاناً مفتوحة يمكنكم تنزيلها وتشغيلها بأنفسكم.
- ·Strong general models handle Arabic well too. Qwen and Llama lead the open Arabic leaderboards and are easy to self-host. The best choice depends on your task and your hardware, not on a single headline number.والنماذج العامة القوية تتعامل مع العربية جيداً أيضاً. فـ Qwen وLlama يتصدران لوحات الصدارة العربية المفتوحة وسهلا الاستضافة الذاتية. وأفضل خيار يعتمد على مهمتكم وعتادكم، لا على رقم واحد لافت.
- ·Benchmarks are a shortlist, not a verdict. Check the live Arabic leaderboards, then run the top two or three on your own documents and measure there, with a native speaker reading the output.والاختبارات المرجعية قائمة مختصرة لا حكم نهائي. راجعوا لوحات الصدارة العربية الحية، ثم شغّلوا الأفضل اثنين أو ثلاثة على مستنداتكم وقيسوا هناك، مع قراءة المخرجات بعين متحدث أصلي.
You want an assistant that reads and writes real Arabic: Modern Standard Arabic for documents, the dialects your customers actually type, and the diacritics and right-to-left text that trip up most models. Plenty of tools claim Arabic and deliver a thin translation layer. The good news in 2026 is that several genuinely Arabic models now ship with open weights, so you can run them on your own servers and judge them on your own data.تريدون مساعداً يقرأ ويكتب عربية حقيقية: الفصحى للمستندات، واللهجات التي يكتبها عملاؤكم فعلاً، والتشكيل والكتابة من اليمين إلى اليسار التي تُربك معظم النماذج. وكثير من الأدوات تدّعي العربية وتقدّم طبقة ترجمة رقيقة. والخبر الجيد في ٢٠٢٦ أن عدة نماذج عربية حقيقية صارت تُنشَر بأوزان مفتوحة، فيمكنكم تشغيلها على خوادمكم والحكم عليها ببياناتكم.
Arabic is its own problem, not a settingالعربية مشكلة قائمة بذاتها، لا مجرد إعداد
Arabic has rich morphology, many dialects that sit far from the written standard, optional diacritics that change meaning, and right-to-left text. A model trained mostly on English with a little Arabic will sound fluent and then miss the point. The same gap shows up when reading scanned Arabic documents, which is its own challenge in why Arabic OCR fails.العربية ذات صرف غني، ولهجات كثيرة بعيدة عن المعيار المكتوب، وتشكيل اختياري يغيّر المعنى، وكتابة من اليمين إلى اليسار. والنموذج المدرَّب على الإنجليزية غالباً وقليل من العربية يبدو فصيحاً ثم يخطئ المقصود. والفجوة نفسها تظهر عند قراءة المستندات العربية الممسوحة، وهي تحدٍّ قائم بذاته في لماذا يفشل التعرف الضوئي على الحروف العربية.
The Arabic-native open modelsالنماذج العربية المنشأ مفتوحة الأوزان
The Gulf has invested heavily in Arabic-first models, and the ones that matter publish open weights you can host yourself. These four are the names to know.استثمرت دول الخليج بقوة في نماذج تضع العربية أولاً، والمهم منها ينشر أوزاناً مفتوحة يمكنكم استضافتها بأنفسكم. وهذه الأربعة هي الأسماء التي ينبغي معرفتها.
The strong all-roundersالنماذج العامة القوية
Some general, multilingual models handle Arabic well and are very easy to self-host. Qwen, from Alibaba, is a strong Arabic baseline and tops the pretrained category on the open Arabic leaderboard. Llama 3.3 70B, from Meta, ranks at the top across categories. Gemma, from Google, is a capable lighter option. They are not Arabic-first, but they are widely supported, and how to run any of them in-house is covered in self-hosting open-weight models.بعض النماذج العامة متعددة اللغات تتعامل مع العربية جيداً وسهلة الاستضافة الذاتية جداً. فـ Qwen من Alibaba أساس عربي قوي ويتصدّر فئة النماذج المُدرَّبة مسبقاً على لوحة الصدارة العربية المفتوحة. وLlama 3.3 بحجم ٧٠ مليار معامل من Meta يحتل القمة عبر الفئات. وGemma من Google خيار أخفّ وقادر. وهي ليست عربية أولاً، لكنها مدعومة على نطاق واسع، وكيفية تشغيل أيٍّ منها داخلياً مشروحة في استضافة النماذج مفتوحة الأوزان ذاتياً.
How to compare them honestlyكيف تقارنون بينها بإنصاف
Two public leaderboards help. The Open Arabic LLM Leaderboard ranks open models on a range of Arabic tasks, and AraGen, from Inception and MBZUAI, scores Arabic generation specifically. Treat them as a starting shortlist, not a final verdict: the rankings, checked in mid-2026, change every few weeks as new models land. A leaderboard cannot tell you how a model does on your contracts, your claims, or your support tickets.تساعد لوحتا صدارة عامتان. لوحة الصدارة العربية المفتوحة ترتّب النماذج المفتوحة على طيف من المهام العربية، وAraGen من Inception وجامعة محمد بن زايد للذكاء الاصطناعي تقيس توليد النص العربي تحديداً. عاملوهما كقائمة مختصرة للبداية لا حكماً نهائياً: فالترتيب، الذي روجِع في منتصف ٢٠٢٦، يتغير كل بضعة أسابيع مع وصول نماذج جديدة. ولوحة الصدارة لا تخبركم كيف يعمل النموذج على عقودكم ومطالباتكم وتذاكر دعمكم.
How to pick the right oneكيف تختارون الأنسب
- 1 Size it to your hardwareاضبطوا الحجم على عتادكم
Choose models that fit the GPUs you have or plan to buy. A 7B to 27B model runs on a single modern GPU; 70B needs more. The practical side of running models locally is in running AI models locally.اختاروا نماذج تناسب المعالجات الرسومية التي لديكم أو تنوون شراءها. فالنموذج من ٧ إلى ٢٧ مليار معامل يعمل على معالج رسومي حديث واحد، أما ٧٠ ملياراً فيحتاج أكثر. والجانب العملي لتشغيل النماذج محلياً في تشغيل نماذج الذكاء الاصطناعي محلياً. - 2 Shortlist from the leaderboardsاختصروا القائمة من لوحات الصدارة
Use the Open Arabic LLM Leaderboard and AraGen to pick two or three candidates. Do not let them crown a single winner for you.استخدموا لوحة الصدارة العربية المفتوحة وAraGen لاختيار مرشحَين أو ثلاثة. ولا تدعوهما يتوّجان لكم فائزاً واحداً. - 3 Test on your own dataاختبروا على بياناتكم
Run the shortlist on a sample of your real Arabic documents and tasks. Read the outputs with a native speaker, because a fluent-sounding wrong answer is the trap.شغّلوا القائمة المختصرة على عينة من مستنداتكم ومهامكم العربية الحقيقية. واقرؤوا المخرجات مع متحدث أصلي، فالجواب الخاطئ الفصيح هو الفخّ. - 4 Measure what matters to youقيسوا ما يهمّكم
Accuracy on your task, handling of your dialect, and speed at your volume matter more than a generic benchmark score.الدقة في مهمتكم، والتعامل مع لهجتكم، والسرعة عند حجمكم، أهمّ من نتيجة اختبار عامة. - 5 Keep it in-houseأبقوه داخلياً
Run the winner on infrastructure you control so your Arabic data never leaves your network. The trade-offs are weighed in on-prem versus cloud AI.شغّلوا الفائز على بنية تتحكمون بها كي لا تغادر بياناتكم العربية شبكتكم أبداً. وتُوازَن المفاضلات في الذكاء الاصطناعي المحلي مقابل السحابي.
The Arabic open-model field is moving fast. Falcon-H1 Arabic led the open leaderboard in early 2026, ALLaM and Fanar keep shipping new sizes, and the general models improve every few months. The model that wins for you is the one that scores best on your own Arabic data, run on hardware you control. Re-check the leaderboards before you commit, and run a measured pilot first.ميدان النماذج العربية المفتوحة يتحرك بسرعة. تصدّر Falcon-H1 Arabic لوحة الصدارة المفتوحة في مطلع ٢٠٢٦، وتواصل ALLaM وFanar إصدار أحجام جديدة، وتتحسّن النماذج العامة كل بضعة أشهر. والنموذج الذي يفوز لكم هو الذي يحقق أفضل نتيجة على بياناتكم العربية، مُشغَّلاً على عتاد تتحكمون به. راجعوا لوحات الصدارة قبل الالتزام، ونفّذوا تجربة مُقاسة أولاً.