النماذج المفتوحة محلي

تشغيل النماذج مفتوحة الأوزان على معالجاتكم

تضع GPT-OSS وGemma وQwen قدرةً من الطراز الأول على عتاد تملكونه. ما الذي تتطلّبه الاستضافة الذاتية للنماذج المفتوحة فعلًا، ولماذا يتفوّق عدم الارتباط بنموذج بعينه على المراهنة على مورّد واحد.

APFlow
المدونة · مايو ٢٠٢٦ · ٦ دقائق
A high-performance GPU circuit board
Unsplash
TL;DR
  • ·تغطّي النماذج مفتوحة الأوزان اليوم معظم مهام المؤسسات دون واجهة عامة.
  • ·الاستضافة الذاتية تعني التحكّم في البيانات والتكلفة والجاهزية.
  • ·لا ترتبطوا بنموذج بعينه. أفضل نموذج مفتوح يتغيّر كل بضعة أشهر.
  • ·اختاروا حجم النموذج بحسب المهمة. الأكبر نادرًا ما يكون الأفضل.

لسنوات، كان الذكاء الاصطناعي الجادّ يعني اتصالًا بمركز بيانات شخص آخر. ثم غيّرت النماذج مفتوحة الأوزان ذلك. فـ GPT-OSS وGemma وQwen جيدة بما يكفي في العمل الحقيقي بحيث يمكنكم تشغيلها على عتاد تملكونه، خلف جداركم الناري، دون إجراء أي اتصال خارجي. وبالنسبة للفرق الخاضعة للتنظيم، هذا ليس راحةً ثانوية، بل الفرق بين أن يُسمح لكم باستخدام الذكاء الاصطناعي أو لا.

الأوزان المفتوحة غيّرت الحساب

قبل عامين أو ثلاثة، كانت الاستضافة الذاتية تعني قبول فجوة قدرة حقيقية. وقد أُغلقت تلك الفجوة إلى حدّ بعيد في المهام التي تحتاجها معظم المؤسسات فعلًا: الاستخراج والتصنيف والتلخيص والاستدلال على المستندات. لم تعودوا مضطرّين للاختيار بين إبقاء البيانات في الداخل واستخدام نموذج قادر. يمكنكم الجمع بينهما.

ما الذي تتطلّبه الاستضافة الذاتية فعلًا

الاستضافة الذاتية ليست مجّانية، والتظاهر بغير ذلك لا يفيد أحدًا. تحتاجون معالجات رسومية بحجم عبئكم، وطريقةً لتقديم النماذج وتحديثها، ومن يراقبها في الإنتاج. والخبر الجيّد أن هذه صارت مسألة هندسية محلولة، لا مسألة بحثية. والبصمة العتادية لمعظم أعباء المستندات والعمليات أصغر بكثير مما يظنّ الناس، لأنكم لا تحتاجون أكبر نموذج لإنجاز عمل مركّز بإتقان.

لماذا يهمّ عدم الارتباط بنموذج

أهمّ خيار معماري على الإطلاق هو ألّا تتزوّجوا نموذجًا واحدًا. فقائمة الصدارة تتبدّل كل بضعة أشهر، والنموذج المفتوح الذي يتصدّر اليوم قد يصبح الثاني في الربع التالي. ابنوا العملية بحيث يكون النموذج مكوّنًا قابلًا للاستبدال، لا أساسًا تُضطرّون لإعادة البناء حوله. عندها يصبح كل تحسّن في المنظومة المفتوحة ترقيةً مجانية، دون تغيير في طريقة سير العمل.

شارك

ضعوا عمليةً واحدة في الإنتاج.

مكالمة من ١٥ دقيقة، ثم تقييم حقيقي لما يستطيع الوكيل تشغيله على خوادمكم.

احجز مكالمة تقييم ←
تابع القراءة