Alibaba تطلق نماذج Qwen 3 المفتوحة المصدر بتكنولوجيا متقدمة وأداء يضاهي الكبار!

في خضم المنافسة المحتدمة بين كبرى شركات التكنولوجيا العالمية في مجال تطوير نماذج الذكاء الاصطناعي الكبيرة (LLMs)، تستمر الشركات في إطلاق نماذج جديدة تتجاوز حدود القدرات السابقة. وفي خطوة هامة جداً، أعلنت شركة علي بابا (Alibaba)، عملاق التجارة الإلكترونية الصيني، عن إطلاق سلسلة جديدة وقوية للغاية من النماذج المتعددة الوسائط مفتوحة المصدر تحت اسم Qwen 3.

تُعد سلسلة Qwen 3 من بين أحدث وأقوى النماذج مفتوحة المصدر المتاحة حالياً، وتُظهر البيانات الأولية والمقارنات أنها قادرة على منافسة، بل ومضاهاة، أداء بعض النماذج الاحتكارية (Proprietary) الأكثر تقدماً من شركات بحجم OpenAI و Google على العديد من معايير الأداء الرئيسية. هذا الإنجاز يؤكد دخول علي بابا بقوة كلاعب رئيسي لا يمكن تجاهله في سباق الذكاء الاصطناعي العالمي.

مجموعة متنوعة وتقنيات متقدمة: ما الذي يميز نماذج Qwen 3؟

لا يقتصر إصدار Qwen 3 على نموذج واحد، بل يشمل مجموعة متنوعة وكبيرة من النماذج لتلبية احتياجات مختلفة. تتكون السلسلة من ثمانية نماذج جديدة في المجموع، تشمل:

  1. نموذجين يعتمدان على بنية “خليط من الخبراء” (Mixture of Experts – MoE): هذه البنية المتقدمة (التي تم تعميمها من قبل شركات مثل Mistral) لا تقوم بتنشيط الشبكة العصبية الكاملة للنموذج لمعالجة كل استعلام. بدلاً من ذلك، لديها مجموعة من “الخبراء” المتخصصين، ويتم تنشيط وتفعيل الأجزاء الأكثر صلة فقط بالاستعلام المطلوب، مما يوفر بشكل كبير في تكاليف الحوسبة ويجعل النموذج أكثر كفاءة في التشغيل، مع الحفاظ على أداء قوي.
  2. ستة نماذج “كثيفة” (Dense Models): بأحجام مختلفة من 0.6 مليار معلمة وصولاً إلى 32 مليار معلمة، لتوفير خيارات متنوعة تناسب مختلف الاحتياجات والميزانيات الحسابية للمطورين، بدءاً من التشغيل على الأجهزة الأقل قوة وصولاً إلى الخوادم القوية.

الأداء هو نقطة القوة الأبرز في هذه النماذج. فقد أظهر النموذج الأكبر في السلسلة، المسمى Qwen3-235B-A22B (بـ 235 مليار معلمة إجمالية مع تفعيل 22 مليار معلمة في كل استعلام بفضل بنية MoE)، تفوقاً على نماذج مفتوحة المصدر أخرى مثل Deepseek، واقترب بشكل كبير من أداء نماذج احتكارية قوية مثل نموذج O1 من OpenAI (وهو اسم غير رسمي يُشار به إلى نموذج داخلي متقدم لـ OpenAI) وحتى من أداء نموذج Google Gemini Pro، على معايير طرف ثالث رئيسية مثل Arena Hard التي تختبر قدرة النموذج على الإجابة على أسئلة صعبة في مجالات مثل هندسة البرمجيات والرياضيات.

التفكير الهجين: ميزة جديدة لزيادة الدقة والسرعة

ميزة أخرى هامة وفريدة في نماذج Qwen 3 هي قدرتها على استخدام ما تسميه علي بابا “التفكير الهجين” (Hybrid Thinking) أو “التفكير الديناميكي”. تعتمد هذه التقنية على تدريب النماذج لتقديم خيارين للاستجابة:

  • استجابة سريعة ودقيقة: للأسئلة المباشرة وغير المعقدة.
  • خطوات تفكير أعمق ومكثفة: للأسئلة الأكثر صعوبة في العلوم والرياضيات والهندسة. هذا يشبه إلى حد كبير ميزة “سلسلة التفكير” (Chain-of-Thought) الموجودة في نماذج أخرى، لكن مع القدرة على التبديل بين الوضعين حسب تعقيد الاستعلام.

يمكن للمستخدمين التفاعل مع هذه الميزة عبر واجهة Qwen Chat على الويب (باستخدام زر مخصص لوضع “التفكير”) أو عن طريق تضمين مطالبات محددة (/think أو /no_think) عند استخدام النماذج محلياً أو عبر واجهة برمجية (API)، مما يمنحهم مرونة في اختيار مستوى التعمق المطلوب في الإجابة بناءً على المهمة.

إتاحة واسعة ودعم لغوي متعدد

تُتاح نماذج Qwen 3 للمطورين والباحثين على نطاق واسع عبر منصات شهيرة في مجتمع الذكاء الاصطناعي مثل Hugging Face و ModelsCope و Kaggle و Github. كما يمكن التفاعل معها مباشرة عبر واجهة الويب وتطبيقات الهاتف المحمول لـ Qwen Chat. الأهم هو أن هذه النماذج متوفرة بموجب ترخيص Apache 2.0 مفتوح المصدر المتساهل، والذي يسمح بالاستخدام التجاري غير المحدود، مما يزيل العديد من العوائق القانونية التي قد تواجه الشركات عند استخدام نماذج أخرى مفتوحة المصدر (مثل بعض تراخيص Meta).

كما أن نماذج Qwen 3 تعزز بشكل كبير دعمها اللغوي، حيث تغطي الآن 119 لغة ولهجة عبر عائلات لغوية رئيسية. هذا التوسع اللغوي يفتح الباب لتطبيقات أوسع بكثير في مختلف أنحاء العالم، ويسهل استخدام النماذج في سياقات لغوية متنوعة جداً.

التدريب والهندسة المعمارية: قفزة من Qwen 2.5

تمثل عملية تدريب نماذج Qwen 3 خطوة كبيرة للأمام مقارنة بالجيل السابق (Qwen 2.5). فقد تضاعف حجم مجموعة البيانات المستخدمة في التدريب المسبق لتصل إلى حوالي 36 تريليون رمز. وتشمل مصادر البيانات زحف الويب، استخلاص مستندات، ومحتوى تم إنشاؤه اصطناعياً بواسطة نماذج Qwen السابقة. تضمنت عملية التدريب عملية من ثلاث مراحل متبوعة بعملية تنقيح ما بعد التدريب لتمكين القدرات الجديدة مثل التفكير الهجين. هذه التحسينات في التدريب سمحت للنماذج الكثيفة الأساسية في Qwen 3 بتحقيق أداء يضاهي أو يتجاوز أداء نماذج Qwen 2.5 الأكبر حجماً.

من حيث النشر، توفر Qwen 3 خيارات مرنة للمطورين لدمجها في تطبيقاتهم، بما في ذلك التوافق مع أطر عمل شهيرة توفر نقاط نهاية متوافقة مع واجهة برمجة تطبيقات OpenAI، مما يسهل الانتقال إليها.

ماذا يعني هذا التطور؟ المنافسة الشرسة مستمرة

إطلاق Alibaba لنماذج Qwen 3، خاصة مع أدائها القوي، تقنياتها المتقدمة (MoE، التفكير الهجين)، وإتاحتها بترخيص مفتوح المصدر متساهل، يمثل حدثاً مهماً في عالم الذكاء الاصطناعي.

  • تعزيز المنافسة في النماذج مفتوحة المصدر: تضع Qwen 3 معياراً جديداً للنماذج مفتوحة المصدر وتزيد الضغط على لاعبين مثل Meta (Llama) و Mistral لتقديم نماذج أقوى وأكثر كفاءة.
  • تحدي النماذج الاحتكارية: تُظهر أن النماذج مفتوحة المصدر يمكن أن تصل إلى مستوى أداء يضاهي النماذج الاحتكارية من عمالقة مثل OpenAI و Google، مما يوفر بديلاً قوياً للمطورين والمؤسسات.
  • دفع الابتكار: المنافسة تدفع الجميع لتقديم تقنيات جديدة (مثل تحسينات الكفاءة في نماذج Deepseek أو التفكير الهجين في Qwen 3).
  • خيار للمؤسسات: توفر نماذج Qwen 3 خياراً جذاباً للمؤسسات التي تبحث عن نماذج قوية ومرنة ومرخصة تجارياً للاستخدام الداخلي أو في تطبيقاتها، مع إمكانية تشغيل نماذج أصغر حجماً على أجهزة أقل تكلفة.

من الواضح أن السباق نحو الذكاء الاصطناعي العام (AGI) أو حتى ما بعده (“الذكاء الاصطناعي الفائق” ASI) يتطلب مواجهة تحديات فنية دقيقة (كما أشار أحد أعضاء فريق Qwen في منشور على X)، وأن الشركات تركز على بناء وكلاء قادرين على التفكير على المدى الطويل.

في الختام: مرحلة جديدة من المنافسة والابتكار

إصدار سلسلة نماذج Qwen 3 من Alibaba ليس مجرد تحديث، بل هو إعلان عن دخول لاعب رئيسي جديد بقوة إلى ساحة المنافسة في نماذج اللغات الكبيرة، مع التركيز على التقدم التقني والأداء والإتاحة المفتوحة. هذا التطور يعزز التوجه نحو نماذج أكثر كفاءة وذكاءً وتنوعاً، ويضمن أن الابتكار في مجال الذكاء الاصطناعي سيستمر بوتيرة متسارعة، مما يفتح آفاقاً جديدة للتطبيقات المستقبلية.

مع تزايد عدد النماذج القوية المتاحة، يصبح اختيار النموذج الأنسب للمطورين والمستخدمين مهمة أكثر تعقيداً، ولكنه أيضاً يعني المزيد من الفرص والإمكانيات للجميع.

Tqn news

رامي النجار

باحث في مجال تقنيات الذكاء الاصطناعي والروبوتات، يقدم تحليلات مبسطة وعميقة لأحدث ما تقدمه شركات مثل OpenAI وGoogle وMeta.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى