إطلاق ثوري من OpenAI: نماذج o3 وo4-mini وأداة ترميز مفتوحة المصدر

في 16 أبريل 2025، أعلنت شركة OpenAI عن إطلاق نماذجها الجديدة o3 وo4-mini، الجيل الأحدث من سلسلة “o” التي تُعد الأكثر تقدمًا وذكاءً في تاريخ الشركة. تتميز هذه النماذج بقدرات غير مسبوقة، إذ تُمثل نقلة نوعية مقارنة بالجيل السابق (o1)، من خلال الذكاء المعزز والقدرة على التصرف كوكلاء مستقلين (Agentic)، أي استخدام الأدوات بشكل ذاتي، التفكير عبر الصور، وحل المشكلات المعقدة بكفاءة عالية.

تم تطوير هذه النماذج لتُعطي الأولوية للتفكير والمعالجة العميقة قبل تقديم الردود، مما يجعلها قادرة على التعامل مع مشكلات متعددة الخطوات في مجالات مثل العلوم، الرياضيات، والبرمجة. ويأتي هذا الإطلاق في ظل تصاعد المنافسة في سوق الذكاء الاصطناعي العالمي، حيث تسعى OpenAI للحفاظ على ريادتها أمام منافسين مثل Google، Meta، xAI، Anthropic وDeepSeek.

النماذج الجديدة أصبحت متاحة على الفور لمشتركي ChatGPT Plus وPro وTeam، في حين يُنتظر إطلاق نموذج o3-pro خلال الأسابيع القليلة القادمة. بالتوازي، أطلقت الشركة أداة جديدة مفتوحة المصدر تدعى Codex CLI، وهي وكيل ترميز خفيف يعمل محليًا عبر الطرفية (Terminal) ويعتمد على النماذج الجديدة.


نماذج جديدة واختراقات تقنية

كشفت OpenAI عن النموذجين o3 وo4-mini، اللذين يُمثلان تقدمًا تقنيًا كبيرًا في مجال الذكاء الاصطناعي. نموذج o3 هو الأقوى حتى الآن من حيث قدرات التفكير والتحليل، وحقق أداءً غير مسبوق في مجالات البرمجة، والرياضيات، والعلوم، والتحليل البصري. أما o4-mini فهو نموذج صغير الحجم محسّن من حيث السرعة والتكلفة، ومع ذلك يُظهر أداءً مثيرًا للإعجاب قياسًا إلى حجمه وسعره.

وبحسب خبراء، يتفوق o4-mini على سابقه o3-mini حتى في المهام غير المتعلقة بمجالات STEM، مثل علوم البيانات. كما يتمتع بقدرة أعلى على تحمل الأحمال والاستخدام المكثف مقارنةً بـ o3، ما يجعله خيارًا مثاليًا للتطبيقات التي تتطلب استجابات سريعة وتفكيرًا عميقًا.

وقد أشاد المراجعون الخارجيون بكفاءة النماذج الجديدة في اتباع التعليمات وتقديم إجابات أكثر دقة وموثوقية بفضل الذكاء المحسن والاستفادة من مصادر الإنترنت. كما أظهرت النماذج سلوكًا أكثر سلاسة وطبيعية في المحادثة، خاصة بفضل قدرتها على تذكر المحادثات السابقة وتخصيص الردود بما يتناسب مع سياق المستخدم.


قدرات مبتكرة

الاستخدام الذاتي للأدوات

تمتاز النماذج الجديدة بقدرتها الثورية على استخدام الأدوات بشكل مستقل. فهي لا تكتفي باستخدام الأدوات، بل تقرر بذكاء متى وكيف تستخدمها لحل المشكلات. على سبيل المثال، تستطيع النماذج التنقل بين البحث في الإنترنت، تشغيل أكواد Python لتحليل البيانات، تحليل الصور المعقدة، وحتى إنشاء صور جديدة ضمن سلسلة الحلول.

هذه المهارة تتيح لها تنفيذ سلاسل من المهام المعقدة مثل جمع المعلومات، تحليلها، تقديم النتائج بصريًا، والوصول إلى استنتاجات دقيقة—all دون أي تدخل من المستخدم. إنها خطوة واضحة نحو الذكاء الاصطناعي الوكيل المستقل (Autonomous Agent)، الذي يتفاعل استراتيجيًا مع البيئة لتحقيق الأهداف.

فهم بصري متقدم

تُعد النماذج الجديدة متعددة الوسائط، حيث تجمع بين الرؤية الحاسوبية والتفكير التحليلي. يمكنها تحليل المخططات والرسومات المعقدة، فهم لقطات الشاشة المليئة بالمعلومات، واستخلاص رؤى من صور المنتجات. كما تستطيع التعامل مع صور منخفضة الجودة، وإجراء عمليات مثل القص والتكبير لتسليط الضوء على التفاصيل المهمة. هذه القدرات تجعلها مثالية لتحليل الرسوم البيانية الاقتصادية، المخططات العلمية، والرسومات الهندسية بدقة وعمق.


نموذج o3

يمثل نموذج o3 طفرة في تقنيات الذكاء الاصطناعي، إذ حقق 2727 نقطة في اختبارات Codeforces، متفوقًا بأكثر من 20% على o1. كما سجل نتائج مذهلة في اختبارات SWE-bench وMMMU. وفي اختبار AIME 2024 للرياضيات، حصل على نتيجة 96.7%، وفي اختبار GPQA Diamond الموجه لأسئلة علمية على مستوى الدكتوراه، حصل على 87.7%.

تشير التقييمات إلى أن o3 أكثر دقة بنسبة 20% من o1 في المهام الواقعية المعقدة، خصوصًا في البرمجة، الاستشارات، والإبداع. ويُعتبر أداة مثالية للباحثين وأصحاب المشاريع الذين يحتاجون إلى شريك تفكير تحليلي قادر على اقتراح وتحليل فرضيات متقدمة.


نماذج o4-mini وo4-mini-high

هذان النموذجان يُمثلان مزيجًا بين الكفاءة الاقتصادية والأداء العالي. يتميز o4-mini بسرعة معالجة مذهلة وتكلفة منخفضة، إذ حصل على 99.5% في اختبار AIME 2025 عند استخدامه مع مفسر Python. كما يدعم نافذة سياق بحجم 128,000 رمز، ما يسمح له بمعالجة نصوص طويلة.

أما o4-mini-high فهو نسخة محسّنة تدعم نافذة سياق تصل إلى مليون رمز، ما يجعله مثاليًا لتحليل كتب كاملة، ملفات PDF ضخمة، أو قواعد بيانات برمجية واسعة.

متى تستخدم o4-mini؟

يُعد الخيار الأمثل للتطبيقات التفاعلية التي تتطلب سرعة استجابة وتكلفة منخفضة، مثل روبوتات المحادثة والتكاملات السريعة. تكلفة الاستخدام منخفضة: 15 سنتًا لكل مليون رمز إدخال، و60 سنتًا لكل مليون رمز إخراج، أي أرخص بكثير من GPT-4o وGPT-3.5 Turbo.

ومتى تستخدم o4-mini-high؟

إذا كنت بحاجة إلى تحليل وثائق طويلة مثل التقارير القانونية أو الأبحاث الأكاديمية، فإن o4-mini-high هو الأنسب، بفضل نافذة السياق الضخمة التي تُمكّنه من الحفاظ على تسلسل المعلومات وربطها بدقة على مدى صفحات متعددة.


مقارنة الأداء والتكلفة

تُظهر الرسوم البيانية المصاحبة أن o3 وo4-mini يتفوقان على o1 وo3-mini في اختبارات رياضية، علمية، ومهام تحليل متعددة التخصصات. كما توضح الرسومات الأخرى كيف توفر النماذج الجديدة توازنًا رائعًا بين الأداء والتكلفة.

في اختبارات AIME 2024، حقق o4-mini دقة بنسبة 93.4% بدون استخدام أدوات، مقابل 74.3% فقط لـ o1. أما في اختبار Codeforces، فقد سجل o4-mini درجة ELO قدرها 2719، مقابل 1891 لـ o1. وفي اختبار GPQA Diamond، حقق o4-mini دقة بلغت 81.4%.

من حيث الفهم البصري، تُظهر نتائج MMMU وMathVista وCharXiv-Reasoning أن النماذج الجديدة تتفوق بوضوح، حيث وصلت نسب الدقة إلى أكثر من 20% أعلى من الجيل السابق.


خلاصة: مع إطلاق o3 وo4-mini، تؤكد OpenAI مكانتها في طليعة الابتكار في الذكاء الاصطناعي، مقدمة أدوات قوية ومرنة تلبي احتياجات المستخدمين من مختلف القطاعات. ومع قدرات تحليلية وبصرية متقدمة، واستخدام ذكي للأدوات، فإن هذه النماذج ترسم ملامح مستقبل يعتمد على ذكاء اصطناعي أكثر فاعلية، استقلالية وواقعية.

إرسال التعليق