Claude ليس موديلاً واحداً — بل قائمة طبقات. Opus هو الأعمق استدلالاً، وSonnet هو الحصان المتوازن، وHaiku هو السريع الرخيص. والخطأ الأشيع لدى الفرق هو اختيار قمّة المدى لكل شيء "حرصاً على الأمان"، ثم مراقبة الفاتورة وهي تتسلّق مقابل عمل كان موديل أصغر سيتقنه. والخطأ المعاكس — إجبار كل مهمة صعبة على المرور عبر Haiku توفيراً للمال — يكلّفك بهدوء في إعادات المحاولة، والأجوبة الخاطئة، والتنظيف البشري. الجواب الصحيح لا يكون أبداً تقريباً "موديلاً واحداً". إنه طابِق الطبقة مع المهمة.
يوضّح هذا المقال ما الذي تبرع فيه كل طبقة من Claude فعلاً، وكم تكلّف الثلاث على Brievio، وإرشادات ملموسة من نوع "استخدم X عندما…"، ونمط تدرّج يوجّه العمل السهل إلى Haiku ولا يصعّد سوى أصعب المهام إلى Opus. كل طبقة على Brievio هي الموديل الأصلي من الطرف الأول فوق AWS Bedrock — بسياق كامل 200K، وأدوات أصيلة، ورؤية، وتخزين مؤقت — مسعّرة بنحو 15% دون قائمة Anthropic الرسمية.
الطبقات الثلاث في لمحة
إليك المفاضلة كلها في مكان واحد — سعر Brievio (مع قائمة Anthropic الرسمية للمرجعية)، لكل مليون توكن، مدخلات / مخرجات:
- Claude Opus 4.7 — $4.25 / $21.25 (الرسمي $5 / $25). أعمق استدلال وأقوى سلوك وكيلي: خطط طويلة متعددة الخطوات، وعمليات إعادة هيكلة شائكة، ومواصفات غامضة، وتحليل بمستوى بحثي. الأقدر والأغلى — وهو بحكم التصميم الذي تلجأ إليه أخيراً.
- Claude Sonnet 4.6 — $2.55 / $12.75 (الرسمي $3 / $15). حصان الإنتاج المتوازن ومبرمج من الصف الأول. ولمعظم الفرق هذا هو الافتراضي: قوي بما يكفي للغالبية العظمى من العمل الحقيقي، وسريع بما يكفي ليبدو متجاوباً، ومسعّر بحيث لا تتردّد أمام الأحجام الكبيرة.
- Claude Haiku 4.5 — $0.85 / $4.25 (الرسمي $1 / $5). سريع ورخيص، مبني للمهام كبيرة الحجم: التصنيف، والاستخراج، والتوجيه، والوسم، والتحويلات القصيرة. أرخص من Opus بخمسة أضعاف على المدخلات — وعلى المهام الضيقة، صحيح تماماً مثله.
لاحظ الفارق. مدخلات Opus خمسة أضعاف مدخلات Haiku؛ ومخرجات Opus خمسة أضعاف مخرجات Haiku. وعلى مسار يشغّل ملايين النداءات، يكون هذا المضاعِف هو الفرق بين خطأ تقريب لا يُذكر وبند يسأل عنه فريقك المالي. المهارة ليست في اختيار الموديل "الأفضل" — بل في معرفة أيّ المهام يحتاج فعلاً إلى الطبقة العليا وأيّها لا يحتاج.
استخدم Haiku عندما…
يكون Haiku الخيار الصحيح كلما كانت المهمة ضيّقة، والمخرجات قصيرة، وأنت تشغّل عدداً كبيراً منها. القرار في كل نداء صغير؛ والحجم هو ما يهمّ.
- التصنيف والتوجيه — وسم التذاكر، ووسم المحتوى، وكشف النية، وتصفية الرسائل المزعجة، وتحليل المشاعر. الجواب واحد من حفنة خيارات؛ وHaiku يصيبه ويكلّف سنتات لكل ألف.
- الاستخراج المهيكل — انتزاع الحقول من الفواتير، أو البريد، أو السجلّات إلى JSON وفق مخطّط ثابت. اقرنه بتخزين مؤقت للمخطّط فتؤول تكلفة كل نداء إلى لا شيء تقريباً.
- التحويلات القصيرة بأحجام كبيرة — تلخيص فقرة واحدة، أو إعادة صياغة سطر، أو توحيد قيمة، أو توليد slug. تواتر عالٍ، ومخاطر منخفضة لكل نداء.
- المرور الأول الرخيص في مسار متدرّج — فرز يقرّر ما إذا كان يلزم تشغيل موديل أكبر أصلاً (المزيد عن هذا أدناه).
حيث يتعثّر Haiku: الاستدلال متعدد الخطوات، وأحكام التقدير الدقيقة، والتخطيط بعيد المدى، وأي شيء يكون فيه الخطأ الدقيق مكلفاً. إن وجدت نفسك تضيف منطق إعادة محاولة ومدقّقات حول مخرجات Haiku، فتلك إشارة إلى نقل تلك المهمة طبقةً للأعلى.
استخدم Sonnet عندما… (الافتراضي لمعظم الفرق)
Sonnet هو حيث ينبغي أن يعيش معظم حركة الإنتاج. إنه موديل برمجة من الصف الأول، ويتّبع التعليمات المعقّدة باعتمادية، ومسعّر بحيث يمكنك تشغيله افتراضاً يومياً دون ترشيد. وعندما لا تكون متأكداً من الطبقة، فابدأ من هنا — ثم انزل إلى Haiku لعمل الأحجام الكبيرة، واصعد إلى Opus للمهام القليلة التي تحتاجه حقاً.
- البرمجة اليومية — كتابة الميزات، وإصلاح العلل، وتوليد الاختبارات، ومراجعة الكود. وSonnet 4.6 قوي حقاً هنا ونادراً ما يكون عنق الزجاجة.
- المساعدون الموجَّهون للعملاء وروبوتات RAG — حُسن تقدير، وأجوبة طويلة متماسكة، واستخدام موثوق للأدوات، وسرعة تكفي لزمن استجابة تفاعلي.
- تدفقات المحتوى والمستندات — الصياغة، وتلخيص المستندات الطويلة، وتحويل المحتوى المهيكل حيث تهمّ الجودة لكنك لا تحتاج استدلالاً بمستوى Opus.
- معظم حلقات الوكلاء — يتعامل Sonnet جيداً مع وكلاء متعددي الأدوات. واحجز Opus للحلقات كثيفة التخطيط أو شديدة الغموض.
الصياغة الصادقة: حصّة كبيرة من الفرق يمكنها تشغيل Sonnet لكل شيء تقريباً وتكون بخير. والسبب في التدرّج أصلاً هو أن الطرفين — ملايين النداءات التافهة، أو حفنة من النداءات الصعبة بقسوة — هما حيث تؤتي مطابقة الموديل مع المهمة أكبر ثمارها.
استخدم Opus عندما…
Opus هو الطبقة العليا لسبب، لكنه الذي تلجأ إليه عن قصد لا افتراضاً. استخدمه عندما تبرّر الصعوبة التكلفة حقاً — حين يكون جواب خاطئ أو سطحي أغلى من التوكنات الإضافية.
- عمل وكيلي صعب بعيد المدى — خطط متعددة الخطوات يجب أن تتماسك عبر نداءات أدوات كثيرة، حيث يبدأ Sonnet بالانجراف أو فقدان الخيط.
- إعادات الهيكلة الشائكة والمعمارية — تغييرات كبيرة عابرة للملفات، وعمليات ترحيل دقيقة، وتصحيح مشكلة تمتدّ عبر عدة أنظمة.
- المواصفات الغامضة والتحليل العميق — تركيب بمستوى بحثي، وحُكم دقيق، ومشكلات قد تُسلّمها لأكثر مهندسيك خبرة.
- هدف التصعيد — الموديل الذي يلجأ إليه مسارك عندما تُعلِم طبقة أرخص أن حالة ما صعبة.
إن أنتج Opus وSonnet جوابين لا فرق بينهما على مهمتك، فتلك المهمة لم تكن بحاجة إلى Opus — وقد دفعت للتو نحو 1.7 ضعف سعر Sonnet مقابل لا شيء. والطريقة لمعرفة ذلك هي مقارنتهما فعلياً على prompts الخاصة بك، لا افتراض أن الأغلى دائماً أفضل.
النمط: انزل طبقةً افتراضاً، وصعّد عند الطلب
الخطوة الأعلى مردوداً هي التوقّف عن التفكير بموديل واحد والبدء بالتفكير بسُلّم. نفّذ الخيار الرخيص أولاً؛ ولا تصعّد إلا حين لا يكفي الرخيص. ولأن كل طبقة في Brievio تشترك في نفس base_url ونفس SDK، فإن تبديل الطبقات تغيير من سطر واحد — يتحرّك فقط نص الموديل.
# نمط لتدرّج النماذج: نفّذ الخيار الرخيص أولاً، ولا تصعّد إلا عند الحاجة.
# نفس base_url، نفس SDK — يتغيّر فقط نص الموديل لكل طبقة.
from openai import OpenAI
client = OpenAI(
api_key="sk-brievio-...",
base_url="https://api.brievio.com/v1",
)
# أسعار Brievio لكل مليون توكن (مدخلات / مخرجات):
# Haiku 4.5 $0.85 / $4.25 — سريع، رخيص، للأحجام الكبيرة
# Sonnet 4.6 $2.55 / $12.75 — حصان الإنتاج المتوازن
# Opus 4.7 $4.25 / $21.25 — أعمق استدلال، لأصعب المهام
def triage(ticket: str) -> str:
"""Haiku يقرّر: هل يكفي موديل رخيص، أم نصعّد؟"""
resp = client.chat.completions.create(
model="claude-haiku-4-5",
max_tokens=20,
messages=[
{"role": "system", "content": "Reply only EASY or HARD."},
{"role": "user", "content": ticket},
],
)
return resp.choices[0].message.content.strip()
def answer(ticket: str) -> str:
tier = "claude-sonnet-4-6" if triage(ticket) == "EASY" else "claude-opus-4-7"
resp = client.chat.completions.create(
model=tier,
max_tokens=800,
messages=[{"role": "user", "content": ticket}],
)
return resp.choices[0].message.content
# معظم التذاكر تُحلّ على Haiku + Sonnet. ولا يُستدعى Opus إلا للأقلية الصعبة
# فعلاً — فتهبط التكلفة المتوسطة لكل تذكرة إلى ما دون مسار يعتمد Opus بالكامل.الاقتصاد بسيط: نداء فرز على Haiku يكلّف جزءاً من سنت. وإن وجّه الغالبية السهلة إلى Sonnet والأقلية الصعبة فقط إلى Opus، فإن تكلفتك المتوسطة لكل مهمة تهبط إلى ما دون مسار يعتمد Opus بالكامل — دون أي خسارة في الجودة على الحالات التي احتاجت فعلاً إلى الطبقة العليا. والمنطق نفسه ينطبق بالعكس على العمل الخالص كبير الحجم، حيث يؤدّي Haiku المهمة كاملة:
# حيث يثبت Haiku جدارته: التصنيف / الاستخراج بأحجام كبيرة.
# بسعر $0.85 لكل مليون مدخلات، يكلّف مليون مستند قصير سنتات، لا دولارات.
import json
LABELS = ["bug", "feature_request", "billing", "spam", "other"]
def classify(text: str) -> str:
resp = client.chat.completions.create(
model="claude-haiku-4-5",
max_tokens=10,
messages=[
{"role": "system",
"content": f"Classify into exactly one of: {LABELS}. Reply with the label only."},
{"role": "user", "content": text},
],
)
return resp.choices[0].message.content.strip()
# 1,000,000 رسالة واردة، ~300 توكن مدخلات لكل منها، ~3 توكنات مخرجات:
# المدخلات: 300M توكن × $0.85 / 1M = $255
# المخرجات: 3M توكن × $4.25 / 1M = ~$13
# المهمة نفسها على Opus ستكلّف ~5 أضعاف المدخلات و~5 أضعاف المخرجات دون أي
# تحسّن في الدقة على مهمة بهذا الضيق. طابِق الطبقة مع صعوبة العمل.نمطان، فكرة واحدة: طابِق الطبقة مع الصعوبة. الأحجام الكبيرة والعمل السهل يذهبان إلى Haiku، ويذهب جلّ الإنتاج إلى Sonnet، ويبقى Opus محجوزاً للمهام التي تستحقه. ولأن النداءات الفاشلة 4xx/5xx مجانية على Brievio، فإن إعادة محاولة تصعيد تنتهي بخطأ لا تكلّفك شيئاً — لا يتحرّك العدّاد إلا على إكمال حقيقي.
اختيار سريع حسب المهمة
حين تحتاج جواباً فقط، ابدأ من هنا واضبط بعد القياس على prompts الخاصة بك:
- التصنيف / الوسم / التوجيه / الاستخراج، بأحجام كبيرة → Haiku 4.5.
- البرمجة اليومية، وإصلاح العلل، والاختبارات، ومراجعة الكود → Sonnet 4.6.
- روبوت محادثة موجَّه للعملاء / مساعد RAG → Sonnet 4.6.
- الصياغة، والتلخيص، وتدفقات المحتوى → Sonnet 4.6.
- معظم الوكلاء متعددي الأدوات → Sonnet 4.6؛ وصعّد الخطوات كثيفة التخطيط إلى Opus.
- إعادات هيكلة صعبة، ومواصفات غامضة، وتحليل عميق → Opus 4.7.
- غير متأكد؟ → Sonnet 4.6، ثم انزل إلى Haiku للأحجام الكبيرة واصعد إلى Opus لأصعب المهام.
لا شيء من هذا يستلزم الالتزام بطبقة واحدة مقدماً. جرّب الـ prompt نفسه عبر الثلاث على Brievio، وقارن الأجوبة وأعداد التوكنات، ودع النتائج تختار الطبقة. بطاقة الأسعار الكاملة على صفحة الأسعار؛ وللاطلاع على الاستراتيجية الأوسع لعصر التكلفة دون خسارة الجودة، راجع دليل تحسين تكلفة الذكاء الاصطناعي ودليلنا إلى اختيار gateway لواجهة الذكاء الاصطناعي. التدرّج الجيد هو أكبر رافعة بين يديك — ولا يكلّف سوى نص موديل.