كيف خفّضت استهلاك OpenClaw للرموز 90% (أرخص النماذج بالداخل)

أظهر لي لوح تحكم OpenRouter أنني أنفقت 47 دولارًا قبل الغداء يوم الثلاثاء. كنت قد أنجزت ربما عشر مهام برمجية فقط — لا شيء مبالغ فيه، مجرد بعض إعادة الهيكلة وعدة إصلاحات للأخطاء. عندها أدركت أن الإعدادات الافتراضية في OpenClaw كانت تُمرّر بهدوء كل تفاعل، بما في ذلك نبضات الاتصال الخلفية، عبر Claude Opus بتكلفة تتجاوز 15 دولارًا لكل مليون رمز.

إذا صادفت مفاجآت مشابهة — وبحسب المنتديات، كثيرون صادفوها بالفعل ("أنا أصلًا أنفقت 40 دولارًا ولم أستخدمه كثيرًا حتى" كتب أحد المستخدمين) — فسيأخذك هذا الدليل عبر أسلوب التدقيق والتحسين الكامل الذي استخدمته لخفض إنفاقي الشهري بنحو 90%. ليس مجرد "التبديل إلى نموذج أرخص"، بل تفكيك منهجي لمواضع استهلاك الرموز فعلًا، وكيفية مراقبتها، والنماذج الاقتصادية التي تصمد أمام العمل الوكيلي الحقيقي، وثلاثة إعدادات جاهزة للنسخ واللصق يمكنك استخدامها اليوم. استغرق كل ذلك فترة بعد الظهر فقط.

ما هو استهلاك الرموز في OpenClaw ولماذا يرتفع بهذا الشكل افتراضيًا؟

الرموز هي وحدة الفوترة لكل تفاعل مع الذكاء الاصطناعي في OpenClaw. فكّر فيها كقطع نصية صغيرة — كل رمز يساوي تقريبًا 4 أحرف إنجليزية. كل رسالة ترسلها، وكل رد تتلقاه، وكل عملية خلفية تعمل: كلها تُحاسب بالرموز.

المشكلة أن إعدادات OpenClaw الافتراضية مضبوطة لأقصى قدرة، لا لأقل تكلفة. عند التثبيت، يكون النموذج الأساسي مضبوطًا على anthropic/claude-opus-4-5 — وهو أغلى خيار متاح. نبضات الاتصال؟ تعمل على Opus أيضًا. الوكلاء الفرعيون الذين يُنشأون للمهام الجانبية؟ أيضًا Opus. استخدام Opus في نبضة اتصال يشبه استئجار جراح أعصاب لوضع لاصق جراحي. صحيح أنه قادر تقنيًا، لكنه باهظ الثمن بشكل صادم.

معظم المستخدمين لا يدركون أنهم يدفعون أسعارًا فاخرة مقابل مهام خلفية تافهة. التهيئة الافتراضية تفترض عمليًا أنك تريد أفضل نموذج لكل شيء، طوال الوقت — وتفوتر لك ذلك وفقًا لهذا الافتراض.

لماذا خفض استهلاك OpenClaw للرموز يوفر أكثر من المال فقط

الفائدة الواضحة هي خفض التكاليف. لكن هناك مكاسب إضافية تتراكم مع الوقت.

النماذج الأرخص غالبًا أسرع. يعمل Gemini 2.5 Flash-Lite بسرعة تقارب مقابل نحو 51 في Opus — أي تحسن يقارب 4 مرات في كل تفاعل. أما GPT-OSS-120B على Cerebras فيصل إلى ، أي أسرع بنحو 35 مرة من Opus. وفي حلقة وكيلة تضم أكثر من 50 دورة استدعاء أدوات، يعني هذا الفرق في السرعة إنهاء المهمة خلال دقائق بدل انتظار زمن البدء الأول المؤلم في Opus والبالغ 13.6 ثانية في كل ذهاب وإياب.

كما تحصل على هامش أكبر قبل بلوغ حدود المعدل، وجلسات أقل خنقًا، ومساحة للتوسع دون أن يتوسع معها قلقك من الفاتورة.

المدخرات المتوقعة عبر أنماط استخدام مختلفة:

نوع المستخدم	الإنفاق الشهري المقدر (الافتراضي)	بعد التحسين الكامل	التوفير الشهري
خفيف (~10 استفسارات/يوم)	~$100	~$12	~88%
متوسط (~50 استفسار/يوم)	~$500	~$90	~82%
كثيف (~200+ استفسار/يوم)	~$1,750	~$220	~87%

هذه ليست أرقامًا نظرية. وثّق أحد المطورين انتقاله من — أي خفض حقيقي بنسبة 90% — عبر الجمع بين توجيه النماذج وإصلاحات الاستنزاف الخفية التي سنغطيها لاحقًا في هذا الدليل.

بنية استهلاك الرموز في OpenClaw: أين تذهب كل رمز فعليًا

هذا هو الجزء الذي تتجاهله أغلب أدلة التحسين، وهو الجزء الأهم فعلًا. لا يمكنك إصلاح ما لا تراه.

أين تذهب رموز OpenClaw فعليًا — تفصيل حسب المهمة

راجعت عدة جلسات وقارنتها مع وتفريغات المجتمع /context لبناء سجل رموز لمهمة برمجية واحدة نموذجية. فيما يلي أين ذهبت تقريبًا 20,000 رمز:

فئة الرموز	النسبة المعتادة من الإجمالي	مثال (مهمة برمجية واحدة)	هل يمكنك التحكم بها؟
تراكم السياق (إعادة إرسال سجل المحادثة في كل استدعاء)	~40–50%	~9,000 رمز	نعم — `/clear`، `/compact`، جلسات أقصر
تخزين مخرجات الأدوات (مخرجات shell وقراءة الملفات المحفوظة في السجل)	~20–30%	~5,000 رمز	نعم — قراءات أصغر، نطاق أدوات أضيق
إعادة إرسال الموجه النظامي (~15K أساسي)	~10–15%	~3,000 رمز	جزئيًا — قراءات ذاكرة مؤقتة بسعر 0.1x
الاستدلال متعدد الجولات (حلقات متسلسلة لاستدعاء الأدوات)	~10–15%	~2,500 رمز	اختيار النموذج + تحسين الموجهات
نبضات الاتصال / البقاء نشطًا	~5–10%	~1,500 رمز	نعم — تغيير في الإعدادات
استدعاءات الوكلاء الفرعيين	~5–10%	~1,500 رمز	نعم — توجيه النماذج

أكبر سلة على الإطلاق — تراكم السياق — هي إعادة إرسال سجل محادثتك مع كل استدعاء API. أظهر أحد وجود 185,400 رمز في سلة الرسائل وحدها، قبل أن يرد النموذج أصلًا. وأضاف الموجه النظامي والأدوات نحو 35,800 رمز أخرى كعبء ثابت فوق ذلك.

الخلاصة: إذا لم تكن تبدأ جلسات جديدة بين المهام غير المرتبطة، فأنت تدفع ثمن إعادة نقل كامل سجل محادثتك في كل مرة.

كيف تراقب استهلاك OpenClaw للرموز (لا يمكنك خفض ما لا تراه)

قبل تغيير أي شيء، عليك معرفة أين تذهب الرموز. القفز مباشرة إلى "استخدم نموذجًا أرخص" من دون مراقبة يشبه محاولة إنقاص الوزن من دون الوقوف يومًا على الميزان.

افحص لوحة OpenRouter الخاصة بك

إذا كنت تمرر الطلبات عبر OpenRouter، فإن هي أسهل لوحة جاهزة بلا إعدادات. يمكنك التصفية حسب النموذج، والمزوّد، ومفتاح API، والفترة الزمنية. كما تفصل واجهة Usage Accounting بين رموز الموجه والإكمال والاستدلال والرموز المخزنة في كل طلب. وهناك زر تصدير (CSV أو PDF) لتحليل أوسع مدى.

ما الذي تبحث عنه: أي نموذج استهلك أكبر عدد من الرموز، وهل تظهر طلبات نبضات الاتصال أو الوكلاء الفرعيين كبنود كبيرة بشكل غير متوقع.

راجع سجلات API المحلية

يخزن OpenClaw بيانات الجلسة في ~/.openclaw/agents.main/sessions/sessions.json، والتي تتضمن totalTokens لكل جلسة. يمكنك أيضًا تشغيل openclaw logs --follow --json للحصول على سجل لحظي لكل طلب.

ملاحظة مهمة: ، لذلك قد تعرض اللوحة قيمًا قديمة قبل الضغط. اعتمد على /status و /context detail أكثر من الإجماليات المخزنة.

استخدم أدوات تتبع خارجية (للمستخدمين المتوسطين إلى الكثيفين)

يوفر LiteLLM proxy نقطة نهاية متوافقة مع OpenAI أمام أكثر من 100 مزود، ويقوم . الميزة الأهم: ميزانيات صارمة لكل مفتاح تبقى فعالة حتى بعد /clear — فلا يمكن لوكيل فرعي منفلت تجاوز السقف الذي حددته.

أما Helicone فهو أبسط من ذلك — مجرد يمنحك عرض Sessions يجمع الطلبات المرتبطة معًا. أي طلب من نوع "أصلح هذا الخطأ" يتفرع إلى 8 استدعاءات فرعية أو أكثر سيظهر كسطر جلسة واحد مع التكلفة الحقيقية الإجمالية. .

فحوصات سريعة داخل OpenClaw

للمراقبة اليومية، تكفي أربعة أوامر داخل الجلسة:

/status — يعرض استخدام السياق، وآخر رموز إدخال/إخراج، والتكلفة التقديرية
/usage full — تذييل استخدام لكل رد
/context detail — تفصيل الرموز حسب الملف والمهارة والأداة
/compact [guidance] — فرض الضغط/الاختصار مع عبارة تركيز اختيارية

شغّل /context detail قبل وبعد تغيير الإعدادات. هكذا تعرف إن كانت تحسيناتك قد أثمرت فعلًا.

المواجهة بين أرخص نماذج OpenClaw: أي النماذج الاقتصادية تصلح فعلًا للعمل الوكيلي؟

تخطئ أغلب الأدلة هنا. تعرض جدول أسعار، وتشير إلى الصف الأرخص، ثم تنتهي. المقاييس المختبرية لا تتنبأ بالأداء الحقيقي في المهام الوكيلة — وهي نقطة تكررها آراء المجتمع كثيرًا وبصوت عالٍ. وكما قال أحد المستخدمين: "المعايير لا تنصف فهم أيها يعمل أفضل في الذكاء الاصطناعي الوكيلي."

الفكرة الحاسمة: أرخص نموذج ليس دائمًا أرخص نتيجة. النموذج الذي يفشل ويعيد المحاولة أربع مرات يكلف أكثر من نموذج متوسط . في أنظمة الوكلاء الإنتاجية، احسب — وإذا كانت خمس استدعاءات LLM متسلسلة وفشلَت الخطوة الرابعة، فإن إعادة المحاولة الساذجة تعيد تشغيل الخطوات الخمس كلها.

فيما يلي مصفوفة القدرات الخاصة بي، مع "درجة وكيلية حقيقية" مبنية على تقارير المستخدمين الفعلية بدلًا من المقاييس الاصطناعية:

النموذج	سعر الإدخال/1م	سعر الإخراج/1م	موثوقية استدعاء الأدوات	الاستدلال متعدد الخطوات	الدرجة الوكيلة الحقيقية (1–5)	الأفضل لـ
Gemini 2.5 Flash-Lite	$0.10	$0.40	متذبذب — حلقات أحيانًا	أساسي	⭐2.5	نبضات الاتصال، عمليات البحث البسيطة
GPT-OSS-120B	$0.04	$0.19	مقبول	مقبول	⭐3.0	التجارب منخفضة التكلفة، والمهام الحساسة للسرعة
DeepSeek V3.2	$0.26	$0.38	غير ثابت (6 مشكلات مفتوحة)	جيد	⭐3.0	الاستدلال الثقيل، مع الحد الأدنى من استدعاء الأدوات
Kimi K2.5	$0.38	$1.72	جيد (عبر :exacto)	مقبول	⭐3.5	البرمجة البسيطة إلى المتوسطة
MiniMax M2.5 / M2.7	$0.28	$1.10	جيد	جيد	⭐4.0	نموذجك اليومي العام للبرمجة
Claude Haiku 4.5	$1.00	$5.00	ممتاز	جيد	⭐4.5	بديل وسطي موثوق
Claude Sonnet 4.6	$3.00	$15.00	ممتاز	ممتاز	⭐5.0	المهام المعقدة متعددة الخطوات
Claude Opus 4.5/4.6	$5.00	$15.00	ممتاز	ممتاز	⭐5.0	احتفظ به لأصعب المشاكل فقط

تحذير بشأن DeepSeek وGemini Flash في استدعاء الأدوات

يبدو DeepSeek V3.2 ممتازًا على الورق — 72–74% على ، وأرخص من Sonnet بنحو 11–36 مرة. لكن عمليًا، توثق عبر Cline وRoo Code وContinue وNVIDIA NIM سلوكًا معطوبًا في استدعاء الأدوات. وحكم Composio في المواجهة المباشرة: "." أما عبارة Zvi Mowshowitz المختصرة فكانت: "."

ولدى Gemini 2.5 Flash فجوة مشابهة. إذ يبدأ موضوع في منتدى Google AI Developers بعنوان "Very frustrating experience with Gemini 2.5 function calling performance" بعبارة: "."

وأشار OpenRouter إلى فارق مهم: "." إذا كنت تمرر النماذج الرخيصة عبر OpenRouter، فابحث عن الوسم :exacto — لأن تبديل المزود بصمت قد يحوّل نموذجًا رخيصًا وموثوقًا إلى حلقة إعادة محاولة مكلفة بين ليلة وضحاها.

متى تستخدم كل نموذج

Gemini Flash-Lite: نبضات الاتصال، إبقاء الجلسة نشطة، الأسئلة والأجوبة البسيطة. لا يُستخدم أبدًا لاستدعاء أدوات متعدد الخطوات.
MiniMax M2.5/M2.7: نموذجك اليومي للمهام البرمجية العامة. وبسعر أقل بكثير من Sonnet.
Claude Haiku 4.5: البديل الموثوق عندما تتعثر النماذج الرخيصة في استدعاء الأدوات. موثوقية ممتازة في استدعاء الأدوات وبسعر أقل بنحو 3 مرات من Sonnet.
Claude Sonnet 4.6: الأعمال الوكيلة المعقدة متعددة الخطوات. هنا تحصل على قيمة أموالك.
Claude Opus: احتفظ به لأصعب المشكلات فقط. لا تجعله النموذج الافتراضي لأي شيء.

(تتغير الأسعار كثيرًا — تحقق من الأسعار الحالية على أو صفحات المزوّدين مباشرة قبل تثبيت أي إعداد.)

استنزاف الرموز الخفي الذي تتجاهله معظم الأدلة

يذكر مستخدمون في المنتديات أن تعطيل بعض الميزات يخفف التكاليف بشكل كبير، لكن لم أجد دليلًا يجمع كل مصادر الاستنزاف الخفية مع أثرها الحقيقي على الرموز. فيما يلي التفكيك الكامل:

مصدر الاستنزاف الخفي	تكلفة الرموز لكل مرة	طريقة الإصلاح	مفتاح الإعداد
نبضات الاتصال الافتراضية على Opus	~100,000 رمز/تشغيل دون عزل	تجاوز إلى Haiku + isolatedSession	`heartbeat.model`, `heartbeat.isolatedSession: true`
إنشاء وكلاء فرعيين	~20,000 رمز لكل إنشاء قبل أي عمل	توجيه الوكلاء الفرعيين إلى Haiku	`subagents.model`
تحميل سياق قاعدة الشيفرة كاملة	~3,000–15,000 رمز لكل استكشاف تلقائي	`.clawignore` لـ node_modules وdist وملفات القفل	`.clawrules` + `.clawignore`
التلخيص التلقائي للذاكرة	~500–2,000 رمز/جلسة	تعطيل أو تقليل التكرار	`memory: false` أو `memory.max_context_tokens`
تراكم سجل المحادثة	~500+ رمز/دورة (تراكمي)	ابدأ جلسة جديدة بين المهام غير المرتبطة	الانضباط في `/clear`
عبء أدوات خوادم MCP	~7,000 رمز لأربعة خوادم؛ وأكثر من 50,000 لخمسة أو أكثر	اجعل MCP في الحد الأدنى	إزالة MCP غير المستخدم
تهيئة المهارات/الإضافات	200–1,000 رمز لكل مهارة محمّلة	تعطيل المهارات غير المستخدمة	`skills.entries.<name>.enabled: false`
فرق الوكلاء (وضع التخطيط)	~7x تكلفة الجلسة القياسية	استخدمه فقط للعمل المتوازي الحقيقي	الأفضل التسلسل

يستحق استنزاف نبضات الاتصال إشارة خاصة. افتراضيًا، تُرسل نبضات الاتصال على النموذج الأساسي (Opus) كل 30 دقيقة. ضبط isolatedSession: true يخفض ذلك من نحو ~100,000 رمز لكل تشغيل — أي خفض بنسبة 95–98% في هذا البند وحده.

ثلاثة مكاسب سريعة توفر أكبر قدر من الرموز في أقل من دقيقتين

كلها منخفضة المخاطر وتستغرق أقل من دقيقتين:

/clear بين المهام غير المرتبطة (5 ثوانٍ). هذا أكبر توفير منفرد للرموز. يتفق معظم المستخدمين على أنه يحقق بمجرد مسح سجل الجلسة قبل بدء عمل جديد. تذكر سلة Messages ذات الـ 185 ألف رمز في تفريغ /context؟ /clear يمحوها.
/model haiku-4.5 للأعمال الروتينية (10 ثوانٍ). يحقق تبديل النموذج تكتيكيًا في المهام اليومية. يتعامل Haiku جيدًا مع معظم مهام البرمجة المباشرة، وقراءات الملفات، ورسائل الكوميت.
قلّص .clawrules إلى أقل من 200 سطر + أضف .clawignore (90 ثانية). ملف القواعد يُحمّل مع كل رسالة. عند 200 سطر فهذا يقارب ~1,500–2,000 رمز لكل دورة؛ وعند 1,000 سطر يصبح 8,000–10,000 رمز تُفرض على كل طلب دائمًا. ومع .clawignore الذي يستبعد node_modules/ وdist/ وملفات القفل والكود المُولّد، يدّعي أحد المطورين من هذا الانضباط وحده.

خطوة بخطوة: ثلاثة إعدادات جاهزة لخفض استهلاك OpenClaw للرموز

الإنفاق الشهري في OpenClaw — الافتراضي مقابل الإعدادات المحسّنة

فيما يلي ثلاث تهيئات كاملة ومشروحة لـ openclaw.json — تبدأ من "مجرد توفير المال" وتنتهي بـ "مجموعة التحسين الكاملة". كل واحدة تتضمن تعليقات داخلية وتقديرات تكلفة شهرية.

قبل أن تبدأ:

مستوى الصعوبة: مبتدئ (الإعداد A) → متوسط (الإعداد B) → متقدم (الإعداد C)
الوقت المطلوب: ~5 دقائق للإعداد A، ~15 دقيقة للإعداد C
ما ستحتاجه: تثبيت OpenClaw، ومحرر نصوص، والوصول إلى ~/.openclaw/openclaw.json

الإعداد A: مبتدئ — فقط وفّر المال

خمسة أسطر. بلا تعقيد. يستبدل النموذج الافتراضي من Opus إلى Sonnet، ويعطّل عبء الذاكرة، ويعزل نبضات الاتصال إلى Haiku.

1// ~/.openclaw/openclaw.json
2{
3  "agents": {
4    "defaults": {
5      "model": { "primary": "anthropic/claude-sonnet-4-6" },  // كان Opus — توفير فوري 3-5x
6      "heartbeat": {
7        "every": "55m",                // يطابق TTL للذاكرة المؤقتة لمدة ساعة لأقصى عدد من الضربات
8        "model": "anthropic/claude-haiku-4-5",  // Haiku للنبضات، لا Opus
9        "isolatedSession": true        // ~100k → 2-5k رمز لكل تشغيل
10      }
11    }
12  },
13  "memory": { "enabled": false }       // يوفر ~500-2k رمز/جلسة
14}

ما الذي يجب أن تراه بعد تطبيقه: شغّل /status قبل وبعد. ينبغي أن تنخفض تكلفة كل طلب بشكل ملحوظ، كما يجب أن تظهر إدخالات نبضات الاتصال في صفحة Activity الخاصة بـ OpenRouter على أنها Haiku بدلًا من Opus.

فئة الاستخدام	الافتراضي (Opus)	الإعداد A (Sonnet + نبضات Haiku)	التوفير
خفيف (~10 استفسارات/يوم)	~$100	~$35	65%
متوسط (~50 استفسار/يوم)	~$500	~$250	50%
كثيف (~200 استفسار/يوم)	~$1,750	~$900	49%

الإعداد B: متوسط — توجيه ذكي بثلاث طبقات

Sonnet الأساسي للعمل الحقيقي. Haiku للوكلاء الفرعيين والضغط/الاختصار. Gemini Flash-Lite كخيار اقتصادي احتياطي عند خنق Claude. سلاسل البديل تتعامل تلقائيًا مع انقطاعات المزوّد.

1{
2  "agents": {
3    "defaults": {
4      "model": {
5        "primary": "anthropic/claude-sonnet-4-6",
6        "fallbacks": [
7          "anthropic/claude-haiku-4-5",       // إذا تم خنق Sonnet
8          "google/gemini-2.5-flash-lite"      // آخر ملاذ رخيص جدًا
9        ]
10      },
11      "models": {
12        "anthropic/claude-sonnet-4-6": {
13          "params": { "cacheControlTtl": "1h", "maxTokens": 8192 }
14        }
15      },
16      "heartbeat": {
17        "every": "55m",                       // 55 دقيقة &lt; TTL ساعة = ضربات ذاكرة مؤقتة
18        "model": "google/gemini-2.5-flash-lite",  // بنسات فقط لكل نبضة
19        "isolatedSession": true,
20        "lightContext": true                   // سياق minimal في طلبات heartbeat
21      },
22      "subagents": {
23        "maxConcurrent": 4,                   // بدلًا من 8 افتراضيًا
24        "model": "anthropic/claude-haiku-4-5" // لا يحتاج الوكلاء الفرعيون إلى Sonnet
25      },
26      "compaction": {
27        "mode": "safeguard",
28        "model": "anthropic/claude-haiku-4-5", // تلخيص الضغط عبر Haiku
29        "memoryFlush": { "enabled": true }
30      }
31    }
32  }
33}

النتيجة المتوقعة: ينبغي أن تظهر استدعاءات الوكلاء الفرعيين في سجلاتك بأسعار Haiku. يجب أن تكون نبضات الاتصال شبه مجانية. وسلسلة البديل تعني أن تعطل Claude لن يوقف جلستك — بل يتدهور بسلاسة إلى Gemini.

فئة الاستخدام	الافتراضي	الإعداد B	التوفير
خفيف	~$100	~$20	80%
متوسط	~$500	~$150	70%
كثيف	~$1,750	~$500	71%

الإعداد C: للمحترفين — حزمة التحسين الكاملة

تعيين نموذج لكل وكيل فرعي، وضغط السياق مثبت على Haiku، وتوجيه الرؤية إلى Gemini Flash، و.clawrules + .clawignore ضيقان، وتعطيل المهارات غير المستخدمة. هذا هو الإعداد الذي يوصلك إلى نطاق التوفير 85–90%.

1{
2  "agents": {
3    "defaults": {
4      "workspace": "~/clawd",
5      "model": {
6        "primary": "anthropic/claude-sonnet-4-6",
7        "fallbacks": [
8          "openrouter/anthropic/claude-sonnet-4-6",  // مزود مختلف كنسخة احتياطية
9          "minimax/minimax-m2-7",                     // بديل يومي رخيص
10          "anthropic/claude-haiku-4-5"                // آخر ملاذ
11        ]
12      },
13      "models": {
14        "anthropic/claude-sonnet-4-6": {
15          "params": { "cacheControlTtl": "1h", "maxTokens": 8192 }
16        },
17        "minimax/minimax-m2-7": {
18          "params": { "maxTokens": 8192 }
19        }
20      },
21      "heartbeat": {
22        "every": "55m",
23        "model": "google/gemini-2.5-flash-lite",
24        "isolatedSession": true,
25        "lightContext": true,
26        "activeHours": "09:00-19:00"           // لا نبضات خلال الليل
27      },
28      "subagents": {
29        "maxConcurrent": 4,
30        "model": "anthropic/claude-haiku-4-5"
31      },
32      "contextPruning": { "mode": "cache-ttl", "ttl": "1h" },
33      "compaction": {
34        "mode": "safeguard",
35        "model": "anthropic/claude-haiku-4-5",
36        "identifierPolicy": "strict",
37        "memoryFlush": { "enabled": true }
38      },
39      "bootstrapMaxChars": 12000,              // بدلًا من 20000 الافتراضي
40      "imageModel": "google/gemini-3-flash"    // مهام الرؤية عبر نموذج رخيص
41    }
42  },
43  "memory": { "enabled": true, "max_context_tokens": 800 },  // ذاكرة minimal
44  "skills": {
45    "entries": {
46      "web-search":       { "enabled": false },
47      "image-generation": { "enabled": false },
48      "audio-transcribe": { "enabled": false }
49    }
50  }
51}

مثال تجاوز لكل وكيل فرعي — الصقه في ~/.openclaw/agents/lint-runner/SOUL.md:

1---
2name: lint-runner
3description: Runs lint/format checks and applies trivial fixes
4tools: [Bash, Read, Edit]
5model: anthropic/claude-haiku-4-5
6---

أقل ملف .clawignore ممكن — هذا وحده يقلص عمليات الإقلاع النموذجية من 150 ألف حرف إلى نحو 30–50 ألفًا:

1node_modules/
2dist/
3build/
4.next/
5coverage/
6.venv/
7vendor/
8*.lock
9package-lock.json
10yarn.lock
11pnpm-lock.yaml
12*.min.js
13*.min.css
14**/__snapshots__/
15**/*.snap

فئة الاستخدام	الافتراضي	الإعداد C	التوفير
خفيف	~$100	~$12	88%
متوسط	~$500	~$90	82%
كثيف	~$1,750	~$220	87%

هذه الأرقام تتماشى مع تقريري مستخدمين مستقلين: ما وثقه Praney Behl من (خفض 90%)، ودراسات حالة LaoZhang التي أظهرت مع تحسين جزئي.

استخدام أمر `/model` للتحكم في استهلاك OpenClaw للرموز أثناء العمل

يبدّل أمر /model النموذج النشط للدورة التالية مع الحفاظ على سياق محادثتك — لا إعادة ضبط، ولا فقدان للتاريخ. هذه هي العادة اليومية التي تتراكم آثارها الإيجابية بمرور الوقت.

سير العمل العملي:

تعمل على إعادة هيكلة متعددة الملفات ومعقدة؟ ابقَ على Sonnet.
سؤال سريع: "ماذا يفعل هذا التعبير النمطي؟" استخدم /model haiku، اطرح سؤالك، ثم /model sonnet للعودة.
رسالة commit أو تحسين نص؟ /model flash-lite وانتهى.

يمكنك إعداد اختصارات في openclaw.json تحت commands.aliases لربط الأسماء القصيرة (haiku، sonnet، opus، flash) بسلاسل المزوّد الكاملة. هذا يوفر عدة نقرات في كل تبديل.

الحسبة: 50 استفسارًا يوميًا على Sonnet تعني تقريبًا 3 دولارات يوميًا. أما توزيع 50 استفسارًا يوميًا بنسبة 70/20/10 بين Haiku/Sonnet/Opus فيساوي تقريبًا 1.10 دولار يوميًا. وعلى مدار شهر، هذا يعني 90 دولارًا مقابل 33 دولارًا — أرخص بنسبة 63% من دون تغيير الأدوات، فقط العادات.

مكافأة: تتبع أسعار نماذج OpenClaw عبر المزوّدين باستخدام Thunderbit

مع هذا العدد الكبير من النماذج والمزوّدين — OpenRouter، وواجهة Anthropic المباشرة، وGoogle AI Studio، وDeepSeek، وMiniMax — تتغير الأسعار باستمرار. خفّضت Anthropic سعر إخراج Opus بنحو 67% بين ليلة وضحاها. كما قلصت Google حدود الخطة المجانية لـ Gemini في ديسمبر 2025. ومطاردة جدول أسعار ثابت يدويًا معركة خاسرة.

يحل هذه المشكلة من دون أي كود scraping. إنه تعمل كـ AI web scraper، ومصممة بالضبط لهذا النوع من استخراج البيانات المنظم.

سير العمل الذي أستخدمه:

افتح صفحة النماذج في OpenRouter داخل Chrome ثم اضغط "AI Suggest Fields" في Thunderbit. سيقرأ الصفحة ويقترح الأعمدة — اسم النموذج، سعر الإدخال، سعر الإخراج، نافذة السياق، المزوّد.
اضغط Scrape، ثم صدّر مباشرة إلى Google Sheets.
أعد جدولة scraping تلقائيًا بلغة بسيطة — "كل يوم اثنين الساعة 9 صباحًا، أعد استخراج قائمة نماذج OpenRouter" — وسيعمل في السحابة تلقائيًا.

بعد ذلك، سيتحدث متتبع الأسعار الشخصي من تلقاء نفسه. أي نموذج تنخفض أسعاره فجأة بنسبة 30% — أو أي مزوّد يظهر عليه وسم Exacto — سيظهر في جدول صباح الاثنين من دون أن ترفع إصبعًا. كتبنا المزيد عن في مدونتنا.

هل تقارن الأسعار عبر صفحات المزوّدين المباشرة (Anthropic، Google، DeepSeek)؟ يعتمد scraping المتفرعات في Thunderbit على تتبع كل رابط نموذج إلى صفحة التفاصيل وجلب الأسعار لكل مزوّد — وهو مفيد عندما تريد معرفة ما إذا كان تمرير Kimi K2.5 عبر OpenRouter أرخص من الذهاب مباشرة عبر . راجع لمعرفة الخطة المجانية وتفاصيل الباقات.

أهم النقاط لخفض استهلاك OpenClaw للرموز

المنهجية: افهم → راقب → وجّه → حسّن.

أعلى الإجراءات أثرًا، مرتبة:

لا تجعل Opus هو الافتراضي. بدّل النموذج الأساسي إلى Sonnet أو MiniMax M2.7. هذا وحده يخفض التكلفة 3–5 مرات.
اعزل نبضات الاتصال. اضبط isolatedSession: true ووجّه نبضات الاتصال إلى Gemini Flash-Lite. هذا يحوّل استنزافًا يقارب 100 ألف رمز إلى نحو 2–5 آلاف.
وجّه الوكلاء الفرعيين إلى Haiku. كل إنشاء جديد يحمّل نحو 20 ألف رمز من السياق قبل أن يبدأ العمل. لا تدع ذلك يحدث على Opus.
استخدم /clear بانتظام. مجاني، يستغرق 5 ثوانٍ، وإجماع المجتمع أنه يوفر أكثر من أي إجراء منفرد آخر.
أضف .clawignore. استبعاد node_modules وملفات القفل ومخرجات البناء يقلص سياق الإقلاع بشكل كبير.
راقب بـ /context detail قبل وبعد التغييرات. إذا لم تستطع قياسه، فلن تستطيع تحسينه.

أرخص نموذج يعتمد على المهمة. Gemini Flash-Lite لنبضات الاتصال. MiniMax M2.7 للبرمجة اليومية. Haiku لاستدعاء الأدوات الموثوق. Sonnet للأعمال المعقدة متعددة الخطوات. Opus لأصعب المشكلات فعلًا — ولا شيء غير ذلك.

يمكن لمعظم القراء رؤية توفير 50–70% في فترة بعد ظهر واحدة باستخدام Config A أو B. أما الوصول الكامل إلى 85–90% فيتطلب تجميع كل ما سبق — توجيه النماذج، إصلاحات الاستنزاف الخفي، .clawignore، والانضباط في الجلسات — لكنه قابل للتحقيق، ويستمر أثره.

الأسئلة الشائعة

1. كم تبلغ تكلفة OpenClaw شهريًا؟

يعتمد ذلك بالكامل على إعدادك، وحجم الاستخدام، واختياراتك للنماذج. المستخدمون الخفيفون (~10 استفسارات/يوم) ينفقون عادة 5–30 دولارًا شهريًا مع التحسين، أو أكثر من 100 دولار على الإعدادات الافتراضية. المستخدمون المتوسطون (~50 استفسار/يوم) يتراوح إنفاقهم بين 90–400 دولار شهريًا. أما المستخدمون الكثيفون فقد يصلون إلى على الإعدادات الافتراضية — وكانت إحدى الحالات الموثقة الشديدة 5,623 دولارًا في شهر واحد. وتشير Telemetry الداخلية لدى Anthropic نفسها إلى وسيط .

2. ما أرخص نموذج في OpenClaw ما زال مناسبًا للبرمجة؟

هو أفضل خيار يومي عام — موثوقية جيدة في استدعاء الأدوات، وSWE-Pro 56.22، بسعر يقارب $0.28/$1.10 لكل مليون رمز. أما لنبضات الاتصال والعمليات البسيطة، فـ Gemini 2.5 Flash-Lite بسعر $0.10/$0.40 صعب المنافسة. وClaude Haiku 4.5 بسعر $1/$5 هو البديل الوسطي الموثوق عندما تحتاج استدعاء أدوات ممتازًا من دون دفع أسعار Sonnet.

3. هل يمكنني استخدام نماذج الخطة المجانية مع OpenClaw؟

نعم تقنيًا. GPT-OSS-120B مجاني عبر وسم :free في OpenRouter وعبر NVIDIA Build. وGemini Flash-Lite لديه خطة مجانية (15 طلبًا في الدقيقة، و1,000 طلب يوميًا). كما يمنح DeepSeek . لكن الخطط المجانية تأتي مع حدود معدل صارمة، وسرعات أبطأ، وتوافر غير مضمون. النماذج المدفوعة الرخيصة — ببضعة بنسات لكل مليون رمز — أكثر موثوقية بكثير للاستخدام المنتظم.

4. هل يؤدي تبديل النماذج أثناء المحادثة عبر /model إلى فقدان السياق؟

لا. يحافظ /model على كامل سياق الجلسة — وتُوجَّه الدورة التالية إلى النموذج الجديد مع بقاء السجل كاملًا. هذا موثق في مفاهيم OpenClaw ويعمل بالطريقة نفسها في Claude Code. يمكنك التبديل بحرية بين Haiku للأسئلة السريعة وSonnet للأعمال المعقدة من دون فقدان أي شيء.

5. ما أسرع طريقة لتقليل فاتورة OpenClaw اليوم؟

اكتب /clear بين المهام غير المرتبطة. إنه مجاني، ويستغرق خمس ثوانٍ، ويمسح سجل المحادثة الذي يُعاد إرساله مع كل استدعاء API. أظهرت جلسة حقيقية واحدة وجود من سجل الرسائل المتراكم — وكان يُعاد نقله وإعادة فوترةه في كل دورة. مسح ذلك قبل بدء عمل جديد هو أعلى عادة من حيث العائد على الجهد.

جرّب Thunderbit لاستخراج بيانات الويب بالذكاء الاصطناعي

استخرج البيانات باستخدام الذكاء الاصطناعي

انقل البيانات بسهولة إلى Google Sheets أو Airtable أو Notion

Chrome Store Rating

PRODUCT HUNT#1 Product of the Week