Kuinka vähensin OpenClaw token-käyttöä 90 % (sisällä halvimmat mallit)

OpenRouterin hallintapaneelissa näkyi tiistaina ennen lounasta jo 47 dollarin kulutus. Olin tehnyt ehkä tusinan verran koodaustehtäviä — ei mitään hurjaa, lähinnä refaktorointia ja muutaman bugikorjauksen. Silloin tajusin, että OpenClawin oletusasetukset ohjasivat huomaamatta jokaisen yksittäisen vuorovaikutuksen, myös taustalla pyörivät heartbeat-pingit, Claude Opusin kautta, jonka hinta on yli 15 dollaria miljoonaa tokenia kohden.

Jos olet törmännyt vastaaviin yllätyksiin — ja foorumikeskustelujen perusteella moni on ("Olen jo käyttänyt 40 dollaria, enkä edes käytä sitä paljoa", kirjoitti eräs käyttäjä) — tämä opas käy läpi koko auditointi- ja optimointitavan, jolla sain kuukausikuluni alas noin 90 %. Ei pelkästään "vaihda halvempaan malliin", vaan järjestelmällinen purku siitä, mihin tokenit oikeasti kuluvat, miten niitä seurataan, mitkä budjettimallit kestävät oikeaa agenttityötä ja kolme valmista kopioi-liitä -konfiguraatiota, joita voit käyttää heti. Koko homma vei yhden iltapäivän.

Mitä OpenClaw token-käyttö on (ja miksi se on oletuksena niin korkea)?

Tokenit ovat OpenClawin jokaisen AI-vuorovaikutuksen laskutusyksikkö. Ajattele niitä pieninä tekstipaloina — suunnilleen 4 englanninkielistä merkkiä per token. Jokainen lähettämäsi viesti, jokainen vastaanottamasi vastaus ja jokainen taustaprosessi laskutetaan tokeneina.

Ongelma on siinä, että OpenClawin oletukset on viritetty maksimaaliseen suorituskykyyn, ei minimikustannuksiin. Valmiiksi käytössä oleva päämalli on anthropic/claude-opus-4-5 — eli kallein saatavilla oleva vaihtoehto. Heartbeat-pingit? Nekin ajetaan Opusilla. Sivutehtäviä hoitavat alitason agentit? Myös Opusilla. Opusin käyttäminen heartbeat-pingiin on vähän kuin palkkaisi neurokirurgin liimaamaan laastarin. Teknisesti mahdollista, taloudellisesti järjetöntä.

Useimmat käyttäjät eivät huomaa maksavansa premium-hintaa mitättömistä taustatehtävistä. Oletuskonfiguraatio käytännössä olettaa, että haluat parhaan mallin kaikkeen, koko ajan — ja laskuttaa sen mukaisesti.

Miksi OpenClaw token-käytön vähentäminen säästää muutakin kuin rahaa

Ilmeisin hyöty on kustannussäästö. Mutta mukana tulee muitakin etuja, jotka kasvavat ajan myötä.

Halvemmat mallit ovat usein nopeampia. Gemini 2.5 Flash-Lite toimii noin verrattuna Opusin noin 51 tokeniin sekunnissa — eli noin 4x nopeampi jokaisessa vuorovaikutuksessa. GPT-OSS-120B Cerebrasilla yltää , mikä on noin 35x nopeampi kuin Opus. Agenttisessa silmukassa, jossa on yli 50 työkalukutsukierrosta, tuo nopeusero tarkoittaa minuuteissa valmistumista sen sijaan, että odottaisit Opusin tuskallista 13,6 sekunnin time-to-first-token -viivettä jokaisella kierroksella.

Saat myös enemmän pelivaraa ennen rate limit -rajoihin osumista, vähemmän throttlettuja sessioita ja tilaa skaalata käyttöä ilman että lasku alkaa ahdistaa.

Arvioidut säästöt eri käyttöprofiileilla:

Käyttäjäprofiili	Arvioitu kuukausikulu (oletus)	Täyden optimoinnin jälkeen	Kuukausisäästö
Kevyt (~10 kyselyä/päivä)	~100 $	~12 $	~88 %
Keskimääräinen (~50 kyselyä/päivä)	~500 $	~90 $	~82 %
Raskas (~200+ kyselyä/päivä)	~1 750 $	~220 $	~87 %

Nämä eivät ole hypoteettisia. Yksi kehittäjä dokumentoi siirtymän — aito 90 % leikkaus — yhdistämällä mallireitityksen ja myöhemmin tässä oppaassa käsiteltävät piilovuotokorjaukset.

OpenClaw token-käytön anatomia: mihin jokainen token oikeasti kuluu

Tämä on se osa, jonka useimmat optimointioppaat ohittavat, ja juuri se osa, jolla on eniten merkitystä. Et voi korjata sitä, mitä et näe.

Mihin OpenClaw-tokenit oikeasti menevät — tehtäväkohtainen erittely

Auditoimme useita sessioita ja ristiin tarkistimme ne sekä yhteisön /context-dumppauksiin rakentaaksemme token-tilinpidon tyypilliselle yksittäiselle koodaustehtävälle. Suunnilleen 20 000 tokenia meni todellisuudessa näin:

Tokenikategoria	Tyypillinen osuus kokonaismäärästä	Esimerkki (1 koodaustehtävä)	Voitko hallita sitä?
Kontekstin kertyminen (keskusteluhistoria lähetetään uudelleen jokaisella kutsulla)	~40–50 %	~9 000 tokenia	Kyllä — `/clear`, `/compact`, lyhyemmät sessiot
Työkalujen tulosten tallennus (shell-output, tiedostoluvut pidetään historiassa)	~20–30 %	~5 000 tokenia	Kyllä — pienemmät lukuoperaatiot, tiukempi työkalujen rajaus
Järjestelmäpromptin uudelleenlähetys (~15K peruspohja)	~10–15 %	~3 000 tokenia	Osittain — cache-lukemat 0,1x-hinnalla
Monivaiheinen päättely (ketjutetut työkalukutsusilmukat)	~10–15 %	~2 500 tokenia	Mallivalinta + paremmat promptit
Heartbeat- / keep-alive -pingit	~5–10 %	~1 500 tokenia	Kyllä — asetusten muutos
Aliagenttikutsut	~5–10 %	~1 500 tokenia	Kyllä — mallireititys

Yksittäinen suurin lohko — kontekstin kertyminen — on se, että keskusteluhistoriasi lähetetään uudelleen jokaisella API-kutsulla. Yksi näytti 185 400 tokenia Messages-bucketissa jo ennen kuin malli oli ehtinyt vastata. Järjestelmäprompti ja työkalut lisäsivät siihen vielä noin 35 800 tokenin kiinteän ylikuorman.

Johtopäätös: jos et tyhjennä sessioita toisistaan riippumattomien tehtävien välillä, maksat koko keskusteluhistoriasi uudelleenlähetyksestä jokaisella kierroksella.

Näin seuraat OpenClaw token-käyttöä (et voi leikata sitä, mitä et näe)

Ennen kuin muutat mitään, hanki näkyvyys siihen, minne tokenisi menevät. Suoraan "käytä halvempaa mallia" -ratkaisuun hyppääminen ilman seurantaa on kuin yrittäisi laihduttaa koskaan vaa'alla käymättä.

Tarkista OpenRouterin hallintapaneeli

Jos reitität OpenRouterin kautta, on helpoin ilman käyttöönottoa toimiva näkymä. Voit suodattaa mallin, palveluntarjoajan, API-avaimen ja aikajakson mukaan. Usage Accounting -näkymä erittelee prompt-, completion-, reasoning- ja cached-tokenit jokaiselle pyynnölle. Pidemmän aikavälin analyysiin löytyy Export-painike (CSV tai PDF).

Mitä kannattaa etsiä: mikä malli kulutti eniten tokeneita, ja näkyvätkö heartbeat- tai aliagenttipyynnöt yllättävän suurina kuluerinä.

Tarkista paikalliset API-lokit

OpenClaw tallentaa istuntotiedot tiedostoon ~/.openclaw/agents.main/sessions/sessions.json, jossa on totalTokens per sessio. Voit myös ajaa openclaw logs --follow --json saadaksesi reaaliaikaisen lokituksen jokaiselle pyynnölle.

Yksi huomionarvoinen rajoite: , joten hallintapaneeli voi näyttää vanhentuneita arvoja ennen kompaktiota. Luota /status- ja /context detail -komentoihin enemmän kuin tallennettuihin summiin.

Käytä kolmannen osapuolen seurantaa (keskisuurille ja raskaille käyttäjille)

LiteLLM proxy tarjoaa OpenAI-yhteensopivan endpointin yli 100 palveluntarjoajan eteen ja . Sen paras ominaisuus: kiinteät budjetit per avain, jotka säilyvät /clear-tyhjennyksestä huolimatta — karannut aliagentti ei voi ylittää asettamaasi kattoa.

Helicone on vielä yksinkertaisempi — , joka antaa Sessions-näkymän ja ryhmittelee siihen liittyvät pyynnöt. Yksi "korjaa tämä bugi" -prompti, joka haarautuu 8+ aliagenttikutsuun, näkyy yhtenä sessiona, jonka todellinen kokonaiskustannus on helposti nähtävissä. .

Nopeat tarkistukset suoraan OpenClawissa

Päivittäiseen seurantaan riittää neljä istunnon sisäistä komentoa:

/status — näyttää kontekstin käytön, viimeisimmät input/output-tokenit ja arvioidun hinnan
/usage full — per-vastaus usage-footer
/context detail — tiedosto-, taito- ja työkalukohtainen token-erittely
/compact [ohje] — pakota kompaktio ja lisää halutessa kohdistava ohjeteksti

Aja /context detail ennen ja jälkeen asetusten muutosten. Sillä varmistat, toimivatko optimointisi oikeasti.

OpenClawin halvin malli -vertailu: mitkä budjetti-LLM:t oikeasti pärjäävät agenttitöissä

Useimmat oppaat menevät tässä kohtaa pieleen. Ne näyttävät hintataulukon, osoittavat halvinta riviä ja toteavat asian sillä käsitellyksi. Benchmarkit eivät ennusta todellista agenttisuorituskykyä — ja yhteisö on sanonut tämän ääneen moneen kertaan. Kuten eräs käyttäjä sanoi: "benchmarkit eivät oikein auta ymmärtämään, mikä toimii parhaiten agenttisessa AI:ssa."

Tärkeä oivallus: halvin malli ei aina ole halvin lopputulos. Malli, joka epäonnistuu ja yrittää uudelleen neljä kertaa, maksaa enemmän kuin keskitasoinen malli, joka . Tuotantoagenttijärjestelmissä kannattaa varautua — ja jos viisi LLM-kutsua on ketjutettu ja vaihe neljä epäonnistuu, naiivi retry ajaa kaikki viisi vaihetta uudelleen.

Tässä oma kyvykkyysmatriisini, jossa "Real Agentic Score" perustuu oikeisiin käyttäjäraportteihin eikä synteettisiin benchmarkkeihin:

Malli	Input $/1M	Output $/1M	Työkalukutsujen luotettavuus	Monivaiheinen päättely	Real Agentic Score (1–5)	Parhaiten sopii
Gemini 2.5 Flash-Lite	$0.10	$0.40	Sekava — satunnaisia looppeja	Perustaso	⭐2.5	Heartbeatit, yksinkertaiset haut
GPT-OSS-120B	$0.04	$0.19	Riittävä	Riittävä	⭐3.0	Budjettikokeilut, nopeutta vaativat tehtävät
DeepSeek V3.2	$0.26	$0.38	Epätasainen (6 avointa issuea)	Hyvä	⭐3.0	Päättelypainotteinen, vähän työkalukutsuja
Kimi K2.5	$0.38	$1.72	Hyvä ( :exacto:n kautta)	Riittävä	⭐3.5	Yksinkertainen–keskitasoinen koodaus
MiniMax M2.5 / M2.7	$0.28	$1.10	Hyvä	Hyvä	⭐4.0	Yleiskäyttöinen koodauksen päivämalli
Claude Haiku 4.5	$1.00	$5.00	Erinomainen	Hyvä	⭐4.5	Luotettava keskitason varamalli
Claude Sonnet 4.6	$3.00	$15.00	Erinomainen	Erinomainen	⭐5.0	Monimutkaiset monivaiheiset tehtävät
Claude Opus 4.5/4.6	$5.00	$15.00	Erinomainen	Erinomainen	⭐5.0	Vain vaikeimpiin ongelmiin

Varoitus DeepSeekistä ja Gemini Flashista työkalukutsujen suhteen

DeepSeek V3.2 näyttää paperilla erinomaiselta — 72–74 % , 11–36x halvempi kuin Sonnet. Käytännössä Cline-, Roo Code-, Continue- ja NVIDIA NIM -projekteissa dokumentoivat rikki menneen tool-calling-käytöksen. Composion vertailun yhteenveto: "." Zvi Mowshowitzin tiivistys: "."

Gemini 2.5 Flashissa on samanlainen rako. Google AI Developers Forumin ketju nimeltä "Very frustrating experience with Gemini 2.5 function calling performance" alkaa toteamuksella: "."

OpenRouter nosti esiin tärkeän nyanssin: "." Jos reitität halpoja malleja OpenRouterin kautta, etsi :exacto-tagia — hiljainen palveluntarjoajan vaihto voi tehdä luotettavasta halvasta mallista yhdessä yössä kalliin retry-silmukan.

Milloin mitäkin mallia kannattaa käyttää

Gemini Flash-Lite: Heartbeatit, keep-alive-pingit, yksinkertaiset kysymykset ja vastaukset. Ei koskaan monivaiheiseen työkalukutsuun.
MiniMax M2.5/M2.7: Päivittäinen yleiskoodauksen työjuhta. murto-osalla Sonnetin hinnasta.
Claude Haiku 4.5: Luotettava varavalinta silloin, kun halpa malli kompuroi työkalukutsuissa. Erinomainen luotettavuus noin 3x halvemmalla kuin Sonnet.
Claude Sonnet 4.6: Monimutkainen monivaiheinen agenttityö. Tässä saat rahallesi vastinetta.
Claude Opus: Vain kaikkein vaikeimpiin ongelmiin. Älä anna sen olla oletusmalli missään muussa.

(Mallien hinnoittelu muuttuu usein — tarkista ajantasaiset hinnat tai suoraan palveluntarjoajan sivuilta ennen kuin lukitset konfiguraation.)

Piilotetut token-vuodot, jotka useimmat oppaat ohittavat

Foorumikäyttäjät raportoivat, että tiettyjen ominaisuuksien poistaminen käytöstä pienentää kustannuksia dramaattisesti, mutta en ole löytänyt opasta, joka kokoaisi kaikki piilovuodot ja niiden todellisen token-vaikutuksen yhteen tarkistuslistaan. Täysi purku:

Piilovuoto	Token-kustannus per esiintyminen	Miten korjataan	Asetusavain
Oletus-heartbeat Opusilla	~100 000 tokenia/ajo ilman eristystä	Haiku-override + isolatedSession	`heartbeat.model`, `heartbeat.isolatedSession: true`
Aliagenttien luonti	~20 000 tokenia per luonti ennen kuin mitään on tehty	Reititä aliagentit Haikulle	`subagents.model`
Koko koodipohjan kontekstin lataus	~3 000–15 000 tokenia per auto-explore	`.clawignore` node_modulesille, distille ja lockfileille	`.clawrules` + `.clawignore`
Muistin automaattinen yhteenveto	~500–2 000 tokenia/sessio	Poista käytöstä tai vähennä tiheyttä	`memory: false` tai `memory.max_context_tokens`
Keskusteluhistorian kertyminen	~500+ tokenia/kierros (kertyy)	Aloita uusi sessio toisistaan riippumattomissa tehtävissä	`/clear`-kurinalaisuus
MCP-palvelimen työkaluylikuorma	~7 000 tokenia 4 palvelimelle; 50 000+ viidellä tai useammalla	Pidä MCP-miniminä	Poista käyttämättömät MCP:t
Skill-/plugin-initialisointi	200–1 000 tokenia ladattua skilliä kohden	Poista käyttämättömät skillit	`skills.entries.<name>.enabled: false`
Agent Teams (plan mode)	~7x tavallisen session kustannus	Käytä vain oikeasti rinnakkaiseen työhön	Suosi peräkkäistä mallia

Heartbeat-vuoto ansaitsee oman huomionsa. Oletuksena heartbeatit ajetaan päämallilla (Opus) 30 minuutin välein. Asettamalla isolatedSession: true sen kustannus putoaa noin 100 000 tokenista per ajo — eli 95–98 % vähennys juuri tuossa yhdessä kohdassa.

Kolme nopeaa voittoa, jotka säästävät eniten tokeneita alle kahdessa minuutissa

Kaikki kolme ovat riskittömiä ja vievät alle kaksi minuuttia:

/clear toisistaan riippumattomien tehtävien välissä (5 sekuntia). Tämä on yksittäisenä toimena suurin token-säästäjä. Foorumien yhteisymmärryksen mukaan se vähentää kulutusta pelkästään tyhjentämällä session historian ennen uuden työn aloittamista. Muistatko sen 185k-tokenin Messages-bucketin /context-dumpista? /clear pyyhkii sen pois.
/model haiku-4.5 rutiinityöhön (10 sekuntia). Taktinen mallinvaihto tuottaa tavallisissa tehtävissä. Haiku hoitaa hyvin suurimman osan suoraviivaisesta koodauksesta, tiedostohaulla ja commit-viesteistä.
Kutista .clawrules alle 200 rivin + lisää .clawignore (90 sekuntia). Sääntötiedosto latautuu jokaisella viestillä. 200 rivillä se on noin 1 500–2 000 tokenia per kierros; 1 000 rivillä siitä tulee 8 000–10 000 tokenin pysyvä vero jokaiseen pyyntöön. Kun tähän yhdistetään .clawignore, joka sulkee pois node_modules/-kansion, dist-tiedostot, lockfilet ja generoitu koodi, yksi kehittäjä väittää saaneensa pelkästään tällä kurilla.

Vaihe vaiheelta: kolme valmista konfiguraatiota OpenClaw token-käytön leikkaamiseen

OpenClawin kuukausikulut — oletus vs optimoidut asetukset

Seuraavaksi kolme valmista, kommentoitua openclaw.json-konfiguraatiota — lähtötasosta täyteen optimointipinoon. Jokaisessa on rivikommentit ja arviot kuukausikuluista.

Ennen aloittamista:

Vaikeustaso: Aloittelija (Config A) → Keskitaso (Config B) → Edistynyt (Config C)
Aikaa tarvitaan: noin 5 minuuttia Config A:han, noin 15 minuuttia Config C:hen
Tarvitset: OpenClaw asennettuna, tekstieditorin ja pääsyn tiedostoon ~/.openclaw/openclaw.json

Config A: Aloittelija — säästä vain rahaa

Viisi riviä. Ei monimutkaisuutta. Vaihtaa oletusmallin Opusista Sonnetiin, poistaa memory-overheadin käytöstä ja eristää heartbeatit Haikulle.

1// ~/.openclaw/openclaw.json
2{
3  "agents": {
4    "defaults": {
5      "model": { "primary": "anthropic/claude-sonnet-4-6" },  // aiemmin Opus — välitön 3–5x säästö
6      "heartbeat": {
7        "every": "55m",                // sovita 1 h cache TTL:ään maksimaalista cache-osumaa varten
8        "model": "anthropic/claude-haiku-4-5",  // Haikulle pingit, ei Opusille
9        "isolatedSession": true        // ~100k → 2–5k tokenia per ajo
10      }
11    }
12  },
13  "memory": { "enabled": false }       // säästää ~500–2k tokenia/sessio
14}

Mitä pitäisi näkyä tämän jälkeen: Aja /status ennen ja jälkeen. Pyynnönkohtaisen kustannuksen pitäisi pudota selvästi, ja OpenRouterin Activity-sivulla heartbeat-rivien pitäisi näyttää Haiku eikä Opus.

Käyttötaso	Oletus (Opus)	Config A (Sonnet + Haiku-heartbeatit)	Säästö
Kevyt (~10 kyselyä/pv)	~100 $	~35 $	65 %
Keskimääräinen (~50 kyselyä/pv)	~500 $	~250 $	50 %
Raskas (~200 kyselyä/pv)	~1 750 $	~900 $	49 %

Config B: Keskitaso — älykäs kolmitasoinen reititys

Päämallina Sonnet oikeaan työhön. Haiku aliagenteille ja kompaktioon. Gemini Flash-Lite budjetti-varamallina, kun Claudea rajoitetaan. Varaketjut hoitavat palvelinongelmat automaattisesti.

1{
2  "agents": {
3    "defaults": {
4      "model": {
5        "primary": "anthropic/claude-sonnet-4-6",
6        "fallbacks": [
7          "anthropic/claude-haiku-4-5",       // jos Sonnetille tulee throttle
8          "google/gemini-2.5-flash-lite"      // erittäin halpa viimeinen vaihtoehto
9        ]
10      },
11      "models": {
12        "anthropic/claude-sonnet-4-6": {
13          "params": { "cacheControlTtl": "1h", "maxTokens": 8192 }
14        }
15      },
16      "heartbeat": {
17        "every": "55m",                       // 55 min &lt; 1 h cache TTL = cache-osumia
18        "model": "google/gemini-2.5-flash-lite",  // pennit per ping
19        "isolatedSession": true,
20        "lightContext": true                   // minimaalinen konteksti heartbeat-kutsuissa
21      },
22      "subagents": {
23        "maxConcurrent": 4,                   // alas oletuksen 8:sta
24        "model": "anthropic/claude-haiku-4-5" // aliagentit eivät tarvitse Sonnetia
25      },
26      "compaction": {
27        "mode": "safeguard",
28        "model": "anthropic/claude-haiku-4-5", // kompaktiosummat Haikulla
29        "memoryFlush": { "enabled": true }
30      }
31    }
32  }
33}

Odotettu tulos: Lokien aliagenttirivit näyttävät nyt Haiku-hinnoittelun. Heartbeatit ovat lähes ilmaisia. Varaketju varmistaa, ettei Claude-häiriö pysäytä sessiota — se vain putoaa sulavasti Geminiin.

Käyttötaso	Oletus	Config B	Säästö
Kevyt	~100 $	~20 $	80 %
Keskimääräinen	~500 $	~150 $	70 %
Raskas	~1 750 $	~500 $	71 %

Config C: Tehokäyttäjä — täysi optimointipino

Aliagenttikohtainen mallimääritys, kontekstin kompaktio lukittu Haikulle, vision-reititys Gemini Flashiin, tiukka .clawrules + .clawignore, käyttämättömät skillit pois päältä. Tällä konfiguraatiolla pääset 85–90 % säästöalueelle.

1{
2  "agents": {
3    "defaults": {
4      "workspace": "~/clawd",
5      "model": {
6        "primary": "anthropic/claude-sonnet-4-6",
7        "fallbacks": [
8          "openrouter/anthropic/claude-sonnet-4-6",  // eri palveluntarjoaja varmistuksena
9          "minimax/minimax-m2-7",                     // halpa päivittäinen varamalli
10          "anthropic/claude-haiku-4-5"                // viimeinen vaihtoehto
11        ]
12      },
13      "models": {
14        "anthropic/claude-sonnet-4-6": {
15          "params": { "cacheControlTtl": "1h", "maxTokens": 8192 }
16        },
17        "minimax/minimax-m2-7": {
18          "params": { "maxTokens": 8192 }
19        }
20      },
21      "heartbeat": {
22        "every": "55m",
23        "model": "google/gemini-2.5-flash-lite",
24        "isolatedSession": true,
25        "lightContext": true,
26        "activeHours": "09:00-19:00"           // ei heartbeateja yöllä
27      },
28      "subagents": {
29        "maxConcurrent": 4,
30        "model": "anthropic/claude-haiku-4-5"
31      },
32      "contextPruning": { "mode": "cache-ttl", "ttl": "1h" },
33      "compaction": {
34        "mode": "safeguard",
35        "model": "anthropic/claude-haiku-4-5",
36        "identifierPolicy": "strict",
37        "memoryFlush": { "enabled": true }
38      },
39      "bootstrapMaxChars": 12000,              // alas oletuksen 20000:sta
40      "imageModel": "google/gemini-3-flash"    // visiotyöt halvalla mallilla
41    }
42  },
43  "memory": { "enabled": true, "max_context_tokens": 800 },  // minimaalinen muisti
44  "skills": {
45    "entries": {
46      "web-search":       { "enabled": false },
47      "image-generation": { "enabled": false },
48      "audio-transcribe": { "enabled": false }
49    }
50  }
51}

Per-aliagentti-override -esimerkki — liitä tiedostoon ~/.openclaw/agents/lint-runner/SOUL.md:

1---
2name: lint-runner
3description: Ajaa lint-/format-tarkistukset ja tekee triviaalit korjaukset
4tools: [Bash, Read, Edit]
5model: anthropic/claude-haiku-4-5
6---

Minimivaatimus .clawignore-tiedostolle — tämä yksinään laskee tyypilliset bootstrapit 150k merkistä kohti 30–50k:ta:

1node_modules/
2dist/
3build/
4.next/
5coverage/
6.venv/
7vendor/
8*.lock
9package-lock.json
10yarn.lock
11pnpm-lock.yaml
12*.min.js
13*.min.css
14**/__snapshots__/
15**/*.snap

Käyttötaso	Oletus	Config C	Säästö
Kevyt	~100 $	~12 $	88 %
Keskimääräinen	~500 $	~90 $	82 %
Raskas	~1 750 $	~220 $	87 %

Nämä luvut ovat linjassa kahden toisistaan riippumattoman todellisen käyttäjäraportin kanssa: Praney Behlin dokumentoima (90 % leikkaus) sekä LaoZhangin tapaustutkimukset, joissa näkyi osittaisella optimoinnilla.

`/model`-komennon käyttö OpenClaw token-käytön hallintaan lennosta

/model-komento vaihtaa aktiivisen mallin seuraavaa kierrosta varten säilyttäen keskustelukontekstin — ei resetointia, ei historian menetystä. Tämä on päivittäinen tapa, joka kasvattaa säästöjä ajan myötä.

Käytännön työnkulku:

Työstät hankalaa monitiedostorefaktorointia? Pysy Sonnetissa.
Nopea "mitä tämä regex tekee?" -kysymys? /model haiku, kysy, ja vaihda sitten takaisin /model sonnet.
Commit-viesti tai dokumentin viimeistely? /model flash-lite, ja valmista.

Voit määrittää aliaksia openclaw.json-tiedostossa kohdassa commands.aliases, jotta lyhyet nimet (haiku, sonnet, opus, flash) vastaavat pitkiä provider-merkkijonoja. Säästää muutaman näppäimenpainalluksen jokaisessa vaihdossa.

Laskelma: 50 kyselyä päivässä Sonnetilla on noin 3 dollaria päivässä. Sama 50 kyselyä jaettuna suhteessa 70/20/10 Haikulle/Sonnetille/Opukselle on noin 1,10 dollaria päivässä. Kuukaudessa tämä tarkoittaa $90 → $33 — 63 % halvempi ilman työkalujen vaihtamista, pelkästään tavoilla.

Bonus: OpenClaw-mallihintojen seuranta eri palveluntarjoajilla Thunderbitillä

Kun malleja ja palveluntarjoajia on niin paljon — OpenRouter, suora Anthropic API, Google AI Studio, DeepSeek, MiniMax — hinnoittelu muuttuu jatkuvasti. Anthropic laski Opusin output-hinnoittelua yhdessä yössä noin 67 %. Google leikkasi Gemini-free-tierin rajoja joulukuussa 2025. Staattisen hintataulukon päivittäminen käsin on hävitty taistelu.

ratkaisee tämän ilman yhtäkään scraping-koodiriviä. Se on , joka on rakennettu juuri tällaisen rakenteisen tiedon poimintaan.

Käyttämäni työnkulku:

Avaa OpenRouterin mallisivu Chromessa ja klikkaa Thunderbitin "AI Suggest Fields". Se lukee sivun ja ehdottaa sarakkeita — mallin nimi, input-hinta, output-hinta, context window, palveluntarjoaja.
Paina Scrape, ja vie tiedot suoraan Google Sheetsiin.
Aseta ajastettu scrape selkokielellä — "joka maanantai klo 9 lue OpenRouterin mallilista uudelleen" — ja se pyörii automaattisesti pilvessä.

Sen jälkeen oma hintaseurantasi päivittyy itsestään. Jokainen malli, joka yhtäkkiä halpenee 30 % — tai palveluntarjoaja, joka saa Exacto-taginkin — ilmestyy maanantaiaamun taulukkoon ilman että teet mitään. Olemme kirjoittaneet lisää blogissamme.

Vertaatko suoraan palveluntarjoajien sivuja (Anthropic, Google, DeepSeek)? Thunderbitin alisivujen scraping seuraa jokaisen mallin linkin sen yksityissivulle ja hakee palveluntarjoajakohtaiset hinnat — hyödyllistä, kun haluat tietää, onko Kimi K2.5:n reititys OpenRouterin kautta halvempi kuin suora käyttö kautta. Katso ilmaisen tason ja suunnitelmien tiedot.

Keskeiset opit OpenClaw token-käytön leikkaamiseen

Perusrunko: Ymmärrä → Seuraa → Reititä → Optimoi.

Suurimman vaikutuksen toimenpiteet järjestyksessä:

Älä käytä Opusia oletuksena. Vaihda päämalliksi Sonnet tai MiniMax M2.7. Tämä yksinään vähentää kustannuksia 3–5x.
Eristä heartbeatit. Aseta isolatedSession: true ja reititä heartbeatit Gemini Flash-Liteen. Tämä muuttaa noin 100k tokenin vuodon noin 2–5k:een.
Reititä aliagentit Haikulle. Jokainen luonti lataa noin 20k tokenia kontekstia ennen kuin yhtään työtä on tehty. Älä tee sitä Opusilla.
Käytä /clear-komentoa uskollisesti. Ilmainen, vie 5 sekuntia ja yhteisön konsensus on, että se säästää enemmän kuin mikään muu yksittäinen toimi.
Lisää .clawignore. node_modules-, lockfile- ja build-artifact -poissulkeminen pienentää bootstrap-kontekstia dramaattisesti.
Seuraa /context detail -komennolla ennen muutoksia ja niiden jälkeen. Jos et voi mitata sitä, et voi parantaa sitä.

Halvin malli riippuu tehtävästä. Gemini Flash-Lite heartbeatteihin. MiniMax M2.7 päivittäiseen koodaukseen. Haiku luotettavaan työkalukutsuun. Sonnet monimutkaiseen monivaiheiseen työhön. Opus vain aidosti vaikeimpiin ongelmiin — ei mihinkään muuhun.

Useimmat lukijat voivat nähdä 50–70 % säästöt jo yhdessä iltapäivässä Config A:n tai B:n avulla. Täysi 85–90 % edellyttää kaikkien yllä olevien asioiden yhdistämistä — mallireititys, piilovuotojen korjaus, .clawignore, session kurinalaisuus — mutta se on mahdollista, ja se myös pysyy.

Usein kysytyt kysymykset

1. Paljonko OpenClaw maksaa kuukaudessa?

Se riippuu täysin konfiguraatiosta, käyttömäästä ja mallivalinnoista. Kevyet käyttäjät (~10 kyselyä/päivä) maksavat tyypillisesti 5–30 dollaria kuukaudessa optimoinnilla, tai yli 100 dollaria oletusasetuksilla. Keskimääräiset käyttäjät (~50 kyselyä/päivä) sijoittuvat välille 90–400 dollaria/kk. Raskailla käyttäjillä voidaan päästä oletusasetuksilla — yksi dokumentoitu ääriesimerkki oli 5 623 dollaria yhdessä kuukaudessa. Anthropicin oma sisäinen telemetria viittaa mediaaniin .

2. Mikä on halvin OpenClaw-malli, joka silti toimii hyvin koodauksessa?

on paras yleinen päivittäinen valinta — hyvä työkalukutsujen luotettavuus, SWE-Pro 56.22 ja hinta noin $0.28/$1.10 per miljoona tokenia. Heartbeatteihin ja yksinkertaisiin hakuihin Gemini 2.5 Flash-Lite hintaan $0.10/$0.40 on vaikea päihittää. Claude Haiku 4.5 hintaan $1/$5 on luotettava keskitason varamalli, kun tarvitset erinomaista työkalukutsua maksamatta Sonnet-hintoja.

3. Voinko käyttää OpenClawin kanssa ilmaisia malleja?

Teknisesti kyllä. GPT-OSS-120B on ilmainen OpenRouterin :free-tagilla ja NVIDIA Buildissa. Gemini Flash-Litellä on ilmainen taso (15 RPM, 1 000 pyyntöä/päivä). DeepSeek antaa . Mutta ilmaisissa tasoissa on tiukat rate limitit, hitaampi nopeus ja epäluotettavampi saatavuus. Halvat maksulliset mallit — vain senttejä miljoonaa tokenia kohden — ovat arjessa paljon luotettavampia.

4. Menetänkö kontekstin, jos vaihdan malleja kesken keskustelun /model-komennolla?

Et. /model säilyttää koko session kontekstin — seuraava kierros käyttää uutta mallia mutta täydellä historialla. Tämä on vahvistettu OpenClawin konsepteissa ja toimii samalla tavalla Claude Codessa. Voit vaihtaa vapaasti Haikun nopeisiin kysymyksiin ja Sonnetin monimutkaiseen työhön ilman, että menetät mitään.

5. Mikä on nopein tapa pienentää OpenClaw-laskua tänään?

Kirjoita /clear toisistaan riippumattomien tehtävien välissä. Se on ilmainen, vie viisi sekuntia ja tyhjentää keskusteluhistorian, joka lähetetään uudelleen jokaisella API-kutsulla. Yksi oikea sessio näytti kertyneenä viestihistoriana — ja kaikki se lähetettiin ja laskutettiin uudelleen jokaisella kierroksella. Sen tyhjentäminen ennen uuden työn aloittamista on korkein tuotto-panossuhde, jonka voit rakentaa tavaksi.

Kokeile Thunderbitiä AI-web-scrapingiin

Kuinka vähensin OpenClawin token-käyttöä 90 % (sisällä halvimmat mallit)

Tarvitsetko räätälöityä verkkodataa?

Kokeile Thunderbitia