Ich habe meine Claude Credits in 2 Stunden verbrannt. Diese 8 Gewohnheiten helfen!
8 Claude Tips um Credits zu sparen!
Jeden Morgen das gleiche Spiel. Ich öffne Claude, steige tief in einen Workflow ein und um 10 Uhr blicke ich auf die allseits bekannte Rate-Limit-Meldung. Ich gebe dem Abo die Schuld. Ich ärgere mich über die Preisseite. Und ich überlege natürlich direkt, ob ich upgraden soll.
Dann habe ich mir aber konkret angeschaut, wie ich Claude eigentlich benutze.
Das Problem war nie das Abo. Hier sind 8 Gewohnheiten, die viele nicht kennen.

Niklas Klein von Hanisch & Klein stand vor einem typischen Problem: funktionierende, aber fragmentierte Prozesse aus Tools wie Airtable, Zapier und manuellen Schritten, die zu Fehlern, Stress und fehlender Skalierbarkeit führten. In nur 3 Monaten mit APEX konnte er seine Abläufe zentralisieren und automatisieren, wodurch er 16 Stunden Arbeitszeit pro Kunde einspart, 45 zusätzliche Kunden betreuen kann und KI-gestützte Lead-Generierung für sich und seine Kunden nutzt – bei deutlich höherem Output mit dem gleichen Team.
01. Hör auf, das falsche Modell für die falsche Aufgabe zu nutzen
Die meisten Leute öffnen Claude und tippen einfach drauf los. Sie denken nie darüber nach, welches Modell sie gerade verwenden. Das ist der erste Fehler.
Die Realität:
- Haiku kostet rund 500 Token pro Nachricht und erledigt 80% der täglichen Aufgaben. Grammatikprüfungen, schnelle Umformulierungen, Brainstorming, Formatierungen.
- Sonnet kostet rund 2.000 Tokens und übernimmt das Coding, die Analysen sowie die Erstellung strukturierter Dokumente.
- Opus kostet rund 8.000 Tokens und ist für intensive Recherchen, komplexe Strategien und die Arbeit mit mehreren Dokumenten gleichzeitig konzipiert.
Opus standardmäßig laufen zu lassen, während man eine Betreffzeile korrigiert, ist wie mit einem Ferrari zum Supermarkt zu fahren. Du verbrennst dein Limit, bevor die eigentliche Arbeit überhaupt beginnt.
Standardmäßig Haiku nutzen. Nur upgraden, wenn die Aufgabe es wirklich verlangt.
02. Schalte die Token-Fresser aus, an die du nie denkst
Extended Thinking, Web Search, Artifacts, Connectors. Diese Features sind nützlich. Das Problem ist, dass die meisten sie dauerhaft aktiviert lassen, ohne zu merken, was sie kosten.
Extended Thinking verdoppelt deinen Token-Verbrauch bei jeder Nachricht. Web Search addiert noch einmal das 2 bis 3-fache. Connectors nochmal das 1,5 bis 2-fache.
Alles zusammen und eine einzige Nachricht kostet so viel wie zehn sollten.
Alles standardmäßig ausschalten. Features nur aktivieren, wenn die Aufgabe es wirklich erfordert.
03. Bearbeite deine Nachricht. Antworte nicht darauf.
Jedes Mal, wenn du eine neue Nachricht sendest, liest Claude die gesamte Konversation von Anfang an neu. Nachricht 1 plus Nachricht 2 plus Nachricht 3. Der Kontext wächst mit jeder Runde.
Wenn du aber auf deine letzte Nachricht klickst und sie bearbeitest, verarbeitet Claude nur die aktualisierte Version.
Gleiches Ergebnis. Ein Bruchteil der Kosten.
Hast du eine Korrektur oder eine Nachfrage? Klick auf Bearbeiten, nicht auf Antworten. Eine Gewohnheit. Spürbar weniger Token-Verbrauch in jeder Session.

Soufian El Morabiti von Goldmantax hat mit APEX einen starken Digitalisierungspartner gefunden, um komplexe steuerrechtliche Prozesse effizient und skalierbar abzubilden. Durch automatisierte KI-Workflows und klare Systemstrukturen konnte er den manuellen Aufwand reduzieren, Fehler minimieren und seine Kanzlei deutlich zukunftssicherer aufstellen.
04. Starte alle 15 Nachrichten einen neuen Chat
Das hat mich am meisten überrascht. Claude zählt Tokens über die gesamte Konversationshistorie hinweg. Je länger ein Chat läuft, desto teurer wird jede neue Nachricht.
Nachricht 1 kostet rund 200 Tokens. Bei Nachricht 15 gibst du bereits 10.000 aus. Bei Nachricht 30 kostet eine einzige Frage 50.000 oder mehr. Nicht weil die Fragen schwieriger wurden. Nur weil die Historie länger geworden ist.
Alle 15 Nachrichten: Zusammenfassen, neuen Chat öffnen, Zusammenfassung einfügen. Historie schlank halten. Sauber neu anfangen.
05. Fasse deine Fragen in einer Nachricht zusammen
Drei separate Nachrichten bedeuten drei separate Kontext-Ladevorgänge. Claude liest die gesamte Konversationshistorie jedes Mal neu, wenn du etwas sendest. Drei Fragen in drei Nachrichten kostet dreimal so viel wie eine einzige Nachricht.
Es gibt auch einen Qualitätsvorteil. Wenn Claude alle deine Fragen auf einmal sieht, kann es sie verknüpfen, Muster erkennen und kohärentere Antworten geben. Du bekommst mehr aus einem Prompt als aus drei fragmentierten.
Alles in eine Nachricht packen. Ein Prompt. Ein Kontext-Ladevorgang. Bessere Antworten als Bonus.
06. Verteile deine Arbeit über den Tag
Claude läuft auf einem rollierenden 5-Stunden-Fenster. Deine ältesten Nachrichten verfallen automatisch mit der Zeit. Wenn du dein Tageskontingent in einer einzigen zweistündigen Session verbrennst, wartest du. Wenn du die gleiche Arbeit auf drei Sessions über den Tag verteilst, lädt sich dein Kontingent im Hintergrund automatisch nach.
Morgen-Session. Mittags-Session. Abend-Session. Drei kurze Sprints schlagen einen langen Marathon. Die Mathematik arbeitet für dich.
07. Nutze Projects, damit du nicht immer wieder die gleiche Datei hochlädst
Wenn du dieselbe PDF in fünf verschiedenen Chats hochlädst, liest und verarbeitet Claude sie fünfmal. Fünf vollständige Token-Ladevorgänge für eine Datei, für die du einmal bezahlt hast.
Das Projects-Feature von Claude speichert deine hochgeladenen Dateien auf Projektebene im Cache. Jeder neue Chat innerhalb dieses Projekts liest sie kostenlos.
Referenzdateien einmal in einem Project hochladen. Aufhören, immer wieder für denselben Kontext zu zahlen.
08. Speichere deinen Kontext einmal. Wiederhole dich nie wieder.
Jedes Mal, wenn du einen neuen Chat startest und schreibst "Ich bin Content-Stratege, ich schreibe auf Deutsch, kurz und knapp bitte" verbrennst du Tokens, um dich einem System vorzustellen, das dich eigentlich schon kennen sollte.
Drei Tools lösen das dauerhaft. Memory speichert deine Rolle, deinen Ton und deine Regeln und lädt sie automatisch in jeden Chat. CLAUDE.md speichert deinen Tech-Stack und deine Einschränkungen für Code-Projekte. Skills erfassen wiederkehrende Workflows, damit du nie wieder denselben Prompt von Null aufbaust.
Einmal einrichten. Läuft im Hintergrund für immer. Claude hört auf, jedes Mal neu zu lernen, wer du bist.
Die Kurzversion
- Standardmäßig Haiku nutzen. Nur upgraden, wenn die Aufgabe es wirklich verlangt.
- Extended Thinking, Web Search und Connectors standardmäßig ausschalten.
- Letzte Nachricht bearbeiten statt eine neue zu senden.
- Alle 15 Nachrichten neuen Chat starten. Zusammenfassung einfügen und weitermachen.
- Mehrere Fragen in einer Nachricht zusammenfassen.
- Arbeit auf 2 bis 3 Sessions über den Tag verteilen.
- Dateien einmal in Projects hochladen. Aufhören, denselben Kontext neu zu laden.
- Memory, CLAUDE.md und Skills einmal einrichten. Nie wieder wiederholen.
Das Abo war nie das Problem. Die Gewohnheiten waren es.