Kredyty, limity użycia i optymalizacja kosztów

Jesteś trzy dni w sprint i dashboard użycia Codex twojego zespołu pokazuje, że spaliliście 80% miesięcznych kredytów. Dwóch programistów uruchamia drogie zadania chmurowe do pracy eksploracyjnej, która mogłaby być lokalna. Jedna automatyzacja uruchamia się co godzinę, gdy wystarczyłoby co dzień. Bez widoczności i dyscypliny koszty Codex mogą cię zaskoczyć. Ten artykuł daje ci kontrole i strategie, żeby utrzymać wydatki na przewidywalnym poziomie.

Czego się nauczysz

Jasne zrozumienie planów cenowych Codex, kosztów kredytów i limitów użycia
Konkretne strategie redukujące zużycie kredytów o 30-50% bez poświęcania produktywności
Wzorce monitorowania i alertów z dashboardu użycia i Analytics API
Frameworki decyzyjne dotyczące wyboru: local vs cloud, GPT-5.5 vs GPT-5.4-mini

Plany cenowe w skrócie

Plan	Cena	Lokalne wiadomości / 5h	Zadania chmurowe / 5h	Code review / tydzień
Plus	$20/mies.	45-225	10-60	10-25
Pro	$200/mies.	300-1500	50-400	100-250
Business	$30/użytkownik/mies.	45-225	10-60	10-25
Enterprise	Kontakt z działem sprzedaży	Na bazie kredytów (bez stałych limitów)	Na bazie kredytów	Na bazie kredytów
API Key	Na bazie użycia	Cennik per-token	N/A	N/A

Limity lokalne i chmurowe dzielą pięciogodzinne okno kroczące. Mogą obowiązywać dodatkowe limity tygodniowe.

Jak działają kredyty

Kredyty rozszerzają twoje użycie po osiągnięciu wliczonych limitów. Koszt za wiadomość zmienia się w zależności od złożoności zadania:

Powierzchnia	Jednostka	GPT-5.5	GPT-5.4-mini
Lokalne zadania	1 wiadomość	~5 kredytów	~1 kredyt
Zadania chmurowe	1 wiadomość	~25 kredytów	N/A
Code review	1 PR	~25 kredytów	N/A

GPT-5.4-mini zapewnia około 4x więcej użycia na kredyt dla lokalnych zadań. Zadania chmurowe i code review nie są dostępne z Mini. To uśrednione stawki kredytowe, które obowiązują także dla starszych modeli Codex, więc liczby pozostają stabilne między aktualizacjami modeli.

Strategie optymalizacji kosztów

Strategia 1: Dobierz rozmiar zadań

Największy czynnik kosztu to złożoność zadania. Każda wiadomość przetwarzana przez Codex zawiera twój prompt, AGENTS.md, definicje narzędzi MCP i zgromadzony kontekst.

Strategia 2: Zminimalizuj rozmiar AGENTS.md

Każda wiadomość Codex zawiera treść twojego AGENTS.md. Dla dużych projektów użyj zagnieżdżonych plików AGENTS.md:

# Root AGENTS.md (100 lines - loaded for all tasks)
AGENTS.md

# Service-specific (50 lines - loaded only when working in payments/)
services/payments/AGENTS.md

# Frontend-specific (50 lines - loaded only when working in frontend/)
packages/frontend/AGENTS.md

W ten sposób zadanie w services/payments/ ładuje 150 linii wskazówek zamiast monolitycznego pliku o 500 liniach.

Strategia 3: Ogranicz serwery MCP

Każdy skonfigurowany serwer MCP dodaje definicje narzędzi do twojego kontekstu. Wyłącz serwery MCP, których aktywnie nie używasz:

[mcp_servers.sentry]
enabled = false  # Re-enable when debugging production issues

[mcp_servers.linear]
enabled = true   # Always useful for issue context

Strategia 4: Używaj GPT-5.4-mini do prostych zadań

Rezerwuj GPT-5.5 (lub gpt-5.2-codex jeśli jesteś na auth przez API key) do złożonego rozumowania. Przełącz na Mini dla:

Prostych refaktoringów i zmian nazw
Prostego pisania testów
Aktualizacji dokumentacji
Poprawek lintingu i formatowania

W CLI: codex --model gpt-5.4-mini "add docstrings to all public functions in src/utils/"

Cennik GPT-5.5: $5 / $30 za MTok input/output. GPT-5.5 Pro to $30 / $180. GPT-5.4-mini pozostaje najtańszym sposobem na uruchamianie rutynowych pętli w skali.

W aplikacji: zmień model w dropdownie kompozytora wątku.

Strategia 5: Preferuj lokalne nad chmurowe

Lokalne zadania kosztują ~5 kredytów vs ~25 kredytów za zadania chmurowe. Używaj chmury tylko gdy potrzebujesz:

Zdalnego wykonania (delegowanie ze Slacka, urządzenia mobilnego lub innej strefy czasowej)
Pełnej izolacji środowiska
Równoległych prób best-of-N
Pracy na branchu, którego jeszcze nie wypchnąłeś (użyj codex cloud do delegowania z CLI)

Monitorowanie i alerty

Dashboard użycia

Dashboard użycia Codex pokazuje:

Bieżące użycie w stosunku do limitów
Zużycie kredytów w czasie
Podział wg powierzchni (lokalne, chmurowe, code review)

Analytics API dla zespołów

Dla zespołów enterprise zbuduj automatyczne alerty. Sprawdź dokładną ścieżkę i uwierzytelnianie dla dziennych metryk w dokumentacji Analytics API — poniższy endpoint jest poglądowy:

// Check daily credit burn rate
// Illustrative endpoint — see the Analytics API reference for the real path
const response = await fetch(ANALYTICS_DAILY_ENDPOINT, {
  headers: { Authorization: `Bearer ${adminToken}` }
});

const data = await response.json();
const dailyCredits = data.total_credits_used;

if (dailyCredits > DAILY_BUDGET * 0.8) {
  await sendSlackAlert(`Codex credit usage at ${dailyCredits}/${DAILY_BUDGET} (80% of daily budget)`);
}

Kontrola kosztów automatyzacji

Automatyzacje to ukryty czynnik kosztowy, ponieważ działają nienadzorowane:

Przeglądaj kadencję: Czy twoja automatyzacja musi działać co godzinę? Codzienny interwał często wystarcza.
Zawężaj prompty: Szeroka automatyzacja “scan the entire codebase” kosztuje znacznie więcej niż “scan files changed in the last 24 hours.”
Używaj trybu read-only: Automatyzacje raportujące nie potrzebują dostępu do zapisu, a tryb read-only zapobiega niepotrzebnym wywołaniom narzędzi.
Archiwizuj ukończone uruchomienia: Stare worktree automatyzacji zajmują miejsce na dysku, a ich utworzenie zużyło kredyty. Archiwizuj to, co już przejrzałeś.

Gdy coś nie działa

Trafienie w limity w środku sprintu: Kup dodatkowe kredyty przez dashboard użycia. Lub przełącz na GPT-5.4-mini, żeby rozciągnąć pozostałe limity 4x.
Nieoczekiwane koszty zadań chmurowych: Przejrzyj, które integracje (Slack, Linear) tworzą zadania chmurowe. Rozważ ograniczenie dostępu do chmury dla konkretnych grup użytkowników przez RBAC.
Drenaż kredytów przez automatyzacje: Sprawdź sekcję Automations w sidebarze pod kątem uruchomień, które odpalają się zbyt często lub dają wyniki o niskiej wartości. Dostosuj kadencję lub wyłącz.
Niespodzianki z użyciem klucza API: Użycie klucza API jest rozliczane po standardowych stawkach API per token. Ustaw limity wydatków w dashboardzie platformy OpenAI.

Co dalej

Zarządzanie enterprise — RBAC i kontrole administracyjne do zarządzania kosztami w całym zespole
Automatyzacje — Zoptymalizuj harmonogramy i prompty automatyzacji pod kątem efektywności kosztowej
Tryb nieinteraktywny — Budżetuj użycie codex exec w pipeline’ach CI