Przejdź do głównej zawartości

Kredyty, limity użycia i optymalizacja kosztów

Jesteś trzy dni w sprint i dashboard użycia Codex twojego zespołu pokazuje, że spaliliście 80% miesięcznych kredytów. Dwóch programistów uruchamia drogie zadania chmurowe do pracy eksploracyjnej, która mogłaby być lokalna. Jedna automatyzacja uruchamia się co godzinę, gdy wystarczyłoby co dzień. Bez widoczności i dyscypliny koszty Codex mogą cię zaskoczyć. Ten artykuł daje ci kontrole i strategie, żeby utrzymać wydatki na przewidywalnym poziomie.

  • Jasne zrozumienie planów cenowych Codex, kosztów kredytów i limitów użycia
  • Konkretne strategie redukujące zużycie kredytów o 30-50% bez poświęcania produktywności
  • Wzorce monitorowania i alertów z dashboardu użycia i Analytics API
  • Frameworki decyzyjne dotyczące wyboru: local vs cloud, GPT-5.5 vs GPT-5.4-mini
PlanCenaLokalne wiadomości / 5hZadania chmurowe / 5hCode review / tydzień
Plus$20/mies.45-22510-6010-25
Pro$200/mies.300-150050-400100-250
Business$30/użytkownik/mies.45-22510-6010-25
EnterpriseKontakt z działem sprzedażyNa bazie kredytów (bez stałych limitów)Na bazie kredytówNa bazie kredytów
API KeyNa bazie użyciaCennik per-tokenN/AN/A

Limity lokalne i chmurowe dzielą pięciogodzinne okno kroczące. Mogą obowiązywać dodatkowe limity tygodniowe.

Kredyty rozszerzają twoje użycie po osiągnięciu wliczonych limitów. Koszt za wiadomość zmienia się w zależności od złożoności zadania:

PowierzchniaJednostkaGPT-5.5GPT-5.4-mini
Lokalne zadania1 wiadomość~5 kredytów~1 kredyt
Zadania chmurowe1 wiadomość~25 kredytówN/A
Code review1 PR~25 kredytówN/A

GPT-5.4-mini zapewnia około 4x więcej użycia na kredyt dla lokalnych zadań. Zadania chmurowe i code review nie są dostępne z Mini. To uśrednione stawki kredytowe, które obowiązują także dla starszych modeli Codex, więc liczby pozostają stabilne między aktualizacjami modeli.

Największy czynnik kosztu to złożoność zadania. Każda wiadomość przetwarzana przez Codex zawiera twój prompt, AGENTS.md, definicje narzędzi MCP i zgromadzony kontekst.

Każda wiadomość Codex zawiera treść twojego AGENTS.md. Dla dużych projektów użyj zagnieżdżonych plików AGENTS.md:

# Root AGENTS.md (100 lines - loaded for all tasks)
AGENTS.md
# Service-specific (50 lines - loaded only when working in payments/)
services/payments/AGENTS.md
# Frontend-specific (50 lines - loaded only when working in frontend/)
packages/frontend/AGENTS.md

W ten sposób zadanie w services/payments/ ładuje 150 linii wskazówek zamiast monolitycznego pliku o 500 liniach.

Każdy skonfigurowany serwer MCP dodaje definicje narzędzi do twojego kontekstu. Wyłącz serwery MCP, których aktywnie nie używasz:

~/.codex/config.toml
[mcp_servers.sentry]
enabled = false # Re-enable when debugging production issues
[mcp_servers.linear]
enabled = true # Always useful for issue context

Rezerwuj GPT-5.5 (lub gpt-5.2-codex jeśli jesteś na auth przez API key) do złożonego rozumowania. Przełącz na Mini dla:

  • Prostych refaktoringów i zmian nazw
  • Prostego pisania testów
  • Aktualizacji dokumentacji
  • Poprawek lintingu i formatowania

W CLI: codex --model gpt-5.4-mini "add docstrings to all public functions in src/utils/"

Cennik GPT-5.5: $5 / $30 za MTok input/output. GPT-5.5 Pro to $30 / $180. GPT-5.4-mini pozostaje najtańszym sposobem na uruchamianie rutynowych pętli w skali.

W aplikacji: zmień model w dropdownie kompozytora wątku.

Lokalne zadania kosztują ~5 kredytów vs ~25 kredytów za zadania chmurowe. Używaj chmury tylko gdy potrzebujesz:

  • Zdalnego wykonania (delegowanie ze Slacka, urządzenia mobilnego lub innej strefy czasowej)
  • Pełnej izolacji środowiska
  • Równoległych prób best-of-N
  • Pracy na branchu, którego jeszcze nie wypchnąłeś (użyj codex cloud do delegowania z CLI)

Dashboard użycia Codex pokazuje:

  • Bieżące użycie w stosunku do limitów
  • Zużycie kredytów w czasie
  • Podział wg powierzchni (lokalne, chmurowe, code review)

Dla zespołów enterprise zbuduj automatyczne alerty. Sprawdź dokładną ścieżkę i uwierzytelnianie dla dziennych metryk w dokumentacji Analytics API — poniższy endpoint jest poglądowy:

// Check daily credit burn rate
// Illustrative endpoint — see the Analytics API reference for the real path
const response = await fetch(ANALYTICS_DAILY_ENDPOINT, {
headers: { Authorization: `Bearer ${adminToken}` }
});
const data = await response.json();
const dailyCredits = data.total_credits_used;
if (dailyCredits > DAILY_BUDGET * 0.8) {
await sendSlackAlert(`Codex credit usage at ${dailyCredits}/${DAILY_BUDGET} (80% of daily budget)`);
}

Automatyzacje to ukryty czynnik kosztowy, ponieważ działają nienadzorowane:

  • Przeglądaj kadencję: Czy twoja automatyzacja musi działać co godzinę? Codzienny interwał często wystarcza.
  • Zawężaj prompty: Szeroka automatyzacja “scan the entire codebase” kosztuje znacznie więcej niż “scan files changed in the last 24 hours.”
  • Używaj trybu read-only: Automatyzacje raportujące nie potrzebują dostępu do zapisu, a tryb read-only zapobiega niepotrzebnym wywołaniom narzędzi.
  • Archiwizuj ukończone uruchomienia: Stare worktree automatyzacji zajmują miejsce na dysku, a ich utworzenie zużyło kredyty. Archiwizuj to, co już przejrzałeś.
  • Trafienie w limity w środku sprintu: Kup dodatkowe kredyty przez dashboard użycia. Lub przełącz na GPT-5.4-mini, żeby rozciągnąć pozostałe limity 4x.
  • Nieoczekiwane koszty zadań chmurowych: Przejrzyj, które integracje (Slack, Linear) tworzą zadania chmurowe. Rozważ ograniczenie dostępu do chmury dla konkretnych grup użytkowników przez RBAC.
  • Drenaż kredytów przez automatyzacje: Sprawdź sekcję Automations w sidebarze pod kątem uruchomień, które odpalają się zbyt często lub dają wyniki o niskiej wartości. Dostosuj kadencję lub wyłącz.
  • Niespodzianki z użyciem klucza API: Użycie klucza API jest rozliczane po standardowych stawkach API per token. Ustaw limity wydatków w dashboardzie platformy OpenAI.
  • Zarządzanie enterprise — RBAC i kontrole administracyjne do zarządzania kosztami w całym zespole
  • Automatyzacje — Zoptymalizuj harmonogramy i prompty automatyzacji pod kątem efektywności kosztowej
  • Tryb nieinteraktywny — Budżetuj użycie codex exec w pipeline’ach CI