Przejdź do głównej zawartości

Kredyty, limity użycia i optymalizacja kosztów

Jesteś trzy dni w sprint i dashboard użycia Codex twojego zespołu pokazuje, że spaliliście 80% miesięcznych kredytów. Dwóch programistów uruchamia drogie zadania chmurowe do pracy eksploracyjnej, która mogłaby być lokalna. Jedna automatyzacja uruchamia się co godzinę, gdy wystarczyłoby co dzień. Bez widoczności i dyscypliny koszty Codex mogą cię zaskoczyć. Ten artykuł daje ci kontrole i strategie, żeby utrzymać wydatki na przewidywalnym poziomie.

  • Jasne zrozumienie planów cenowych Codex, kosztów kredytów i limitów użycia
  • Konkretne strategie redukujące zużycie kredytów o 30-50% bez poświęcania produktywności
  • Wzorce monitorowania i alertów z dashboardu użycia i Analytics API
  • Frameworki decyzyjne dotyczące wyboru: local vs cloud, GPT-5.3-Codex vs GPT-5.1-Codex-Mini
PlanCenaLokalne wiadomości / 5hZadania chmurowe / 5hCode review / tydzień
Plus$20/mies.45-22510-6010-25
Pro$200/mies.300-150050-400100-250
Business$30/użytkownik/mies.45-22510-6010-25
EnterpriseKontakt z działem sprzedażyNa bazie kredytów (bez stałych limitów)Na bazie kredytówNa bazie kredytów
API KeyNa bazie użyciaCennik per-tokenN/AN/A

Limity lokalne i chmurowe dzielą pięciogodzinne okno kroczące. Mogą obowiązywać dodatkowe limity tygodniowe.

Kredyty rozszerzają twoje użycie po osiągnięciu wliczonych limitów. Koszt za wiadomość zmienia się w zależności od złożoności zadania:

PowierzchniaJednostkaGPT-5.3-CodexGPT-5.1-Codex-Mini
Lokalne zadania1 wiadomość~5 kredytów~1 kredyt
Zadania chmurowe1 wiadomość~25 kredytówN/A
Code review1 PR~25 kredytówN/A

GPT-5.1-Codex-Mini zapewnia około 4x więcej użycia na kredyt dla lokalnych zadań. Zadania chmurowe i code review nie są dostępne z Mini.

Największy czynnik kosztu to złożoność zadania. Każda wiadomość przetwarzana przez Codex zawiera twój prompt, AGENTS.md, definicje narzędzi MCP i zgromadzony kontekst.

Każda wiadomość Codex zawiera treść twojego AGENTS.md. Dla dużych projektów użyj zagnieżdżonych plików AGENTS.md:

# Root AGENTS.md (100 lines - loaded for all tasks)
AGENTS.md
# Service-specific (50 lines - loaded only when working in payments/)
services/payments/AGENTS.md
# Frontend-specific (50 lines - loaded only when working in frontend/)
packages/frontend/AGENTS.md

W ten sposób zadanie w services/payments/ ładuje 150 linii wskazówek zamiast monolitycznego pliku o 500 liniach.

Każdy skonfigurowany serwer MCP dodaje definicje narzędzi do twojego kontekstu. Wyłącz serwery MCP, których aktywnie nie używasz:

~/.codex/config.toml
[mcp_servers.sentry]
enabled = false # Re-enable when debugging production issues
[mcp_servers.linear]
enabled = true # Always useful for issue context

Strategia 4: Używaj GPT-5.1-Codex-Mini do prostych zadań

Dział zatytułowany „Strategia 4: Używaj GPT-5.1-Codex-Mini do prostych zadań”

Rezerwuj GPT-5.3-Codex do złożonego rozumowania. Przełącz na Mini dla:

  • Prostych refaktoringów i zmian nazw
  • Prostego pisania testów
  • Aktualizacji dokumentacji
  • Poprawek lintingu i formatowania

W CLI: codex --model gpt-5.1-codex-mini "add docstrings to all public functions in src/utils/"

W aplikacji: zmień model w dropdownie kompozytora wątku.

Lokalne zadania kosztują ~5 kredytów vs ~25 kredytów za zadania chmurowe. Używaj chmury tylko gdy potrzebujesz:

  • Zdalnego wykonania (delegowanie ze Slacka, urządzenia mobilnego lub innej strefy czasowej)
  • Pełnej izolacji środowiska
  • Równoległych prób best-of-N
  • Pracy na branchu, którego jeszcze nie wypchnąłeś (użyj codex cloud do delegowania z CLI)

Dashboard użycia Codex pokazuje:

  • Bieżące użycie w stosunku do limitów
  • Zużycie kredytów w czasie
  • Podział wg powierzchni (lokalne, chmurowe, code review)

Dla zespołów enterprise zbuduj automatyczne alerty:

// Check daily credit burn rate
const response = await fetch("https://chatgpt.com/codex/api/analytics/daily", {
headers: { Authorization: `Bearer ${adminToken}` }
});
const data = await response.json();
const dailyCredits = data.total_credits_used;
if (dailyCredits > DAILY_BUDGET * 0.8) {
await sendSlackAlert(`Codex credit usage at ${dailyCredits}/${DAILY_BUDGET} (80% of daily budget)`);
}

Automatyzacje to ukryty czynnik kosztowy, ponieważ działają nienadzorowane:

  • Przeglądaj kadencję: Czy twoja automatyzacja musi działać co godzinę? Codzienny interwał często wystarcza.
  • Zawężaj prompty: Szeroka automatyzacja “scan the entire codebase” kosztuje znacznie więcej niż “scan files changed in the last 24 hours.”
  • Używaj trybu read-only: Automatyzacje raportujące nie potrzebują dostępu do zapisu, a tryb read-only zapobiega niepotrzebnym wywołaniom narzędzi.
  • Archiwizuj ukończone uruchomienia: Stare worktree automatyzacji zajmują miejsce na dysku, a ich utworzenie zużyło kredyty. Archiwizuj to, co już przejrzałeś.
  • Trafienie w limity w środku sprintu: Kup dodatkowe kredyty przez dashboard użycia. Lub przełącz na GPT-5.1-Codex-Mini, żeby rozciągnąć pozostałe limity 4x.
  • Nieoczekiwane koszty zadań chmurowych: Przejrzyj, które integracje (Slack, Linear) tworzą zadania chmurowe. Rozważ ograniczenie dostępu do chmury dla konkretnych grup użytkowników przez RBAC.
  • Drenaż kredytów przez automatyzacje: Sprawdź sekcję Automations w sidebarze pod kątem uruchomień, które odpalają się zbyt często lub dają wyniki o niskiej wartości. Dostosuj kadencję lub wyłącz.
  • Niespodzianki z użyciem klucza API: Użycie klucza API jest rozliczane po standardowych stawkach API per token. Ustaw limity wydatków w dashboardzie platformy OpenAI.
  • Zarządzanie enterprise — RBAC i kontrole administracyjne do zarządzania kosztami w całym zespole
  • Automatyzacje — Zoptymalizuj harmonogramy i prompty automatyzacji pod kątem efektywności kosztowej
  • Tryb nieinteraktywny — Budżetuj użycie codex exec w pipeline’ach CI