Kredyty, limity użycia i optymalizacja kosztów
Jesteś trzy dni w sprint i dashboard użycia Codex twojego zespołu pokazuje, że spaliliście 80% miesięcznych kredytów. Dwóch programistów uruchamia drogie zadania chmurowe do pracy eksploracyjnej, która mogłaby być lokalna. Jedna automatyzacja uruchamia się co godzinę, gdy wystarczyłoby co dzień. Bez widoczności i dyscypliny koszty Codex mogą cię zaskoczyć. Ten artykuł daje ci kontrole i strategie, żeby utrzymać wydatki na przewidywalnym poziomie.
Czego się nauczysz
Dział zatytułowany „Czego się nauczysz”- Jasne zrozumienie planów cenowych Codex, kosztów kredytów i limitów użycia
- Konkretne strategie redukujące zużycie kredytów o 30-50% bez poświęcania produktywności
- Wzorce monitorowania i alertów z dashboardu użycia i Analytics API
- Frameworki decyzyjne dotyczące wyboru: local vs cloud, GPT-5.3-Codex vs GPT-5.1-Codex-Mini
Plany cenowe w skrócie
Dział zatytułowany „Plany cenowe w skrócie”| Plan | Cena | Lokalne wiadomości / 5h | Zadania chmurowe / 5h | Code review / tydzień |
|---|---|---|---|---|
| Plus | $20/mies. | 45-225 | 10-60 | 10-25 |
| Pro | $200/mies. | 300-1500 | 50-400 | 100-250 |
| Business | $30/użytkownik/mies. | 45-225 | 10-60 | 10-25 |
| Enterprise | Kontakt z działem sprzedaży | Na bazie kredytów (bez stałych limitów) | Na bazie kredytów | Na bazie kredytów |
| API Key | Na bazie użycia | Cennik per-token | N/A | N/A |
Limity lokalne i chmurowe dzielą pięciogodzinne okno kroczące. Mogą obowiązywać dodatkowe limity tygodniowe.
Jak działają kredyty
Dział zatytułowany „Jak działają kredyty”Kredyty rozszerzają twoje użycie po osiągnięciu wliczonych limitów. Koszt za wiadomość zmienia się w zależności od złożoności zadania:
| Powierzchnia | Jednostka | GPT-5.3-Codex | GPT-5.1-Codex-Mini |
|---|---|---|---|
| Lokalne zadania | 1 wiadomość | ~5 kredytów | ~1 kredyt |
| Zadania chmurowe | 1 wiadomość | ~25 kredytów | N/A |
| Code review | 1 PR | ~25 kredytów | N/A |
GPT-5.1-Codex-Mini zapewnia około 4x więcej użycia na kredyt dla lokalnych zadań. Zadania chmurowe i code review nie są dostępne z Mini.
Strategie optymalizacji kosztów
Dział zatytułowany „Strategie optymalizacji kosztów”Strategia 1: Dobierz rozmiar zadań
Dział zatytułowany „Strategia 1: Dobierz rozmiar zadań”Największy czynnik kosztu to złożoność zadania. Każda wiadomość przetwarzana przez Codex zawiera twój prompt, AGENTS.md, definicje narzędzi MCP i zgromadzony kontekst.
Strategia 2: Zminimalizuj rozmiar AGENTS.md
Dział zatytułowany „Strategia 2: Zminimalizuj rozmiar AGENTS.md”Każda wiadomość Codex zawiera treść twojego AGENTS.md. Dla dużych projektów użyj zagnieżdżonych plików AGENTS.md:
# Root AGENTS.md (100 lines - loaded for all tasks)AGENTS.md
# Service-specific (50 lines - loaded only when working in payments/)services/payments/AGENTS.md
# Frontend-specific (50 lines - loaded only when working in frontend/)packages/frontend/AGENTS.mdW ten sposób zadanie w services/payments/ ładuje 150 linii wskazówek zamiast monolitycznego pliku o 500 liniach.
Strategia 3: Ogranicz serwery MCP
Dział zatytułowany „Strategia 3: Ogranicz serwery MCP”Każdy skonfigurowany serwer MCP dodaje definicje narzędzi do twojego kontekstu. Wyłącz serwery MCP, których aktywnie nie używasz:
[mcp_servers.sentry]enabled = false # Re-enable when debugging production issues
[mcp_servers.linear]enabled = true # Always useful for issue contextStrategia 4: Używaj GPT-5.1-Codex-Mini do prostych zadań
Dział zatytułowany „Strategia 4: Używaj GPT-5.1-Codex-Mini do prostych zadań”Rezerwuj GPT-5.3-Codex do złożonego rozumowania. Przełącz na Mini dla:
- Prostych refaktoringów i zmian nazw
- Prostego pisania testów
- Aktualizacji dokumentacji
- Poprawek lintingu i formatowania
W CLI: codex --model gpt-5.1-codex-mini "add docstrings to all public functions in src/utils/"
W aplikacji: zmień model w dropdownie kompozytora wątku.
Strategia 5: Preferuj lokalne nad chmurowe
Dział zatytułowany „Strategia 5: Preferuj lokalne nad chmurowe”Lokalne zadania kosztują ~5 kredytów vs ~25 kredytów za zadania chmurowe. Używaj chmury tylko gdy potrzebujesz:
- Zdalnego wykonania (delegowanie ze Slacka, urządzenia mobilnego lub innej strefy czasowej)
- Pełnej izolacji środowiska
- Równoległych prób best-of-N
- Pracy na branchu, którego jeszcze nie wypchnąłeś (użyj
codex clouddo delegowania z CLI)
Monitorowanie i alerty
Dział zatytułowany „Monitorowanie i alerty”Dashboard użycia
Dział zatytułowany „Dashboard użycia”Dashboard użycia Codex pokazuje:
- Bieżące użycie w stosunku do limitów
- Zużycie kredytów w czasie
- Podział wg powierzchni (lokalne, chmurowe, code review)
Analytics API dla zespołów
Dział zatytułowany „Analytics API dla zespołów”Dla zespołów enterprise zbuduj automatyczne alerty:
// Check daily credit burn rateconst response = await fetch("https://chatgpt.com/codex/api/analytics/daily", { headers: { Authorization: `Bearer ${adminToken}` }});
const data = await response.json();const dailyCredits = data.total_credits_used;
if (dailyCredits > DAILY_BUDGET * 0.8) { await sendSlackAlert(`Codex credit usage at ${dailyCredits}/${DAILY_BUDGET} (80% of daily budget)`);}Kontrola kosztów automatyzacji
Dział zatytułowany „Kontrola kosztów automatyzacji”Automatyzacje to ukryty czynnik kosztowy, ponieważ działają nienadzorowane:
- Przeglądaj kadencję: Czy twoja automatyzacja musi działać co godzinę? Codzienny interwał często wystarcza.
- Zawężaj prompty: Szeroka automatyzacja “scan the entire codebase” kosztuje znacznie więcej niż “scan files changed in the last 24 hours.”
- Używaj trybu read-only: Automatyzacje raportujące nie potrzebują dostępu do zapisu, a tryb read-only zapobiega niepotrzebnym wywołaniom narzędzi.
- Archiwizuj ukończone uruchomienia: Stare worktree automatyzacji zajmują miejsce na dysku, a ich utworzenie zużyło kredyty. Archiwizuj to, co już przejrzałeś.
Gdy coś nie działa
Dział zatytułowany „Gdy coś nie działa”- Trafienie w limity w środku sprintu: Kup dodatkowe kredyty przez dashboard użycia. Lub przełącz na GPT-5.1-Codex-Mini, żeby rozciągnąć pozostałe limity 4x.
- Nieoczekiwane koszty zadań chmurowych: Przejrzyj, które integracje (Slack, Linear) tworzą zadania chmurowe. Rozważ ograniczenie dostępu do chmury dla konkretnych grup użytkowników przez RBAC.
- Drenaż kredytów przez automatyzacje: Sprawdź sekcję Automations w sidebarze pod kątem uruchomień, które odpalają się zbyt często lub dają wyniki o niskiej wartości. Dostosuj kadencję lub wyłącz.
- Niespodzianki z użyciem klucza API: Użycie klucza API jest rozliczane po standardowych stawkach API per token. Ustaw limity wydatków w dashboardzie platformy OpenAI.
Co dalej
Dział zatytułowany „Co dalej”- Zarządzanie enterprise — RBAC i kontrole administracyjne do zarządzania kosztami w całym zespole
- Automatyzacje — Zoptymalizuj harmonogramy i prompty automatyzacji pod kątem efektywności kosztowej
- Tryb nieinteraktywny — Budżetuj użycie
codex execw pipeline’ach CI