Zarządzanie kontekstem na powierzchniach Codex

Twoja sesja Codex zaczęła się ostro. Po 20 turach wymiany zdań agent zaczyna tracić ślad wcześniejszych decyzji, powtarzać pracę lub zapominać ograniczenia ustalone na początku. To wyczerpanie okna kontekstu — i jest to najczęstszy zabójca produktywności w długotrwałych sesjach Codex. Zrozumienie tego, jak kontekst działa na różnych powierzchniach, pozwala utrzymać agenta w efektywności na czas nieokreślony.

Czego się nauczysz

Przejrzysty model tego, jak Codex zarządza kontekstem między wątkami, powierzchniami i sesjami
Techniki strukturyzowania AGENTS.md w celu minimalizacji narzutu kontekstowego
Strategie kompakcji, które zachowują kluczowe informacje, gdy okno się zapełnia
Wzorce kontekstu międzypowierzchniowego do przekazywania pracy między aplikacją, CLI i chmurą

Jak działa kontekst Codex

Każda wiadomość w wątku musi mieścić się w oknie kontekstu modelu. Kontekst obejmuje:

Instrukcje systemowe — Wbudowane zachowania Codex
Zawartość AGENTS.md — Twoje globalne i projektowe wytyczne
Definicje narzędzi MCP — Każdy skonfigurowany serwer MCP dodaje schematy narzędzi
Metadane umiejętności — Nazwy i opisy dostępnych umiejętności
Historia konwersacji — Każdy prompt, odpowiedź, wywołanie narzędzia i wynik
Zawartość plików — Pliki, które agent przeczytał podczas sesji

Codex monitoruje pozostałą przestrzeń i raportuje ją. Gdy okno się wypełnia, Codex automatycznie kompaktuje kontekst, podsumowując istotne informacje i odrzucając mniej istotne szczegóły.

Planowanie budżetu kontekstu

Traktuj swoje okno kontekstu jak budżet. Oto przybliżona alokacja dla typowej sesji GPT-5.3-Codex:

Komponent	Przybliżona liczba tokenów	Czy możesz to kontrolować?
Instrukcje systemowe	2 000-3 000	Nie
AGENTS.md (wszystkie poziomy)	500-5 000	Tak — utrzymuj zwięzłość
Definicje narzędzi MCP	500-3 000 na serwer	Tak — wyłącz nieużywane serwery
Metadane umiejętności	200-500	Tak — wyłącz nieużywane umiejętności
Historia konwersacji	Reszta	Tak — kompakcja i świeże wątki

Optymalizacja kontekstu AGENTS.md

Strategia warstwowania

Zamiast jednego ogromnego AGENTS.md, podziel według specyficzności:

~/.codex/AGENTS.md                    # 20 linii: uniwersalne preferencje
repo-root/AGENTS.md                   # 40 linii: konwencje projektu
repo-root/services/api/AGENTS.md      # 30 linii: reguły specyficzne dla API

Gdy pracujesz w services/api/, Codex ładuje ~90 linii wytycznych. Gdy pracujesz w katalogu głównym, ładuje ~60. To utrzymuje kontekst proporcjonalny do zakresu zadania.

Wzorzec nadpisywania

Użyj AGENTS.override.md dla tymczasowego kontekstu:

# TYMCZASOWE: Usuń po zakończeniu migracji v2

- All new endpoints must use the v2 router in src/routes/v2/
- Do NOT modify any v1 routes
- Migration tracking doc: docs/v2-migration.md

Gdy migracja jest gotowa, usuń nadpisanie, aby przywrócić normalne wytyczne.

Strategie kompakcji

Gdy wątek staje się długi, Codex kompaktuje automatycznie. Możesz też wywołać to ręcznie. Oto jak sprawić, by kompakcja działała dobrze:

Kluczowy kontekst na początku

Umieść najważniejsze ograniczenia na początku sesji. Kompakcja zachowuje najnowsze i najważniejsze informacje, ale wcześniejsze tury są bardziej narażone na podsumowanie.

Agresywnie korzystaj ze świeżych wątków

Zamiast jednego wątku z 50 turami, użyj pięciu wątków po 10 tur:

Wątek 1: “Analyze the codebase and propose a migration plan”
Wątek 2: “Implement phase 1 of the migration plan: [wklej podsumowanie z Wątku 1]”
Wątek 3: “Implement phase 2: [wklej podsumowanie]”

Każdy wątek zaczyna z pełnym oknem kontekstu.

Wznawianie dla ciągłości

Gdy potrzebujesz, aby Wątek 2 wiedział, co zrobił Wątek 1, użyj wznawiania sesji:

codex resume --last "Now implement the changes you proposed"

To przenosi cały transkrypt z poprzedniej sesji.

Przepływ kontekstu między powierzchniami

Z aplikacji do CLI

Aplikacja i CLI współdzielą tę samą konfigurację, AGENTS.md i umiejętności. Ale nie współdzielą historii wątków. Aby przekazać kontekst między nimi:

Użyj zintegrowanego terminala w aplikacji do uruchamiania poleceń CLI
Skopiuj odpowiednie podsumowanie z wątku aplikacji do promptu CLI
Lub użyj codex resume, aby kontynuować wątek aplikacji z CLI (jeśli sesja została zalogowana)

Z lokalnego do chmury

Zadania w chmurze nie mają dostępu do twojego lokalnego AGENTS.md ani serwerów MCP. Zamiast tego używają AGENTS.md zacommitowanego do repozytorium. Upewnij się, że twój AGENTS.md na poziomie repo zawiera kluczowe wytyczne potrzebne zadaniom w chmurze.

Z IDE do aplikacji

Gdy rozszerzenie IDE i aplikacja są zsynchronizowane, współdzielą widoczność wątków i automatyczny kontekst (otwarte pliki). To najpłynniejszy przepływ międzypowierzchniowy — używaj go domyślnie, gdy oba są dostępne.

Kiedy to nie działa

Agent zapomina wcześniejsze instrukcje: Kontekst został skompaktowany i twoje instrukcje zostały streszczone. Powtórz kluczowe ograniczenie w bieżącym prompcie.
Wolne odpowiedzi: Pełne okno kontekstu oznacza, że model przetwarza więcej tokenów na turę. Rozpocznij świeży wątek dla następnej fazy pracy.
AGENTS.md się nie ładuje: Sprawdź, czy plik nie jest pusty i czy project_doc_max_bytes nie został przekroczony (domyślnie: 32KB). Uruchom codex --ask-for-approval never "Summarize the current instructions", aby zweryfikować.
Zadanie w chmurze ignoruje konwencje: Upewnij się, że twój AGENTS.md jest zacommitowany do repozytorium, a nie tylko na twojej lokalnej maszynie.

Co dalej

Inżynieria promptów — Pisz prompty, które działają w ramach twojego budżetu kontekstu
Triki efektywności — Szybkie wskazówki wydłużające życie kontekstu
Przepływy wieloagentowe — Dzielenie pracy między wątki dzieli też presję kontekstową