Zarządzanie kontekstem na powierzchniach Codex
Twoja sesja Codex zaczęła się ostro. Po 20 turach wymiany zdań agent zaczyna tracić ślad wcześniejszych decyzji, powtarzać pracę lub zapominać ograniczenia ustalone na początku. To wyczerpanie okna kontekstu — i jest to najczęstszy zabójca produktywności w długotrwałych sesjach Codex. Zrozumienie tego, jak kontekst działa na różnych powierzchniach, pozwala utrzymać agenta w efektywności na czas nieokreślony.
Czego się nauczysz
Dział zatytułowany „Czego się nauczysz”- Przejrzysty model tego, jak Codex zarządza kontekstem między wątkami, powierzchniami i sesjami
- Techniki strukturyzowania AGENTS.md w celu minimalizacji narzutu kontekstowego
- Strategie kompakcji, które zachowują kluczowe informacje, gdy okno się zapełnia
- Wzorce kontekstu międzypowierzchniowego do przekazywania pracy między aplikacją, CLI i chmurą
Jak działa kontekst Codex
Dział zatytułowany „Jak działa kontekst Codex”Każda wiadomość w wątku musi mieścić się w oknie kontekstu modelu. Kontekst obejmuje:
- Instrukcje systemowe — Wbudowane zachowania Codex
- Zawartość AGENTS.md — Twoje globalne i projektowe wytyczne
- Definicje narzędzi MCP — Każdy skonfigurowany serwer MCP dodaje schematy narzędzi
- Metadane umiejętności — Nazwy i opisy dostępnych umiejętności
- Historia konwersacji — Każdy prompt, odpowiedź, wywołanie narzędzia i wynik
- Zawartość plików — Pliki, które agent przeczytał podczas sesji
Codex monitoruje pozostałą przestrzeń i raportuje ją. Gdy okno się wypełnia, Codex automatycznie kompaktuje kontekst, podsumowując istotne informacje i odrzucając mniej istotne szczegóły.
Planowanie budżetu kontekstu
Dział zatytułowany „Planowanie budżetu kontekstu”Traktuj swoje okno kontekstu jak budżet. Oto przybliżona alokacja dla typowej sesji GPT-5.3-Codex:
| Komponent | Przybliżona liczba tokenów | Czy możesz to kontrolować? |
|---|---|---|
| Instrukcje systemowe | 2 000-3 000 | Nie |
| AGENTS.md (wszystkie poziomy) | 500-5 000 | Tak — utrzymuj zwięzłość |
| Definicje narzędzi MCP | 500-3 000 na serwer | Tak — wyłącz nieużywane serwery |
| Metadane umiejętności | 200-500 | Tak — wyłącz nieużywane umiejętności |
| Historia konwersacji | Reszta | Tak — kompakcja i świeże wątki |
Optymalizacja kontekstu AGENTS.md
Dział zatytułowany „Optymalizacja kontekstu AGENTS.md”Strategia warstwowania
Dział zatytułowany „Strategia warstwowania”Zamiast jednego ogromnego AGENTS.md, podziel według specyficzności:
~/.codex/AGENTS.md # 20 linii: uniwersalne preferencjerepo-root/AGENTS.md # 40 linii: konwencje projekturepo-root/services/api/AGENTS.md # 30 linii: reguły specyficzne dla APIGdy pracujesz w services/api/, Codex ładuje ~90 linii wytycznych. Gdy pracujesz w katalogu głównym, ładuje ~60. To utrzymuje kontekst proporcjonalny do zakresu zadania.
Wzorzec nadpisywania
Dział zatytułowany „Wzorzec nadpisywania”Użyj AGENTS.override.md dla tymczasowego kontekstu:
# TYMCZASOWE: Usuń po zakończeniu migracji v2
- All new endpoints must use the v2 router in src/routes/v2/- Do NOT modify any v1 routes- Migration tracking doc: docs/v2-migration.mdGdy migracja jest gotowa, usuń nadpisanie, aby przywrócić normalne wytyczne.
Strategie kompakcji
Dział zatytułowany „Strategie kompakcji”Gdy wątek staje się długi, Codex kompaktuje automatycznie. Możesz też wywołać to ręcznie. Oto jak sprawić, by kompakcja działała dobrze:
Kluczowy kontekst na początku
Dział zatytułowany „Kluczowy kontekst na początku”Umieść najważniejsze ograniczenia na początku sesji. Kompakcja zachowuje najnowsze i najważniejsze informacje, ale wcześniejsze tury są bardziej narażone na podsumowanie.
Agresywnie korzystaj ze świeżych wątków
Dział zatytułowany „Agresywnie korzystaj ze świeżych wątków”Zamiast jednego wątku z 50 turami, użyj pięciu wątków po 10 tur:
- Wątek 1: “Analyze the codebase and propose a migration plan”
- Wątek 2: “Implement phase 1 of the migration plan: [wklej podsumowanie z Wątku 1]”
- Wątek 3: “Implement phase 2: [wklej podsumowanie]”
Każdy wątek zaczyna z pełnym oknem kontekstu.
Wznawianie dla ciągłości
Dział zatytułowany „Wznawianie dla ciągłości”Gdy potrzebujesz, aby Wątek 2 wiedział, co zrobił Wątek 1, użyj wznawiania sesji:
codex resume --last "Now implement the changes you proposed"To przenosi cały transkrypt z poprzedniej sesji.
Przepływ kontekstu między powierzchniami
Dział zatytułowany „Przepływ kontekstu między powierzchniami”Z aplikacji do CLI
Dział zatytułowany „Z aplikacji do CLI”Aplikacja i CLI współdzielą tę samą konfigurację, AGENTS.md i umiejętności. Ale nie współdzielą historii wątków. Aby przekazać kontekst między nimi:
- Użyj zintegrowanego terminala w aplikacji do uruchamiania poleceń CLI
- Skopiuj odpowiednie podsumowanie z wątku aplikacji do promptu CLI
- Lub użyj
codex resume, aby kontynuować wątek aplikacji z CLI (jeśli sesja została zalogowana)
Z lokalnego do chmury
Dział zatytułowany „Z lokalnego do chmury”Zadania w chmurze nie mają dostępu do twojego lokalnego AGENTS.md ani serwerów MCP. Zamiast tego używają AGENTS.md zacommitowanego do repozytorium. Upewnij się, że twój AGENTS.md na poziomie repo zawiera kluczowe wytyczne potrzebne zadaniom w chmurze.
Z IDE do aplikacji
Dział zatytułowany „Z IDE do aplikacji”Gdy rozszerzenie IDE i aplikacja są zsynchronizowane, współdzielą widoczność wątków i automatyczny kontekst (otwarte pliki). To najpłynniejszy przepływ międzypowierzchniowy — używaj go domyślnie, gdy oba są dostępne.
Kiedy to nie działa
Dział zatytułowany „Kiedy to nie działa”- Agent zapomina wcześniejsze instrukcje: Kontekst został skompaktowany i twoje instrukcje zostały streszczone. Powtórz kluczowe ograniczenie w bieżącym prompcie.
- Wolne odpowiedzi: Pełne okno kontekstu oznacza, że model przetwarza więcej tokenów na turę. Rozpocznij świeży wątek dla następnej fazy pracy.
- AGENTS.md się nie ładuje: Sprawdź, czy plik nie jest pusty i czy
project_doc_max_bytesnie został przekroczony (domyślnie: 32KB). Uruchomcodex --ask-for-approval never "Summarize the current instructions", aby zweryfikować. - Zadanie w chmurze ignoruje konwencje: Upewnij się, że twój AGENTS.md jest zacommitowany do repozytorium, a nie tylko na twojej lokalnej maszynie.
Co dalej
Dział zatytułowany „Co dalej”- Inżynieria promptów — Pisz prompty, które działają w ramach twojego budżetu kontekstu
- Triki efektywności — Szybkie wskazówki wydłużające życie kontekstu
- Przepływy wieloagentowe — Dzielenie pracy między wątki dzieli też presję kontekstową