Przejdź do głównej zawartości

Zarządzanie kontekstem na powierzchniach Codex

Twoja sesja Codex zaczęła się ostro. Po 20 turach wymiany zdań agent zaczyna tracić ślad wcześniejszych decyzji, powtarzać pracę lub zapominać ograniczenia ustalone na początku. To wyczerpanie okna kontekstu — i jest to najczęstszy zabójca produktywności w długotrwałych sesjach Codex. Zrozumienie tego, jak kontekst działa na różnych powierzchniach, pozwala utrzymać agenta w efektywności na czas nieokreślony.

  • Przejrzysty model tego, jak Codex zarządza kontekstem między wątkami, powierzchniami i sesjami
  • Techniki strukturyzowania AGENTS.md w celu minimalizacji narzutu kontekstowego
  • Strategie kompakcji, które zachowują kluczowe informacje, gdy okno się zapełnia
  • Wzorce kontekstu międzypowierzchniowego do przekazywania pracy między aplikacją, CLI i chmurą

Każda wiadomość w wątku musi mieścić się w oknie kontekstu modelu. Kontekst obejmuje:

  1. Instrukcje systemowe — Wbudowane zachowania Codex
  2. Zawartość AGENTS.md — Twoje globalne i projektowe wytyczne
  3. Definicje narzędzi MCP — Każdy skonfigurowany serwer MCP dodaje schematy narzędzi
  4. Metadane umiejętności — Nazwy i opisy dostępnych umiejętności
  5. Historia konwersacji — Każdy prompt, odpowiedź, wywołanie narzędzia i wynik
  6. Zawartość plików — Pliki, które agent przeczytał podczas sesji

Codex monitoruje pozostałą przestrzeń i raportuje ją. Gdy okno się wypełnia, Codex automatycznie kompaktuje kontekst, podsumowując istotne informacje i odrzucając mniej istotne szczegóły.

Traktuj swoje okno kontekstu jak budżet. Oto przybliżona alokacja dla typowej sesji GPT-5.3-Codex:

KomponentPrzybliżona liczba tokenówCzy możesz to kontrolować?
Instrukcje systemowe2 000-3 000Nie
AGENTS.md (wszystkie poziomy)500-5 000Tak — utrzymuj zwięzłość
Definicje narzędzi MCP500-3 000 na serwerTak — wyłącz nieużywane serwery
Metadane umiejętności200-500Tak — wyłącz nieużywane umiejętności
Historia konwersacjiResztaTak — kompakcja i świeże wątki

Zamiast jednego ogromnego AGENTS.md, podziel według specyficzności:

~/.codex/AGENTS.md # 20 linii: uniwersalne preferencje
repo-root/AGENTS.md # 40 linii: konwencje projektu
repo-root/services/api/AGENTS.md # 30 linii: reguły specyficzne dla API

Gdy pracujesz w services/api/, Codex ładuje ~90 linii wytycznych. Gdy pracujesz w katalogu głównym, ładuje ~60. To utrzymuje kontekst proporcjonalny do zakresu zadania.

Użyj AGENTS.override.md dla tymczasowego kontekstu:

services/api/AGENTS.override.md
# TYMCZASOWE: Usuń po zakończeniu migracji v2
- All new endpoints must use the v2 router in src/routes/v2/
- Do NOT modify any v1 routes
- Migration tracking doc: docs/v2-migration.md

Gdy migracja jest gotowa, usuń nadpisanie, aby przywrócić normalne wytyczne.

Gdy wątek staje się długi, Codex kompaktuje automatycznie. Możesz też wywołać to ręcznie. Oto jak sprawić, by kompakcja działała dobrze:

Umieść najważniejsze ograniczenia na początku sesji. Kompakcja zachowuje najnowsze i najważniejsze informacje, ale wcześniejsze tury są bardziej narażone na podsumowanie.

Zamiast jednego wątku z 50 turami, użyj pięciu wątków po 10 tur:

  1. Wątek 1: “Analyze the codebase and propose a migration plan”
  2. Wątek 2: “Implement phase 1 of the migration plan: [wklej podsumowanie z Wątku 1]”
  3. Wątek 3: “Implement phase 2: [wklej podsumowanie]”

Każdy wątek zaczyna z pełnym oknem kontekstu.

Gdy potrzebujesz, aby Wątek 2 wiedział, co zrobił Wątek 1, użyj wznawiania sesji:

Okno terminala
codex resume --last "Now implement the changes you proposed"

To przenosi cały transkrypt z poprzedniej sesji.

Aplikacja i CLI współdzielą tę samą konfigurację, AGENTS.md i umiejętności. Ale nie współdzielą historii wątków. Aby przekazać kontekst między nimi:

  • Użyj zintegrowanego terminala w aplikacji do uruchamiania poleceń CLI
  • Skopiuj odpowiednie podsumowanie z wątku aplikacji do promptu CLI
  • Lub użyj codex resume, aby kontynuować wątek aplikacji z CLI (jeśli sesja została zalogowana)

Zadania w chmurze nie mają dostępu do twojego lokalnego AGENTS.md ani serwerów MCP. Zamiast tego używają AGENTS.md zacommitowanego do repozytorium. Upewnij się, że twój AGENTS.md na poziomie repo zawiera kluczowe wytyczne potrzebne zadaniom w chmurze.

Gdy rozszerzenie IDE i aplikacja są zsynchronizowane, współdzielą widoczność wątków i automatyczny kontekst (otwarte pliki). To najpłynniejszy przepływ międzypowierzchniowy — używaj go domyślnie, gdy oba są dostępne.

  • Agent zapomina wcześniejsze instrukcje: Kontekst został skompaktowany i twoje instrukcje zostały streszczone. Powtórz kluczowe ograniczenie w bieżącym prompcie.
  • Wolne odpowiedzi: Pełne okno kontekstu oznacza, że model przetwarza więcej tokenów na turę. Rozpocznij świeży wątek dla następnej fazy pracy.
  • AGENTS.md się nie ładuje: Sprawdź, czy plik nie jest pusty i czy project_doc_max_bytes nie został przekroczony (domyślnie: 32KB). Uruchom codex --ask-for-approval never "Summarize the current instructions", aby zweryfikować.
  • Zadanie w chmurze ignoruje konwencje: Upewnij się, że twój AGENTS.md jest zacommitowany do repozytorium, a nie tylko na twojej lokalnej maszynie.