Efektywny przegląd i zatwierdzanie pracy agenta

Masz pięć wątków Codex, które właśnie się zakończyły. Każdy wyprodukował wieloplikowy diff. Przeglądanie każdej linijki każdego diff-a niweluje sens delegowania — szybciej byłoby napisać kod samemu. Ale ślepe scalanie wyników agenta jest nieodpowiedzialne. Złoty środek to ustrukturyzowany przepływ pracy przeglądu, który szybko wychwytuje realne problemy, jednocześnie ufając agentowi w kwestii rutynowej poprawności.

Czego się nauczysz

Wielopoziomowy framework przeglądu, który dostosowuje głębokość na podstawie poziomu ryzyka
Wbudowany przepływ pracy /review do lokalnego przeglądu kodu przed commitowaniem
Techniki komentarzy inline w panelu diff-ów aplikacji Codex
Strategie trybów zatwierdzania, które balansują bezpieczeństwo z szybkością

Trzypoziomowy framework przeglądu

Poziom 1: Zaufaj i zweryfikuj (niskie ryzyko)

Dla zadań, w których agent uruchomił testy i przeszły pomyślnie:

Przeskanuj podsumowanie diff-a (zmienione pliki, dodane/usunięte linie)
Sprawdź, czy zestaw testów przeszedł
Pobieżnie sprawdź jedną lub dwie reprezentatywne zmiany
Scal

Przykłady: Aktualizacje dokumentacji, dodawanie testów, poprawki lintingu, proste refaktoryzacje.

Poziom 2: Zbadaj i iteruj (średnie ryzyko)

Dla zadań obejmujących logikę biznesową lub zmiany API:

Przeczytaj pełny diff plik po pliku
Sprawdź obsługę błędów i przypadki brzegowe
Zweryfikuj, czy test pokrywa nowe zachowanie
Użyj komentarzy inline w panelu diff-ów aplikacji, aby poprosić o zmiany
Pozwól Codex odnieść się do komentarzy w kolejnej turze

Przykłady: Nowe endpointy, zmiany schematu bazy danych, logika uwierzytelniania.

Poziom 3: Głęboki przegląd (wysokie ryzyko)

Dla zadań dotyczących bezpieczeństwa, płatności lub migracji danych:

Przeczytaj diff i otaczający kontekst
Ręcznie przetestuj zmiany w lokalnym środowisku
Uruchom narzędzia skanowania bezpieczeństwa
Przegląd w parze z innym człowiekiem
Rozważ użycie funkcji code review Codex jako niezależnej drugiej opinii

Przykłady: Przetwarzanie płatności, obsługa danych użytkownika, middleware bezpieczeństwa, migracje bazy danych.

Używanie /review w CLI

Polecenie /review uruchamia dedykowanego recenzenta, który czyta diff-y i raportuje priorytetyzowane ustalenia bez dotykania twojego drzewa roboczego:

Wpisz /review w CLI
Wybierz tryb przeglądu:
- Przegląd względem brancha bazowego: Znajduje bazę scalania i diff-uje twoją pracę
- Przegląd niezacommitowanych zmian: Sprawdza pliki staged, unstaged i untracked
- Przegląd commita: Wybiera konkretne SHA
- Własne instrukcje przeglądu: Twój własny prompt (np. “Focus on accessibility regressions”)
Przeczytaj ustalenia, które są priorytetyzowane według ważności
Napraw problemy i ponownie uruchom /review, aby zweryfikować poprawki

Komentarze inline w panelu diff-ów aplikacji

Panel diff-ów aplikacji Codex obsługuje komentarze inline. Gdy widzisz coś, co wymaga uwagi:

Kliknij numer linii w widoku diff-a
Dodaj swój komentarz (np. “This needs null checking” lub “Use the centralized error handler instead”)
Codex odniesie się do twoich komentarzy w następnej turze

To szybsze niż pisanie promptu uzupełniającego, ponieważ agent widzi dokładnie, o którą linię ci chodzi.

Strategie trybów zatwierdzania

Dopasuj tryb zatwierdzania do ryzyka zadania:

Tryb	Opis	Najlepszy do
Auto (domyślny)	Codex czyta, edytuje i uruchamia polecenia w przestrzeni roboczej. Pyta przed wyjściem poza zakres.	Większość prac programistycznych
Read Only	Codex przegląda pliki, ale nie może wprowadzać zmian ani uruchamiać poleceń, dopóki nie zatwierdzisz	Eksploracyjna analiza, zrozumienie nieznanego kodu
Pełny dostęp (sandbox `danger-full-access`)	Brak promptów o zatwierdzenie. Codex pracuje na całej maszynie, włącznie z siecią	Tylko zaufane repozytoria w izolowanych środowiskach

/permissions udostępnia Auto i Read Only jako nazwane tryby; nieobjęty sandboxem poziom „pełnego dostępu” to wartość sandboxa danger-full-access, a nie oznaczony etykietą tryb. Przełączaj tryby w trakcie sesji za pomocą /permissions w CLI.

Dla automatyzacji używaj approval_policy = "never" tylko gdy twój tryb sandboxa to workspace-write lub bardziej restrykcyjny. Nigdy nie łącz approval_policy = "never" z danger-full-access, chyba że maszyna jest w pełni izolowana.

Przegląd kodu Codex Cloud

Dla PR-ów hostowanych na GitHub, Codex może przeglądać automatycznie:

Automatyczne przeglądy: Wyzwalane, gdy otwierasz PR do przeglądu
Reaktywne przeglądy: Wspomnij @Codex w komentarzu PR, aby poprosić o konkretny feedback

Skonfiguruj w Settings > Code review. Przeglądy uruchamiane są w środowiskach chmurowych i wliczają się do limitów przeglądów kodu.

Kiedy to nie działa

Zmęczenie przeglądem przy zbyt wielu wątkach: Grupuj swoje przeglądy. Pozwól wątkom się nagromadzić przez godzinę, a potem przejrzyj je wszystkie w jednej sesji, korzystając ze skrzynki zadań w aplikacji Codex.
Agent wciąż popełnia ten sam błąd: Prompt lub AGENTS.md nie zawiera ograniczenia. Dodaj je jawnie i uruchom ponownie.
Komentarze inline nie są przechwytywane: Upewnij się, że komentarz jest na linii, która faktycznie została zmieniona. Komentarze na niezmienionych liniach kontekstu mogą być ignorowane.
Fałszywe poczucie bezpieczeństwa z przechodzących testów: Testy łapią tylko to, co pokrywają. Dla przeglądów Poziomu 3 ręcznie testuj przypadki brzegowe, które testy agenta mogą nie pokrywać.

Co dalej

Przepływy wieloagentowe — Gdy masz wiele wątków do przeglądu, równoległa dekompozycja pomaga
Inżynieria promptów — Lepsze prompty produkują kod wymagający mniejszego przeglądu
Przepływy zespołowe — Standaryzuj praktyki przeglądu w swoim zespole