Przejdź do głównej zawartości

Kiedy używać trybu agenta vs trybu zapytań

Musisz zrozumieć, jak działa moduł przetwarzania płatności, zanim go zrefaktoryzujesz. Otwierasz AI w domyślnym trybie agenta, pytasz “jak działa przetwarzanie płatności w tym kodzie?” i AI natychmiast zaczyna czytać pliki, uruchamiać komendy grep i zużywa 40 000 tokenów kontekstu, zanim da ci trzyzadaniową odpowiedź. Mógłbyś uzyskać tę samą odpowiedź za ułamek zużycia kontekstu, gdybyś używał odpowiedniego trybu.

Każde narzędzie — Cursor, Claude Code i Codex — oferuje tryby kontrolujące, ile autonomii ma AI. Spektrum sięga od “tylko czytaj i analizuj” do “wykonuj wszystko autonomicznie”. Zrozumienie tego spektrum i tego, kiedy używać każdego ustawienia, jest fundamentalne dla efektywnej pracy.

  • Przejrzyste mapowanie trybów we wszystkich trzech narzędziach
  • Kryteria decyzyjne do wyboru odpowiedniego trybu dla każdego typu zadania
  • Prompty zoptymalizowane pod każdy tryb
  • Strategie przechodzenia między trybami w ramach jednego przepływu pracy

Wszystkie trzy narzędzia mają to samo fundamentalne spektrum, nawet jeśli używają różnej terminologii:

MożliwośćCursorClaude CodeCodex
Analiza tylko do odczytuAsk mode / Manual modePlan Mode (Shift+Tab)Ask-for-approval: always
Kierowane wykonywanieAgent mode (domyślny)Normal Mode (domyślny)Ask-for-approval: edits-only
Pełna autonomiaYOLO mode / Background Agent--dangerously-skip-permissions / SandboxAsk-for-approval: never

Użyj go, gdy chcesz zrozumieć kod bez jego modyfikowania. AI czyta pliki i odpowiada na pytania, ale nie może wprowadzać zmian.

Przełącz na Ask mode lub Manual mode w selektorze trybów. AI przeanalizuje kod bez wprowadzania zmian:

How does the authentication flow work? Trace the request from
the login endpoint through middleware to the session store.
Show me the key files and functions involved.

Ask mode jest oszczędny pod względem tokenów, ponieważ AI skupia się na odpowiadaniu na twoje pytanie, zamiast eksplorować szerzej. Wykorzystuje indeks bazy kodu do wyszukiwania, zamiast czytać pliki jeden po drugim.

Najlepsze zastosowania: przegląd kodu, analiza architektury, wdrażanie się w nową bazę kodu, zrozumienie nieznanego kodu, badanie błędów przed ich naprawianiem.

Domyślny tryb dla wszystkich trzech narzędzi. AI może czytać pliki, wprowadzać zmiany i uruchamiać komendy, ale prosi o pozwolenie w kluczowych momentach. To główny tryb roboczy dla większości zadań programistycznych.

Agent mode jest domyślny. Agent Cursor czyta pliki, proponuje edycje i uruchamia komendy terminala. Możesz przeglądać zmiany w widoku diff przed zaakceptowaniem:

Implement the rate limiter middleware following the pattern in
@src/middleware/auth.ts. Write tests in @src/middleware/__tests__/.
Run the tests after implementation.

Skonfiguruj, które narzędzia agent może używać w Cursor Settings. Możesz zezwolić na edycje plików, ale wymagać zatwierdzenia dla komend terminala, lub odwrotnie.

Najlepsze zastosowania: implementacja funkcjonalności, naprawianie błędów, refaktoryzacja, pisanie testów, większość codziennej pracy programistycznej.

AI działa bez przerw. Potężny dla dobrze zdefiniowanych zadań niskiego ryzyka. Niebezpieczny dla wszystkiego, co dotyka wrażliwego kodu.

YOLO mode automatycznie akceptuje wszystkie zmiany i komendy. Background Agent uruchamia zadania asynchronicznie w izolowanych worktree:

Fix all ESLint warnings in src/components/. Run npm run lint
after each fix to verify. Commit each fix separately with a
descriptive message.

Background Agent to bezpieczniejsza opcja dla autonomicznej pracy. Działa we własnym worktree, więc twój katalog roboczy pozostaje nietknięty, dopóki nie przejrzysz i nie scalisz zmian.

Najlepsze zastosowania: poprawki lintingu, formatowanie, masowa zmiana nazw, generowanie dokumentacji, szablony testów, skrypty migracji wielu plików.

Użyj tego schematu przy wyborze trybu:

  1. Chcesz zrozumieć kod, a nie go zmieniać? Użyj trybu tylko do odczytu/analizy.
  2. Zadanie jest dobrze zdefiniowane z jasną weryfikacją? Użyj trybu kierowanego wykonywania i pozwól AI pracować przez zadanie z twoim okresowym przeglądem.
  3. Zadanie jest mechaniczne i niskiego ryzyka? Rozważ tryb pełnej autonomii z odpowiednią izolacją (background agent, sandbox, wątek cloudowy).
  4. Zadanie dotyka wrażliwego kodu? Użyj kierowanego wykonywania z zatwierdzaniem per plik.
  5. Nie jesteś pewien, którego trybu użyć? Zacznij od kierowanego wykonywania. Zawsze możesz poluzować uprawnienia w trakcie sesji.

Zaawansowane zespoły używają różnych trybów jednocześnie w wielu sesjach:

Uruchom Background Agent na zadaniu poprawek lintingu (autonomicznie), a jednocześnie używaj głównego Agenta do rozwoju funkcjonalności (kierowane). Przejrzyj zmiany Background Agenta, gdy będą gotowe, bez przerywania pracy nad funkcjonalnością.

Zostajesz w trybie analizy zbyt długo. Jeśli spędzasz 30 minut pytając AI o bazę kodu, zanim napiszesz jakikolwiek kod, zużyłeś kontekst, który mógłby być użyty do implementacji. Ustaw limit czasowy na analizę (5-10 minut), a następnie przełącz na implementację.

Używasz pełnej autonomii przy złożonych zadaniach. Tryb autonomiczny działa dla mechanicznych zadań z jasną weryfikacją. Dla zadań wymagających osądu (projektowanie API, strategia obsługi błędów, optymalizacja wydajności) tryb kierowany z przeglądem człowieka daje lepsze wyniki.

Mieszasz tryby w jednym prompcie. Proszenie AI, żeby “przeanalizowało moduł auth, a następnie go zrefaktoryzowało” w jednym prompcie zmusza je do wewnętrznego przełączania trybów, co często prowadzi do pominięcia analizy i przeskoczenia prosto do refaktoryzacji. Rozdziel analizę i implementację na oddzielne prompty.

Zapominasz przełączać z powrotem. Po użyciu trybu analizy do badania, niektórzy programiści zapominają przełączać z powrotem na tryb wykonywania i zastanawiają się, dlaczego AI nie wprowadza zmian. Sprawdź aktualny tryb, jeśli AI wydaje się nie reagować na prośbę o implementację.