Opóźnienie odpowiedzi
Czas od promptu do pierwszego tokena wyjściowego
Cel: < 2s dla prostych zadań
Optymalizacja wydajności w Claude Code to nie tylko kwestia szybkości — to maksymalizacja wartości wydobytej z każdego tokena przy zachowaniu wysokiej jakości wyników. Ten przewodnik dostarcza eksperckich strategii dostrajania Claude Code do obsługi wszystkiego, od szybkich poprawek po masywne operacje refaktoryzacji.
Opóźnienie odpowiedzi
Czas od promptu do pierwszego tokena wyjściowego
Cel: < 2s dla prostych zadań
Efektywność tokenów
Jakość wyjścia na zużyty token
Cel: > 80% użytecznej treści
Wykorzystanie kontekstu
Istotny kontekst vs całkowity kontekst
Cel: > 70% trafności
Wskaźnik ukończenia zadań
Wskaźnik sukcesu za pierwszym razem
Cel: > 90% dla rutynowych zadań
Wąskie gardło | Wpływ | Strategia łagodzenia |
---|---|---|
Duże okno kontekstu | Wolniejsze odpowiedzi, wyższe koszty | Użyj /clear , skoncentrowane zapytania |
Złożone rozumowanie | Wydłużony czas myślenia | Strategiczny wybór modelu |
Operacje systemu plików | Opóźnienia I/O | Operacje wsadowe, buforowanie |
Opóźnienie sieci | Opóźnienia odpowiedzi API | Lokalne buforowanie, równoległe żądania |
Nieefektywne prompty | Zmarnowane tokeny, słabe wyniki | Techniki optymalizacji promptów |
Strukturyzuj swoje pliki CLAUDE.md dla optymalnego ładowania kontekstu:
# Główny CLAUDE.md (maks. 500 tokenów)## Tylko krytyczne informacje o projekcie- Architektura: Mikroserwisy z Node.js- Kluczowe polecenia: npm run dev, npm test- Standardy kodowania: ESLint + Prettier
# Frontend CLAUDE.md (maks. 300 tokenów)## Specyficzne dla frontendu- Framework: React 18 z TypeScript- Stan: Magazyny Zustand w /src/stores- Komponenty: /src/components zgodnie z atomic design
# Backend CLAUDE.md (maks. 300 tokenów)## Specyficzne dla API- Framework: Express z TypeScript- Uwierzytelnianie: JWT w /src/middleware/auth- Baza danych: Prisma ORM z PostgreSQL
# Ładuje cały kontekst projektuclaude> Przeanalizuj całą bazę kodu i znajdź wszystkie komentarze TODO
# Przeszukuje wszystko> Jakie metody uwierzytelniania są używane w całym projekcie?
# Załaduj tylko istotne katalogiclaude --add-dir src/auth src/middleware> Wyjaśnij przepływ uwierzytelniania
# Skoncentrowane wyszukiwanie> Znajdź komentarze TODO w src/auth/ związane z wygaśnięciem JWT
Użyj /compact
z niestandardowymi instrukcjami:
claude> /compact Zachowaj tylko: zmiany kodu, wyniki testów, decyzje architektoniczne
# Lub skonfiguruj w CLAUDE.md# Zasady kompaktowaniaPodczas kompaktowania:- ZACHOWAJ: Próbki kodu, komunikaty o błędach, podjęte decyzje- USUŃ: Wyjaśnienia, przykłady, pośrednie próby- PODSUMUJ: Długie dyskusje w punkty
Śledź wykorzystanie kontekstu, aby zoptymalizować czas:
# Sprawdź obecny status kontekstuclaude> /context
Obecne wykorzystanie kontekstu:- Łączne tokeny: 45,231 / 100,000 (45%)- Załadowane pliki: 23- Długość konwersacji: 2,341 tokenów- Pliki CLAUDE.md: 3 (1,245 tokenów)
# Wyczyść przed osiągnięciem limitówclaude> /clear # Resetuj gdy > 80% pełne
Skonfiguruj inteligentne przełączanie modeli na podstawie złożoności zadania:
{ "model": "claude-3-5-sonnet-20241022", "modelStrategy": { "autoSwitch": true, "rules": [ { "pattern": "popraw literówkę|zmień nazwę|formatuj", "model": "claude-3-haiku-20250720", "reason": "Proste operacje tekstowe" }, { "pattern": "implementuj|utwórz|zbuduj", "model": "claude-3-5-sonnet-20241022", "reason": "Standardowy rozwój" }, { "pattern": "zaprojektuj architekturę|przeprojektuj|refaktoryzuj całość", "model": "claude-4.1-opus-20250720", "reason": "Wymagane złożone rozumowanie" } ] }}
Kontroluj głębokość rozumowania dla różnych zadań:
Typ zadania | Tokeny myślenia | Przypadek użycia |
---|---|---|
Szybka poprawka | 0-1,000 | Literówki, formatowanie, proste edycje |
Standardowy rozwój | 5,000-10,000 | Implementacja funkcji, poprawki błędów |
Złożona analiza | 20,000-50,000 | Decyzje architektoniczne, refaktoryzacja |
Głęboka architektura | 100,000-128,000 | Projektowanie systemu, główne przepisania |
Wyzwalaj konkretne tryby myślenia:
# Minimalne myślenieclaude> Popraw literówkę w README.md
# Standardowe myślenieclaude> think: Zaimplementuj uwierzytelnianie użytkownika
# Głębokie myślenieclaude> think hard: Zrefaktoryzuj cały system uwierzytelniania
# Maksymalne myślenieclaude> ultrathink: Zaprojektuj nową architekturę mikroserwisów
Grupuj podobne operacje dla efektywności:
Zidentyfikuj powtarzalne zadania
claude> Wymień wszystkie komponenty React bez PropTypes
Utwórz operację wsadową
claude> Dla każdego komponentu z powyższej listy dodaj definicje PropTypes na podstawie faktycznego użycia
Wykonaj równolegle
claude> Przetwarzaj komponenty w grupach po 5, aby zachować efektywność kontekstu
Zacznij prosto i buduj złożoność:
# Krok 1: Podstawowa implementacjaclaude> Utwórz prosty punkt końcowy rejestracji użytkownika
# Krok 2: Dodaj walidacjęclaude> Dodaj walidację danych wejściowych do punktu końcowego rejestracji
# Krok 3: Dodaj bezpieczeństwoclaude> Zaimplementuj ograniczanie częstotliwości i CAPTCHA
# Krok 4: Optymalizujclaude> Dodaj buforowanie i zoptymalizuj zapytania do bazy danych
Uruchom wiele instancji dla różnych zadań:
# Terminal 1: Praca frontendcd frontend && claude --add-dir src/components> Zrefaktoryzuj wszystkie komponenty przycisków, aby używały nowego systemu projektowania
# Terminal 2: Praca backendcd backend && claude --add-dir src/api> Zaimplementuj nowe punkty końcowe REST do zarządzania użytkownikami
# Terminal 3: Testowaniecd . && claude --add-dir tests> Napisz testy integracyjne dla nowych funkcji
Twórz punkty przywracania dla złożonych operacji:
# Przed dużymi zmianamigit checkout -b ai-refactor-authgit commit -am "Punkt kontrolny przed refaktoryzacją uwierzytelniania"
# Pozwól Claude pracowaćclaude> Zrefaktoryzuj uwierzytelnianie, aby używać OAuth2
# W razie potrzeby przywróćgit reset --hard HEAD~1
Dla ogromnych plików używaj ukierunkowanych podejść:
# Zamiast ładować cały plikclaude> Przeanalizuj cały plik UserService.js
# Użyj skoncentrowanej analizyclaude> W UserService.js przeanalizuj tylko metody uwierzytelniania (linie 2000-3000)
# Lub najpierw wyszukajclaude> Przeszukaj UserService.js w poszukiwaniu metod związanych z resetowaniem hasłaclaude> Teraz zoptymalizuj znaleziony przepływ resetowania hasła
Dla zmian obejmujących wiele modułów:
# Utwórz plik koordynacyjnyclaude> Utwórz REFACTOR_PLAN.md opisujący wszystkie moduły dotknięte zmianą API
# Pracuj moduł po moduleclaude> Zgodnie z REFACTOR_PLAN.md, zaktualizuj moduł użytkownikaclaude> Zgodnie z REFACTOR_PLAN.md, zaktualizuj moduł uwierzytelnianiaclaude> Zgodnie z REFACTOR_PLAN.md, zaktualizuj moduł płatności
Śledź kluczowe wskaźniki wydajności:
import timefrom datetime import datetime
class ClaudePerformanceMonitor: def __init__(self): self.metrics = []
def track_operation(self, operation_type, tokens_used, duration): efficiency = self.calculate_efficiency( operation_type, tokens_used, duration ) self.metrics.append({ 'timestamp': datetime.now(), 'operation': operation_type, 'tokens': tokens_used, 'duration': duration, 'efficiency': efficiency, 'tokens_per_second': tokens_used / duration })
def get_optimization_suggestions(self): # Analizuj wzorce i sugeruj optymalizacje avg_efficiency = sum(m['efficiency'] for m in self.metrics) / len(self.metrics) if avg_efficiency < 0.7: return "Rozważ bardziej skoncentrowane zapytania i częstsze czyszczenie kontekstu"
Ustal podstawy dla typowych operacji:
Operacja | Optymalny czas | Budżet tokenów | Kryteria sukcesu |
---|---|---|---|
Dodaj prostą funkcję | 2-5 min | 5-10k | Testy przechodzą, zgodne ze wzorcami |
Napraw błąd | 1-3 min | 2-5k | Błąd rozwiązany, brak regresji |
Zrefaktoryzuj moduł | 10-20 min | 20-50k | Ulepszona struktura, testy przechodzą |
Napisz testy | 5-10 min | 10-20k | 80%+ pokrycia, przypadki brzegowe |
Dokumentacja | 2-5 min | 5-10k | Jasna, kompleksowa, przykłady |
# Optymalizuj dla szybkościexport CLAUDE_CODE_MODEL=claude-3-haiku-20250720claude --dangerously-skip-permissions
# Bezpośrednie polecenieclaude -p "Popraw literówkę w linii 234 pliku app.js gdzie 'recieve' powinno być 'receive'"
# Optymalizuj dla jakościexport CLAUDE_CODE_MODEL=claude-3-5-sonnet-20241022
# Progresywne podejścieclaude> Najpierw utwórz plan implementacji funkcji koszyka zakupowego> Teraz zaimplementuj zarządzanie stanem koszyka> Dodaj komponenty UI> Napisz kompleksowe testy> Udokumentuj nową funkcję
# Optymalizuj dla bezpieczeństwa i kompletnościexport CLAUDE_CODE_MODEL=claude-4.1-opus-20250720export MAX_THINKING_TOKENS=100000
# Systematyczne podejścieclaude> ultrathink: Przeanalizuj obecną architekturę i zidentyfikuj możliwości refaktoryzacji> Utwórz szczegółowy plan refaktoryzacji z fazami> Zaimplementuj fazę 1 z ostrożnym testowaniem> Przejrzyj zmiany i przejdź do fazy 2
Ładuj kontekst tylko gdy potrzebny:
Ładuj pliki tylko podczas konkretnej pracy nad nimi:- Zacznij od analizy wysokiego poziomu- Ładuj konkretne pliki w razie potrzeby- Często czyść nieistotny kontekst
Implementuj buforowanie dla powtarzanych operacji:
# Buforuj wyniki analizyclaude> Przeanalizuj wszystkie punkty końcowe API i zapisz wyniki do API_ANALYSIS.mdclaude> Używając API_ANALYSIS.md, wygeneruj dokumentację OpenAPI
# Użyj ponownie w przyszłych sesjachclaude> Na podstawie API_ANALYSIS.md zidentyfikuj punkty końcowe bez uwierzytelniania
Utwórz szablony dla typowych wzorców:
Podczas tworzenia komponentów React:1. Użyj dokładnie tej struktury2. Dołącz te PropTypes3. Przestrzegaj tej konwencji nazewnictwa4. Dołącz te przypadki testowe
Objawy: Długie opóźnienia przed odpowiedzią Claude
Rozwiązania:
/clear
Objawy: Wyniki stają się mniej dokładne z czasem
Rozwiązania:
Objawy: Błędy “Przekroczono okno kontekstu”
Rozwiązania:
/compact
agresywnieZacznij skoncentrowany
Rozpocznij od konkretnych, ukierunkowanych zapytań zamiast szerokiej analizy
Czyść regularnie
Używaj /clear
między niezwiązanymi zadaniami, aby zachować efektywność
Monitoruj użycie
Śledź zużycie tokenów i odpowiednio dostosuj strategie
Wybieraj modele mądrze
Dopasuj pojemność modelu do złożoności zadania dla optymalnej wydajności
Optymalizacja kosztów
Zmniejsz koszty zachowując wydajność
Integracja CI/CD
Optymalizuj Claude Code w zautomatyzowanych potokach
Skalowanie zespołu
Wzorce wydajności dla dużych zespołów