Dostrajanie i optymalizacja wydajności

Optymalizacja wydajności w Claude Code to nie tylko kwestia szybkości — to maksymalizacja wartości wydobytej z każdego tokena przy zachowaniu wysokiej jakości wyników. Ten przewodnik dostarcza eksperckich strategii dostrajania Claude Code do obsługi wszystkiego, od szybkich poprawek po masywne operacje refaktoryzacji.

Zrozumienie czynników wydajności

Kluczowe metryki wydajności

Opóźnienie odpowiedzi

Czas od promptu do pierwszego tokena wyjściowego
Cel: < 2s dla prostych zadań

Efektywność tokenów

Jakość wyjścia na zużyty token
Cel: > 80% użytecznej treści

Wykorzystanie kontekstu

Istotny kontekst vs całkowity kontekst
Cel: > 70% trafności

Wskaźnik ukończenia zadań

Wskaźnik sukcesu za pierwszym razem
Cel: > 90% dla rutynowych zadań

Wąskie gardła wydajności

Wąskie gardło	Wpływ	Strategia łagodzenia
Duże okno kontekstu	Wolniejsze odpowiedzi, wyższe koszty	Użyj `/clear`, skoncentrowane zapytania
Złożone rozumowanie	Wydłużony czas myślenia	Strategiczny wybór modelu
Operacje systemu plików	Opóźnienia I/O	Operacje wsadowe, buforowanie
Opóźnienie sieci	Opóźnienia odpowiedzi API	Lokalne buforowanie, równoległe żądania
Nieefektywne prompty	Zmarnowane tokeny, słabe wyniki	Techniki optymalizacji promptów

Strategie optymalizacji kontekstu

1. Hierarchiczne zarządzanie kontekstem

Strukturyzuj swoje pliki CLAUDE.md dla optymalnego ładowania kontekstu:

# Główny CLAUDE.md (maks. 500 tokenów)
## Tylko krytyczne informacje o projekcie
- Architektura: Mikroserwisy z Node.js
- Kluczowe polecenia: npm run dev, npm test
- Standardy kodowania: ESLint + Prettier

# Frontend CLAUDE.md (maks. 300 tokenów)
## Specyficzne dla frontendu
- Framework: React 18 z TypeScript
- Stan: Magazyny Zustand w /src/stores
- Komponenty: /src/components zgodnie z atomic design

# Backend CLAUDE.md (maks. 300 tokenów)
## Specyficzne dla API
- Framework: Express z TypeScript
- Uwierzytelnianie: JWT w /src/middleware/auth
- Baza danych: Prisma ORM z PostgreSQL

# Ładuje cały kontekst projektu
claude
> Przeanalizuj całą bazę kodu i znajdź wszystkie komentarze TODO

# Przeszukuje wszystko
> Jakie metody uwierzytelniania są używane w całym projekcie?

# Załaduj tylko istotne katalogi
claude --add-dir src/auth src/middleware
> Wyjaśnij przepływ uwierzytelniania

# Skoncentrowane wyszukiwanie
> Znajdź komentarze TODO w src/auth/ związane z wygaśnięciem JWT

3. Techniki kompresji kontekstu

Użyj /compact z niestandardowymi instrukcjami:

claude> /compact Zachowaj tylko: zmiany kodu, wyniki testów, decyzje architektoniczne

# Lub skonfiguruj w CLAUDE.md
# Zasady kompaktowania
Podczas kompaktowania:
- ZACHOWAJ: Próbki kodu, komunikaty o błędach, podjęte decyzje
- USUŃ: Wyjaśnienia, przykłady, pośrednie próby
- PODSUMUJ: Długie dyskusje w punkty

4. Monitorowanie okna kontekstu

Śledź wykorzystanie kontekstu, aby zoptymalizować czas:

# Sprawdź obecny status kontekstu
claude> /context

Obecne wykorzystanie kontekstu:
- Łączne tokeny: 45,231 / 100,000 (45%)
- Załadowane pliki: 23
- Długość konwersacji: 2,341 tokenów
- Pliki CLAUDE.md: 3 (1,245 tokenów)

# Wyczyść przed osiągnięciem limitów
claude> /clear  # Resetuj gdy > 80% pełne

Optymalizacja wyboru modelu

Strategiczne użycie modelu

Skonfiguruj inteligentne przełączanie modeli na podstawie złożoności zadania:

{
  "model": "claude-3-5-sonnet-20241022",
  "modelStrategy": {
    "autoSwitch": true,
    "rules": [
      {
        "pattern": "popraw literówkę|zmień nazwę|formatuj",
        "model": "claude-3-haiku-20250720",
        "reason": "Proste operacje tekstowe"
      },
      {
        "pattern": "implementuj|utwórz|zbuduj",
        "model": "claude-3-5-sonnet-20241022",
        "reason": "Standardowy rozwój"
      },
      {
        "pattern": "zaprojektuj architekturę|przeprojektuj|refaktoryzuj całość",
        "model": "claude-opus-4.5-20250720",
        "reason": "Wymagane złożone rozumowanie"
      }
    ]
  }
}

Optymalizacja budżetu myślenia

Kontroluj głębokość rozumowania dla różnych zadań:

Typ zadania	Tokeny myślenia	Przypadek użycia
Szybka poprawka	0-1,000	Literówki, formatowanie, proste edycje
Standardowy rozwój	5,000-10,000	Implementacja funkcji, poprawki błędów
Złożona analiza	20,000-50,000	Decyzje architektoniczne, refaktoryzacja
Głęboka architektura	100,000-128,000	Projektowanie systemu, główne przepisania

Wyzwalaj konkretne tryby myślenia:

# Minimalne myślenie
claude> Popraw literówkę w README.md

# Standardowe myślenie
claude> think: Zaimplementuj uwierzytelnianie użytkownika

# Głębokie myślenie
claude> think hard: Zrefaktoryzuj cały system uwierzytelniania

# Maksymalne myślenie
claude> ultrathink: Zaprojektuj nową architekturę mikroserwisów

Wzorce optymalizacji przepływu pracy

1. Przetwarzanie wsadowe

Grupuj podobne operacje dla efektywności:

Zidentyfikuj powtarzalne zadania

claude> Wymień wszystkie komponenty React bez PropTypes

Utwórz operację wsadową

claude> Dla każdego komponentu z powyższej listy dodaj definicje PropTypes na podstawie faktycznego użycia

Wykonaj równolegle

claude> Przetwarzaj komponenty w grupach po 5, aby zachować efektywność kontekstu

2. Stopniowe ulepszanie

Zacznij prosto i buduj złożoność:

# Krok 1: Podstawowa implementacja
claude> Utwórz prosty punkt końcowy rejestracji użytkownika

# Krok 2: Dodaj walidację
claude> Dodaj walidację danych wejściowych do punktu końcowego rejestracji

# Krok 3: Dodaj bezpieczeństwo
claude> Zaimplementuj ograniczanie częstotliwości i CAPTCHA

# Krok 4: Optymalizuj
claude> Dodaj buforowanie i zoptymalizuj zapytania do bazy danych

3. Równoległe instancje Claude

Uruchom wiele instancji dla różnych zadań:

# Terminal 1: Praca frontend
cd frontend && claude --add-dir src/components
> Zrefaktoryzuj wszystkie komponenty przycisków, aby używały nowego systemu projektowania

# Terminal 2: Praca backend
cd backend && claude --add-dir src/api
> Zaimplementuj nowe punkty końcowe REST do zarządzania użytkownikami

# Terminal 3: Testowanie
cd . && claude --add-dir tests
> Napisz testy integracyjne dla nowych funkcji

4. Strategia punktów kontrolnych

Twórz punkty przywracania dla złożonych operacji:

# Przed dużymi zmianami
git checkout -b ai-refactor-auth
git commit -am "Punkt kontrolny przed refaktoryzacją uwierzytelniania"

# Pozwól Claude pracować
claude> Zrefaktoryzuj uwierzytelnianie, aby używać OAuth2

# W razie potrzeby przywróć
git reset --hard HEAD~1

Optymalizacja dużej bazy kodu

Obsługa plików powyżej 10k linii

Dla ogromnych plików używaj ukierunkowanych podejść:

# Zamiast ładować cały plik
claude> Przeanalizuj cały plik UserService.js

# Użyj skoncentrowanej analizy
claude> W UserService.js przeanalizuj tylko metody uwierzytelniania (linie 2000-3000)

# Lub najpierw wyszukaj
claude> Przeszukaj UserService.js w poszukiwaniu metod związanych z resetowaniem hasła
claude> Teraz zoptymalizuj znaleziony przepływ resetowania hasła

Koordynacja wielu modułów

Dla zmian obejmujących wiele modułów:

# Utwórz plik koordynacyjny
claude> Utwórz REFACTOR_PLAN.md opisujący wszystkie moduły dotknięte zmianą API

# Pracuj moduł po module
claude> Zgodnie z REFACTOR_PLAN.md, zaktualizuj moduł użytkownika
claude> Zgodnie z REFACTOR_PLAN.md, zaktualizuj moduł uwierzytelniania
claude> Zgodnie z REFACTOR_PLAN.md, zaktualizuj moduł płatności

Monitorowanie wydajności

Metryki w czasie rzeczywistym

Śledź kluczowe wskaźniki wydajności:

import time
from datetime import datetime

class ClaudePerformanceMonitor:
    def __init__(self):
        self.metrics = []

    def track_operation(self, operation_type, tokens_used, duration):
        efficiency = self.calculate_efficiency(
            operation_type, tokens_used, duration
        )
        self.metrics.append({
            'timestamp': datetime.now(),
            'operation': operation_type,
            'tokens': tokens_used,
            'duration': duration,
            'efficiency': efficiency,
            'tokens_per_second': tokens_used / duration
        })

    def get_optimization_suggestions(self):
        # Analizuj wzorce i sugeruj optymalizacje
        avg_efficiency = sum(m['efficiency'] for m in self.metrics) / len(self.metrics)
        if avg_efficiency < 0.7:
            return "Rozważ bardziej skoncentrowane zapytania i częstsze czyszczenie kontekstu"

Benchmarki wydajności

Ustal podstawy dla typowych operacji:

Operacja	Optymalny czas	Budżet tokenów	Kryteria sukcesu
Dodaj prostą funkcję	2-5 min	5-10k	Testy przechodzą, zgodne ze wzorcami
Napraw błąd	1-3 min	2-5k	Błąd rozwiązany, brak regresji
Zrefaktoryzuj moduł	10-20 min	20-50k	Ulepszona struktura, testy przechodzą
Napisz testy	5-10 min	10-20k	80%+ pokrycia, przypadki brzegowe
Dokumentacja	2-5 min	5-10k	Jasna, kompleksowa, przykłady

Techniki optymalizacji według scenariusza

Szybkie poprawki i gorące łatki

# Optymalizuj dla szybkości
export CLAUDE_CODE_MODEL=claude-3-haiku-20250720
claude --dangerously-skip-permissions

# Bezpośrednie polecenie
claude -p "Popraw literówkę w linii 234 pliku app.js gdzie 'recieve' powinno być 'receive'"

Rozwój funkcji

# Optymalizuj dla jakości
export CLAUDE_CODE_MODEL=claude-3-5-sonnet-20241022

# Progresywne podejście
claude
> Najpierw utwórz plan implementacji funkcji koszyka zakupowego
> Teraz zaimplementuj zarządzanie stanem koszyka
> Dodaj komponenty UI
> Napisz kompleksowe testy
> Udokumentuj nową funkcję

Refaktoryzacja na dużą skalę

# Optymalizuj dla bezpieczeństwa i kompletności
export CLAUDE_CODE_MODEL=claude-opus-4.5-20250720
export MAX_THINKING_TOKENS=100000

# Systematyczne podejście
claude
> ultrathink: Przeanalizuj obecną architekturę i zidentyfikuj możliwości refaktoryzacji
> Utwórz szczegółowy plan refaktoryzacji z fazami
> Zaimplementuj fazę 1 z ostrożnym testowaniem
> Przejrzyj zmiany i przejdź do fazy 2

Zaawansowane wzorce wydajności

1. Leniwe ładowanie kontekstu

Ładuj kontekst tylko gdy potrzebny:

Ładuj pliki tylko podczas konkretnej pracy nad nimi:
- Zacznij od analizy wysokiego poziomu
- Ładuj konkretne pliki w razie potrzeby
- Często czyść nieistotny kontekst

2. Strategie buforowania

Implementuj buforowanie dla powtarzanych operacji:

# Buforuj wyniki analizy
claude> Przeanalizuj wszystkie punkty końcowe API i zapisz wyniki do API_ANALYSIS.md
claude> Używając API_ANALYSIS.md, wygeneruj dokumentację OpenAPI

# Użyj ponownie w przyszłych sesjach
claude> Na podstawie API_ANALYSIS.md zidentyfikuj punkty końcowe bez uwierzytelniania

3. Generowanie oparte na szablonach

Utwórz szablony dla typowych wzorców:

Podczas tworzenia komponentów React:
1. Użyj dokładnie tej struktury
2. Dołącz te PropTypes
3. Przestrzegaj tej konwencji nazewnictwa
4. Dołącz te przypadki testowe

Rozwiązywanie problemów z wydajnością

Typowe problemy i rozwiązania

Objawy: Długie opóźnienia przed odpowiedzią Claude

Rozwiązania:

Wyczyść kontekst: /clear
Używaj bardziej konkretnych zapytań
Przełącz na szybszy model dla prostych zadań
Sprawdź łączność sieciową
Zmniejsz równoczesne operacje

Objawy: Błędy “Przekroczono okno kontekstu”

Rozwiązania:

Używaj /compact agresywnie
Podziel duże operacje
Czyść między niezwiązanymi zadaniami
Optymalizuj rozmiar CLAUDE.md
Używaj analizy specyficznej dla pliku

Podsumowanie najlepszych praktyk

Zacznij skoncentrowany

Rozpocznij od konkretnych, ukierunkowanych zapytań zamiast szerokiej analizy

Czyść regularnie

Używaj /clear między niezwiązanymi zadaniami, aby zachować efektywność

Monitoruj użycie

Śledź zużycie tokenów i odpowiednio dostosuj strategie

Wybieraj modele mądrze

Dopasuj pojemność modelu do złożoności zadania dla optymalnej wydajności

Lista kontrolna wydajności

☐ Pliki CLAUDE.md poniżej 1,000 tokenów każdy
☐ Kontekst czyszczony między głównymi zadaniami
☐ Skonfigurowana strategia wyboru modelu
☐ Operacje wsadowe dla powtarzalnych zadań
☐ Równoległe instancje dla niezależnej pracy
☐ Wdrożone monitorowanie wydajności
☐ Regularne commity punktów kontrolnych
☐ Szablony dla typowych wzorców
☐ Skoncentrowane ładowanie katalogów
☐ Skalibrowane budżety myślenia

Następne kroki

Optymalizacja kosztów

Zmniejsz koszty zachowując wydajność

Integracja CI/CD

Optymalizuj Claude Code w zautomatyzowanych potokach

Skalowanie zespołu

Wzorce wydajności dla dużych zespołów