Przejdź do głównej zawartości

Dostrajanie i optymalizacja wydajności

Optymalizacja wydajności w Claude Code to nie tylko kwestia szybkości — to maksymalizacja wartości wydobytej z każdego tokena przy zachowaniu wysokiej jakości wyników. Ten przewodnik dostarcza eksperckich strategii dostrajania Claude Code do obsługi wszystkiego, od szybkich poprawek po masywne operacje refaktoryzacji.

Opóźnienie odpowiedzi

Czas od promptu do pierwszego tokena wyjściowego
Cel: < 2s dla prostych zadań

Efektywność tokenów

Jakość wyjścia na zużyty token
Cel: > 80% użytecznej treści

Wykorzystanie kontekstu

Istotny kontekst vs całkowity kontekst
Cel: > 70% trafności

Wskaźnik ukończenia zadań

Wskaźnik sukcesu za pierwszym razem
Cel: > 90% dla rutynowych zadań

Wąskie gardłoWpływStrategia łagodzenia
Duże okno kontekstuWolniejsze odpowiedzi, wyższe kosztyUżyj /clear, skoncentrowane zapytania
Złożone rozumowanieWydłużony czas myśleniaStrategiczny wybór modelu
Operacje systemu plikówOpóźnienia I/OOperacje wsadowe, buforowanie
Opóźnienie sieciOpóźnienia odpowiedzi APILokalne buforowanie, równoległe żądania
Nieefektywne promptyZmarnowane tokeny, słabe wynikiTechniki optymalizacji promptów

Strukturyzuj swoje pliki CLAUDE.md dla optymalnego ładowania kontekstu:

# Główny CLAUDE.md (maks. 500 tokenów)
## Tylko krytyczne informacje o projekcie
- Architektura: Mikroserwisy z Node.js
- Kluczowe polecenia: npm run dev, npm test
- Standardy kodowania: ESLint + Prettier
# Frontend CLAUDE.md (maks. 300 tokenów)
## Specyficzne dla frontendu
- Framework: React 18 z TypeScript
- Stan: Magazyny Zustand w /src/stores
- Komponenty: /src/components zgodnie z atomic design
# Backend CLAUDE.md (maks. 300 tokenów)
## Specyficzne dla API
- Framework: Express z TypeScript
- Uwierzytelnianie: JWT w /src/middleware/auth
- Baza danych: Prisma ORM z PostgreSQL
Okno terminala
# Ładuje cały kontekst projektu
claude
> Przeanalizuj całą bazę kodu i znajdź wszystkie komentarze TODO
# Przeszukuje wszystko
> Jakie metody uwierzytelniania są używane w całym projekcie?

Użyj /compact z niestandardowymi instrukcjami:

Okno terminala
claude> /compact Zachowaj tylko: zmiany kodu, wyniki testów, decyzje architektoniczne
# Lub skonfiguruj w CLAUDE.md
# Zasady kompaktowania
Podczas kompaktowania:
- ZACHOWAJ: Próbki kodu, komunikaty o błędach, podjęte decyzje
- USUŃ: Wyjaśnienia, przykłady, pośrednie próby
- PODSUMUJ: Długie dyskusje w punkty

Śledź wykorzystanie kontekstu, aby zoptymalizować czas:

Okno terminala
# Sprawdź obecny status kontekstu
claude> /context
Obecne wykorzystanie kontekstu:
- Łączne tokeny: 45,231 / 100,000 (45%)
- Załadowane pliki: 23
- Długość konwersacji: 2,341 tokenów
- Pliki CLAUDE.md: 3 (1,245 tokenów)
# Wyczyść przed osiągnięciem limitów
claude> /clear # Resetuj gdy > 80% pełne

Skonfiguruj inteligentne przełączanie modeli na podstawie złożoności zadania:

.claude/settings.json
{
"model": "claude-3-5-sonnet-20241022",
"modelStrategy": {
"autoSwitch": true,
"rules": [
{
"pattern": "popraw literówkę|zmień nazwę|formatuj",
"model": "claude-3-haiku-20250720",
"reason": "Proste operacje tekstowe"
},
{
"pattern": "implementuj|utwórz|zbuduj",
"model": "claude-3-5-sonnet-20241022",
"reason": "Standardowy rozwój"
},
{
"pattern": "zaprojektuj architekturę|przeprojektuj|refaktoryzuj całość",
"model": "claude-4.1-opus-20250720",
"reason": "Wymagane złożone rozumowanie"
}
]
}
}

Kontroluj głębokość rozumowania dla różnych zadań:

Typ zadaniaTokeny myśleniaPrzypadek użycia
Szybka poprawka0-1,000Literówki, formatowanie, proste edycje
Standardowy rozwój5,000-10,000Implementacja funkcji, poprawki błędów
Złożona analiza20,000-50,000Decyzje architektoniczne, refaktoryzacja
Głęboka architektura100,000-128,000Projektowanie systemu, główne przepisania

Wyzwalaj konkretne tryby myślenia:

Okno terminala
# Minimalne myślenie
claude> Popraw literówkę w README.md
# Standardowe myślenie
claude> think: Zaimplementuj uwierzytelnianie użytkownika
# Głębokie myślenie
claude> think hard: Zrefaktoryzuj cały system uwierzytelniania
# Maksymalne myślenie
claude> ultrathink: Zaprojektuj nową architekturę mikroserwisów

Grupuj podobne operacje dla efektywności:

  1. Zidentyfikuj powtarzalne zadania

    Okno terminala
    claude> Wymień wszystkie komponenty React bez PropTypes
  2. Utwórz operację wsadową

    Okno terminala
    claude> Dla każdego komponentu z powyższej listy dodaj definicje PropTypes na podstawie faktycznego użycia
  3. Wykonaj równolegle

    Okno terminala
    claude> Przetwarzaj komponenty w grupach po 5, aby zachować efektywność kontekstu

Zacznij prosto i buduj złożoność:

Okno terminala
# Krok 1: Podstawowa implementacja
claude> Utwórz prosty punkt końcowy rejestracji użytkownika
# Krok 2: Dodaj walidację
claude> Dodaj walidację danych wejściowych do punktu końcowego rejestracji
# Krok 3: Dodaj bezpieczeństwo
claude> Zaimplementuj ograniczanie częstotliwości i CAPTCHA
# Krok 4: Optymalizuj
claude> Dodaj buforowanie i zoptymalizuj zapytania do bazy danych

Uruchom wiele instancji dla różnych zadań:

Okno terminala
# Terminal 1: Praca frontend
cd frontend && claude --add-dir src/components
> Zrefaktoryzuj wszystkie komponenty przycisków, aby używały nowego systemu projektowania
# Terminal 2: Praca backend
cd backend && claude --add-dir src/api
> Zaimplementuj nowe punkty końcowe REST do zarządzania użytkownikami
# Terminal 3: Testowanie
cd . && claude --add-dir tests
> Napisz testy integracyjne dla nowych funkcji

Twórz punkty przywracania dla złożonych operacji:

Okno terminala
# Przed dużymi zmianami
git checkout -b ai-refactor-auth
git commit -am "Punkt kontrolny przed refaktoryzacją uwierzytelniania"
# Pozwól Claude pracować
claude> Zrefaktoryzuj uwierzytelnianie, aby używać OAuth2
# W razie potrzeby przywróć
git reset --hard HEAD~1

Dla ogromnych plików używaj ukierunkowanych podejść:

Okno terminala
# Zamiast ładować cały plik
claude> Przeanalizuj cały plik UserService.js
# Użyj skoncentrowanej analizy
claude> W UserService.js przeanalizuj tylko metody uwierzytelniania (linie 2000-3000)
# Lub najpierw wyszukaj
claude> Przeszukaj UserService.js w poszukiwaniu metod związanych z resetowaniem hasła
claude> Teraz zoptymalizuj znaleziony przepływ resetowania hasła

Dla zmian obejmujących wiele modułów:

Okno terminala
# Utwórz plik koordynacyjny
claude> Utwórz REFACTOR_PLAN.md opisujący wszystkie moduły dotknięte zmianą API
# Pracuj moduł po module
claude> Zgodnie z REFACTOR_PLAN.md, zaktualizuj moduł użytkownika
claude> Zgodnie z REFACTOR_PLAN.md, zaktualizuj moduł uwierzytelniania
claude> Zgodnie z REFACTOR_PLAN.md, zaktualizuj moduł płatności

Śledź kluczowe wskaźniki wydajności:

performance_monitor.py
import time
from datetime import datetime
class ClaudePerformanceMonitor:
def __init__(self):
self.metrics = []
def track_operation(self, operation_type, tokens_used, duration):
efficiency = self.calculate_efficiency(
operation_type, tokens_used, duration
)
self.metrics.append({
'timestamp': datetime.now(),
'operation': operation_type,
'tokens': tokens_used,
'duration': duration,
'efficiency': efficiency,
'tokens_per_second': tokens_used / duration
})
def get_optimization_suggestions(self):
# Analizuj wzorce i sugeruj optymalizacje
avg_efficiency = sum(m['efficiency'] for m in self.metrics) / len(self.metrics)
if avg_efficiency < 0.7:
return "Rozważ bardziej skoncentrowane zapytania i częstsze czyszczenie kontekstu"

Ustal podstawy dla typowych operacji:

OperacjaOptymalny czasBudżet tokenówKryteria sukcesu
Dodaj prostą funkcję2-5 min5-10kTesty przechodzą, zgodne ze wzorcami
Napraw błąd1-3 min2-5kBłąd rozwiązany, brak regresji
Zrefaktoryzuj moduł10-20 min20-50kUlepszona struktura, testy przechodzą
Napisz testy5-10 min10-20k80%+ pokrycia, przypadki brzegowe
Dokumentacja2-5 min5-10kJasna, kompleksowa, przykłady
Okno terminala
# Optymalizuj dla szybkości
export CLAUDE_CODE_MODEL=claude-3-haiku-20250720
claude --dangerously-skip-permissions
# Bezpośrednie polecenie
claude -p "Popraw literówkę w linii 234 pliku app.js gdzie 'recieve' powinno być 'receive'"
Okno terminala
# Optymalizuj dla jakości
export CLAUDE_CODE_MODEL=claude-3-5-sonnet-20241022
# Progresywne podejście
claude
> Najpierw utwórz plan implementacji funkcji koszyka zakupowego
> Teraz zaimplementuj zarządzanie stanem koszyka
> Dodaj komponenty UI
> Napisz kompleksowe testy
> Udokumentuj nową funkcję
Okno terminala
# Optymalizuj dla bezpieczeństwa i kompletności
export CLAUDE_CODE_MODEL=claude-4.1-opus-20250720
export MAX_THINKING_TOKENS=100000
# Systematyczne podejście
claude
> ultrathink: Przeanalizuj obecną architekturę i zidentyfikuj możliwości refaktoryzacji
> Utwórz szczegółowy plan refaktoryzacji z fazami
> Zaimplementuj fazę 1 z ostrożnym testowaniem
> Przejrzyj zmiany i przejdź do fazy 2

Ładuj kontekst tylko gdy potrzebny:

.claude/commands/lazy-load.md
Ładuj pliki tylko podczas konkretnej pracy nad nimi:
- Zacznij od analizy wysokiego poziomu
- Ładuj konkretne pliki w razie potrzeby
- Często czyść nieistotny kontekst

Implementuj buforowanie dla powtarzanych operacji:

Okno terminala
# Buforuj wyniki analizy
claude> Przeanalizuj wszystkie punkty końcowe API i zapisz wyniki do API_ANALYSIS.md
claude> Używając API_ANALYSIS.md, wygeneruj dokumentację OpenAPI
# Użyj ponownie w przyszłych sesjach
claude> Na podstawie API_ANALYSIS.md zidentyfikuj punkty końcowe bez uwierzytelniania

Utwórz szablony dla typowych wzorców:

.claude/templates/component.md
Podczas tworzenia komponentów React:
1. Użyj dokładnie tej struktury
2. Dołącz te PropTypes
3. Przestrzegaj tej konwencji nazewnictwa
4. Dołącz te przypadki testowe

Objawy: Długie opóźnienia przed odpowiedzią Claude

Rozwiązania:

  1. Wyczyść kontekst: /clear
  2. Używaj bardziej konkretnych zapytań
  3. Przełącz na szybszy model dla prostych zadań
  4. Sprawdź łączność sieciową
  5. Zmniejsz równoczesne operacje

Zacznij skoncentrowany

Rozpocznij od konkretnych, ukierunkowanych zapytań zamiast szerokiej analizy

Czyść regularnie

Używaj /clear między niezwiązanymi zadaniami, aby zachować efektywność

Monitoruj użycie

Śledź zużycie tokenów i odpowiednio dostosuj strategie

Wybieraj modele mądrze

Dopasuj pojemność modelu do złożoności zadania dla optymalnej wydajności

  • Pliki CLAUDE.md poniżej 1,000 tokenów każdy
  • Kontekst czyszczony między głównymi zadaniami
  • Skonfigurowana strategia wyboru modelu
  • Operacje wsadowe dla powtarzalnych zadań
  • Równoległe instancje dla niezależnej pracy
  • Wdrożone monitorowanie wydajności
  • Regularne commity punktów kontrolnych
  • Szablony dla typowych wzorców
  • Skoncentrowane ładowanie katalogów
  • Skalibrowane budżety myślenia

Optymalizacja kosztów

Zmniejsz koszty zachowując wydajność

Integracja CI/CD

Optymalizuj Claude Code w zautomatyzowanych potokach

Skalowanie zespołu

Wzorce wydajności dla dużych zespołów