Monitorowanie Użycia i Optymalizacja Kosztów

Twój zespół finansowy chce wiedzieć, ile kosztuje Claude Code na developera miesięcznie. Twój manager inżynieryjny chce wiedzieć, które zespoły uzyskują największą wartość. Twój zespół bezpieczeństwa chce logów audytowych. Bez telemetrii zgadujesz. Z OpenTelemetry masz dashboardy odpowiadające na każde pytanie.

Co Wyniesiecie z Tego Rozdziału

Konfiguracja OpenTelemetry dla metryk i logowania zdarzeń
Komenda /cost i linia statusu dla indywidualnego śledzenia
Zarządzanie kosztami zespołowymi z limitami workspace i rate limiting
Strategie redukcji tokenów obniżające koszty bez zmniejszania efektywności
Praktyczny framework do mierzenia ROI Claude Code

Indywidualne Śledzenie Kosztów

Komenda /cost

Każdy developer może śledzić koszty swojej sesji w czasie rzeczywistym:

/cost

Wynik:

Total cost:            $0.55
Total duration (API):  6m 19.7s
Total duration (wall): 6h 33m 10.2s
Total code changes:    42 lines added, 18 lines removed

Dla ciągłej widoczności skonfiguruj swoją linię statusu tak, aby pokazywała użycie tokenów. Zobacz dokumentację linii statusu dla opcji konfiguracji.

Typowe Zakresy Kosztów

Na podstawie opublikowanych danych Anthropic:

Metryka	Wartość
Średni koszt na developera dziennie	$6
90. percentyl kosztu dziennego	$12
Średnia miesięczna (Sonnet)	$100-200/developer
Średnia miesięczna (intensywne użycie Opus)	$300-500/developer

Konfiguracja OpenTelemetry

Szybki Start

# Włącz telemetrię
export CLAUDE_CODE_ENABLE_TELEMETRY=1

# Skonfiguruj eksporter OTLP
export OTEL_METRICS_EXPORTER=otlp
export OTEL_LOGS_EXPORTER=otlp
export OTEL_EXPORTER_OTLP_PROTOCOL=grpc
export OTEL_EXPORTER_OTLP_ENDPOINT=http://localhost:4317

# Opcjonalnie: uwierzytelnianie
export OTEL_EXPORTER_OTLP_HEADERS="Authorization=Bearer your-token"

# Uruchom Claude Code
claude

Wdrożenie na Poziomie Organizacji

Wdróż przez ustawienia zarządzane, aby każdy developer automatycznie raportował telemetrię:

{
  "env": {
    "CLAUDE_CODE_ENABLE_TELEMETRY": "1",
    "OTEL_METRICS_EXPORTER": "otlp",
    "OTEL_LOGS_EXPORTER": "otlp",
    "OTEL_EXPORTER_OTLP_PROTOCOL": "grpc",
    "OTEL_EXPORTER_OTLP_ENDPOINT": "http://collector.company.com:4317",
    "OTEL_EXPORTER_OTLP_HEADERS": "Authorization=Bearer company-token"
  }
}

Gotowe ustawienia zarządzane do skopiowania dla pełnego wdrożenia telemetrii:

Umieść w katalogu ustawień zarządzanych dla Twojej platformy:

{
  "env": {
    "CLAUDE_CODE_ENABLE_TELEMETRY": "1",
    "OTEL_METRICS_EXPORTER": "otlp",
    "OTEL_LOGS_EXPORTER": "otlp",
    "OTEL_EXPORTER_OTLP_ENDPOINT": "http://otel-collector.internal:4317"
  }
}

Dostępne Metryki

Metryka	Typ	Co Śledzi
`session.count`	Counter	Uruchomione sesje
`lines_of_code`	Counter	Linie dodane/usunięte przez Claude’a
`pull_request.count`	Counter	Utworzone PR-y
`commit.count`	Counter	Wykonane commity
`cost.usage`	Counter	Koszt w dolarach wywołań API
`token.usage`	Counter	Tokeny wejściowe i wyjściowe
`code_edit_tool.decision`	Counter	Decyzje zezwolenia/odmowy narzędzia edycji
`active_time`	Counter	Aktywny czas sesji w sekundach

Dostępne Zdarzenia

Zdarzenie	Co Przechwytuje
`user_prompt`	Kiedy prompty są wysyłane (zawartość opcjonalna przez `OTEL_LOG_USER_PROMPTS=1`)
`tool_result`	Wyniki wywołań narzędzi i rezultaty
`api_request`	Szczegóły wywołań API (model, tokeny, opóźnienie)
`api_error`	Błędy API i rate limity
`tool_decision`	Decyzje uprawnień dla wywołań narzędzi

Zarządzanie Kosztami Zespołowymi

Limity Wydatków Workspace

Dla użytkowników API ustaw limity wydatków na poziomie workspace w Konsoli Anthropic:

Przejdź do console.anthropic.com
Przejdź do swojego workspace Claude Code (auto-utworzonego przy pierwszym uwierzytelnieniu)
Ustaw miesięczne limity wydatków dla workspace

Wytyczne Rate Limit

Rozmiar Zespołu	TPM na Użytkownika	RPM na Użytkownika
1-5	200k-300k	5-7
5-20	100k-150k	2.5-3.5
20-50	50k-75k	1.25-1.75
50-100	25k-35k	0.62-0.87
100-500	15k-20k	0.37-0.47

TPM na użytkownika maleje z rozmiarem zespołu, ponieważ nie wszyscy użytkownicy są aktywni jednocześnie.

Strategie Redukcji Tokenów

Zarządzaj Kontekstem Proaktywnie

Rozmiar kontekstu bezpośrednio wpływa na koszt. Każda wiadomość zawiera pełną historię konwersacji.

Czyść między zadaniami: /clear przy przełączaniu na niepowiązaną pracę
Używaj targetowanej kompaktacji: /compact Zachowaj wyniki testów i zmiany kodu. Podsumuj dyskusję.

Dodaj instrukcje kompaktacji do CLAUDE.md:

# Instrukcje kompaktacji
Przy kompaktacji zachowaj wyniki testów, ślady błędów i ścieżki plików. Podsumuj dyskusję i rozumowanie.

Gotowy prompt do skopiowania dla zarządzania kosztami świadomego kontekstu:

Przed rozpoczęciem tego zadania sprawdź /cost. Jeśli użyliśmy więcej niż $2 w tej sesji,
najpierw użyj /compact aby zmniejszyć kontekst. Skup się na konkretnych plikach -- nie
czytaj całych katalogów gdy grep może znaleźć to, czego potrzebujemy.

Wybierz Właściwy Model

Zadanie	Zalecany Model	Dlaczego
Code review	Sonnet	Wystarczająco dobry, znacznie tańszy
Naprawy bugów	Sonnet	Większość bugów nie wymaga rozumowania na poziomie Opus
Decyzje architektoniczne	Opus	Złożone wieloetapowe rozumowanie korzysta z Opus
Proste edycje plików	Sonnet (lub Haiku dla subagentów)	Przesada używać Opus
Audyty bezpieczeństwa	Opus	Niuansowana analiza wymaga głębszego rozumowania

Przełączaj modele w trakcie sesji za pomocą /model lub ustaw domyślne w /config.

Zmniejsz Narzut Serwerów MCP

Każdy serwer MCP dodaje definicje narzędzi do Twojego kontekstu, zużywając tokeny nawet gdy jest nieaktywny:

Uruchom /context aby zobaczyć co zużywa miejsce
Wyłącz nieużywane serwery za pomocą /mcp
Preferuj narzędzia CLI (gh, aws, gcloud) nad serwerami MCP gdy to możliwe
Ustaw ENABLE_TOOL_SEARCH=auto:5 aby odroczyć narzędzia przekraczające 5% kontekstu

Deleguj do Subagentów

Subagenci mają własne okna kontekstu. Używaj ich do:

Gadatliwych operacji (czytanie wielu plików, uruchamianie zestawów testów)
Równoległych zadań, które inaczej rozdęłyby główny kontekst
Powtarzalnych operacji (stosowanie tej samej zmiany w wielu plikach)

Konfiguruj subagentów z tańszymi modelami:

---
model: sonnet
---

Gotowa sekcja CLAUDE.md do skopiowania dla rozwoju świadomego kosztów:

# Reguły Zarządzania Kosztami

- Używaj Sonnet dla wszystkich zadań, chyba że konkretnie poproszę o Opus
- Przed czytaniem plików użyj grep aby najpierw znaleźć odpowiednie sekcje
- Podczas eksploracji codebase zacznij od listingu katalogów i README, nie czytając każdego pliku
- Deleguj operacje na wielu plikach do subagentów z model: sonnet
- Czyść kontekst między niepowiązanymi zadaniami

Kiedy To Nie Działa

Dane telemetryczne nie pojawiają się: Sprawdź czy CLAUDE_CODE_ENABLE_TELEMETRY=1 jest ustawione. Zweryfikuj, że endpoint OTLP jest osiągalny z maszyn developerów. Domyślny interwał eksportu to 60 sekund dla metryk — poczekaj przynajmniej tyle przed debugowaniem.

Koszty wyższe niż oczekiwano: Sprawdź /context aby zobaczyć co zużywa miejsce. Duże konfiguracje serwerów MCP lub rozdęte pliki automatycznej pamięci pompują każde żądanie. Sprawdź także sesje, które nigdy nie zostały wyczyszczone — nieaktualny kontekst się kumuluje.

Rate limity osiągane podczas okresów wysokiego użycia: Wytyczne TPM na użytkownika zakładają średnią współbieżność. Podczas sesji szkoleniowych lub wydarzeń onboardingowych tymczasowo zwiększ limity lub rozłóż użycie.

Koszty Bedrock/Vertex nie śledzone: Claude Code nie wysyła metryk od Twojego dostawcy chmury. Użyj LiteLLM lub własnego śledzenia kosztów dostawcy chmury dla rozliczeń Bedrock/Vertex.

Co Dalej

Integracja Korporacyjna — Wdrożenie telemetrii na poziomie organizacji
GitHub Actions — Śledź koszty CI obok użycia developerów
Wskazówki Wydajności i Kosztów — 10 konkretnych wskazówek redukcji użycia tokenów