Przejdź do głównej zawartości

Wybór modelu

Naucz się wybierać odpowiedni model AI dla każdego zadania. Ten 10-minutowy przewodnik pomoże ci balansować szybkość, koszt i możliwości aby maksymalizować produktywność przy kontroli wydatków.

ModelSzybkośćKosztKontekstNajlepszy przypadek użycia
Claude 4 Sonnet⚡⚡⚡$128kCodzienne kodowanie (80% zadań)
Claude 4 Opus⚡⚡$$$$$200kArchitektura i planowanie (doświadczeni devowie nadal preferują do planowania)
OpenAI GPT-5⚡⚡$$$$128k–1MJednoprzebiegowe tworzenie aplikacji ze szczegółowego PRD; bardzo sterowalny (źródło)
OpenAI o3$$$200kZłożone debugowanie
Gemini 2.5 Pro⚡⚡⚡$$1MPraca z dużą bazą kodu
GPT 4.1⚡⚡$$1MOgólnego przeznaczenia backup

Wpływ na miesięczny budżet

Typowe użycie dewelopera

  • Tylko Sonnet 4: ~$50/miesiąc
  • Strategia mieszana: ~$100/miesiąc
  • Intensywny Opus 4: ~$300/miesiąc
  • Nieoptymalizowana: ~$500+/miesiąc

Ekonomia tokenów

Na milion tokenów

  • Sonnet 4: $3
  • Gemini 2.5: $7
  • Opus 4: $15 (5x Sonnet)
  • o3: ceny zmienne
  • Implementacji funkcji
  • Napraw błędów
  • Przeglądów kodu
  • Refaktoryzacji
  • Pisania testów
  • Dokumentacji
  • Integracji API
  • Zapytań bazy danych
  1. Jasne, konkretne prompty dają lepsze rezultaty niż niejasne żądania
  2. Dołączaj przykłady w swoich promptach dla spójnego outputu
  3. Rozbijaj złożone zadania na mniejsze, skupione żądania
  4. Używaj zasad projektu aby utrzymać spójność
// DOBRE: Konkretne żądanie dla Sonnet 4
"Utwórz funkcję TypeScript która waliduje adresy email
używając regex, zwraca typ Result<string, ValidationError>,
i zawiera testy jednostkowe"
// SŁABE: Niejasne żądanie które może potrzebować silniejszego modelu
"Ulepsz system uwierzytelniania"

Framework decyzyjny

Używaj GPT-5 gdy masz:

  1. Szczegółowy PRD: end-to-end funkcja/aplikacja w jednym przebiegu
  2. Zadania cross frontend/backend: szczególnie gdy trzeba regenerować typy/protobufy
  3. Przepływy agentowe: agenci w tle i równoległe agenty pierwszego planu
  4. Potrzebę sterowalności: możesz bardzo precyzyjnie określić wymagania i styl
  1. Bądź precyzyjny co do celów, ograniczeń i kryteriów akceptacji
  2. Dodaj regułę „zwięzłe odpowiedzi” jeśli chcesz krótszych wyników
  3. Podaj strukturę repo i kroki codegen (np. protobufy)

Zobacz: GPT-5 dostępny w Cursor.

Framework decyzyjny

Używaj Opus 4 gdy potrzebujesz:

  1. Projektowanie systemu: decyzje architektoniczne wpływające na wiele modułów
  2. Złożona refaktoryzacja: zmiany dotykające 50+ plików
  3. Projektowanie algorytmów: nietrywialne algorytmy wymagające głębokiego rozumowania
  4. Planowanie techniczne: rozbijanie złożonych funkcji na zadania
  5. Generowanie kodu: tworzenie całych modułów ze specyfikacji
  1. Zacznij od planowania

    "Przeanalizuj nasz obecny system uwierzytelniania i zaproponuj
    plan migracji do OAuth 2.0 z kompatybilnością wsteczną"
  2. Generuj architekturę

    "Zaprojektuj skalowalną architekturę sterowaną zdarzeniami dla naszego
    systemu powiadomień wspierającego email, SMS i push"
  3. Złożone rozwiązywanie problemów

    "Optymalizuj ten algorytm przeszukiwania grafu do znajdowania
    najkrótszych ścieżek w ważonym grafie skierowanym z
    ujemnymi krawędziami"

o3 wyróżnia się w zadaniach wymagających rozszerzonego rozumowania:

Debugowanie

Złożone race conditions, wycieki pamięci, wąskie gardła wydajności

Algorytmy

Programowanie dynamiczne, algorytmy grafowe, problemy optymalizacyjne

Łamigłówki logiczne

Silniki reguł biznesowych, satysfakcja ograniczeń, automaty stanów

Matematyka

Analiza statystyczna, algorytmy ML, implementacje kryptograficzne

  1. Dostarczaj obszerny kontekst - o3 kwitnie na informacjach
  2. Proś o rozumowanie - “Wyjaśnij swój tok myślenia”
  3. Iteruj nad rozwiązaniami - o3 poprawia się z feedbackiem
  4. Weryfikuj outputy - złożone rozumowanie może mieć przypadki brzegowe
PROMPT: "Nasza aplikacja ma wyciek pamięci który występuje po
około 1000 wywołaniach API. Wyciek wydaje się związany z naszą
warstwą cache. Oto odpowiedni kod i output profilera pamięci.
Przeanalizuj i dostarcz naprawę."
DLACZEGO o3: To wymaga głębokiej analizy wzorców wykonania kodu,
zarządzania pamięcią i identyfikacji subtelnych problemów które
prostsze modele mogą przegapić.
  • Analizowania całych repozytoriów
  • Refaktoryzacji między modułami
  • Przeglądów kodu na dużą skalę
  • Generowania dokumentacji z kodu
  • Zrozumienia systemów legacy
  • Analizy zależności
  1. Załaduj duży kontekst

    @codebase "Przeanalizuj nasz cały moduł uwierzytelniania
    włączając wszystkie serwisy, controllery i testy"
  2. Analiza odniesień krzyżowych

    "Znajdź wszystkie miejsca gdzie używany jest enum UserRole i
    zasugeruj migrację do bardziej elastycznego systemu uprawnień"
  3. Generuj dokumentację

    "Utwórz kompleksową dokumentację API dla wszystkich
    endpointów w katalogu /api/v2"
graph TD Start[Nowe zadanie] --> Size{Rozmiar bazy kodu?} Size -->|< 10 plików| Simple{Złożoność zadania?} Size -->|10-50 plików| Medium{Potrzeba rozumowania?} Size -->|> 50 plików| Large[Gemini 2.5 Pro] Simple -->|Podstawowe| Sonnet[Claude 4 Sonnet] Simple -->|Złożone| Reason{Rodzaj złożoności?} Medium -->|Nie| Sonnet Medium -->|Tak| Opus[Claude 4 Opus] Reason -->|Architektura| Opus Reason -->|Debugowanie| o3[OpenAI o3] Reason -->|Algorytm| o3
  1. Zacznij od Sonnet 4 do początkowej implementacji
  2. Przełącz na Opus 4 tylko do planowania/architektury
  3. Użyj o3 tylko do konkretnych złożonych problemów
  4. Włącz Gemini tylko do analizy na dużą skalę

Zmniejsz kontekst

  • Czyść czat regularnie
  • Używaj skupionych @wzmianek
  • Wyklucz nieistotne pliki
  • Podsumowuj długie dyskusje

Ponownie używaj kontekstu

  • Zapisuj przydatne prompty
  • Twórz zasady projektu
  • Buduj szablony promptów
  • Używaj funkcji pamięci
# DROGIE: Wiele wywołań Opus 4
"Refaktoryzuj serwis auth" (Opus 4)
"Teraz refaktoryzuj serwis user" (Opus 4)
"Teraz refaktoryzuj serwis profile" (Opus 4)
# EFEKTYWNE: Jedno kompleksowe wywołanie
"Refaktoryzuj serwisy auth, user i profile aby podążały za
naszym nowym wzorcem architektury. Dostarczaj plan implementacji
najpierw, potem wykonaj." (Opus 4 raz)
  1. Faza eksploracji (Sonnet 4)

    • Zrozum problem
    • Zbierz kontekst
    • Początkowe próby
  2. Faza planowania (Opus 4)

    • Projektowanie architektury
    • Rozbijanie złożonych zadań
    • Tworzenie planu implementacji
  3. Faza implementacji (Sonnet 4)

    • Wykonaj plan
    • Pisz kod
    • Twórz testy
  4. Faza debugowania (o3 jeśli potrzeba)

    • Rozwiązuj złożone problemy
    • Optymalizuj algorytmy
    • Naprawiaj przypadki brzegowe
Zadanie: Dodaj powiadomienia użytkownika
Używane modele:
- Sonnet 4: Początkowa implementacja (90%)
- Opus 4: Projektowanie systemu (10%)
Całkowity koszt: ~$5
Oszczędność czasu: 4 godziny
Zadanie: Napraw wyciek pamięci w produkcji
Używane modele:
- Sonnet 4: Początkowe badanie (20%)
- o3: Głęboka analiza i naprawa (80%)
Całkowity koszt: ~$15
Oszczędność czasu: 8 godzin debugowania
Zadanie: Migracja do nowego frameworka
Używane modele:
- Opus 4: Planowanie (20%)
- Gemini 2.5: Analiza (30%)
- Sonnet 4: Implementacja (50%)
Całkowity koszt: ~$40
Oszczędność czasu: 20 godzin
Opus 4: "Utwórz szczegółowy plan implementacji OAuth"
↓ (Zapisz plan do pliku)
Sonnet 4: "Implementuj krok 1 z oauth-plan.md"
Sonnet 4: "Implementuj krok 2 z oauth-plan.md"

Otwórz wiele instancji Cursor:

  • Instancja 1: Opus 4 do architektury
  • Instancja 2: Sonnet 4 do implementacji
  • Instancja 3: o3 do testowania przypadków brzegowych
- Bezpośrednie i konkretne
- Dołączaj przykłady kodu
- Odwołuj się do ścieżek plików
- Jasne kryteria sukcesu
  1. Sprawdź użycie: Ustawienia → Użycie
  2. Ustaw alerty budżetowe
  3. Przeglądaj tygodniowe wzorce
  4. Optymalizuj na podstawie danych
  • Wysokie użycie Opus 4: rozważ lepsze planowanie
  • Powtarzające się podobne zadania: twórz zasady/szablony
  • Długie rozmowy: czyść kontekst częściej
  • Nieudane próby: przełączaj modele wcześniej

Przed rozpoczęciem zadania zapytaj:

  • Czy Sonnet 4 może to obsłużyć? (zacznij tutaj)
  • Czy potrzebuję głębokiego rozumowania? (rozważ Opus 4/o3)
  • Czy rozmiar kontekstu to problem? (rozważ Gemini)
  • Czy używam odpowiedniego stylu promptowania?
  • Czy mogę rozbić to na mniejsze zadania?

Kontynuuj do zasad projektu

Teraz skonfigurujmy zasady projektu aby zapewnić spójne zachowanie AI we wszystkich modelach.

Zasady projektu →

Czas: 10 minut