Strategia wyboru modelu

Jesteś w trakcie tworzenia funkcji, agent właśnie przedstawił solidny plan implementacji i teraz potrzebujesz, aby napisał faktyczny kod. Czy zostajesz przy domyślnym modelu, czy przełączasz? Słyszałeś, że Opus 4.6 jest “najlepszy”, ale jest też najdroższy. Sonnet 4.5 jest tańszy, ale nie jesteś pewien, czy poradzi sobie ze złożonością. Gemini 3 Pro ma ogromne okno kontekstowe, ale nigdy go nie próbowałeś. Tymczasem wybór modelu w Cursor pokazuje osiem opcji i zero wskazówek. Ten artykuł daje ci framework decyzyjny, dzięki któremu wybór modelu staje się dwusekundową decyzją, a nie pięciominutową debatą.

Co osiągniesz

Jasną rekomendację domyślnego modelu (i dlaczego jest domyślny)
Drzewo decyzyjne wskazujące, kiedy przełączać modele na podstawie typu zadania, nie domysłów
Szacunki kosztów na zadanie, dzięki czemu możesz zabudżetować miesięczne użycie
Praktyczne dostosowania promptów dla mocnych stron każdego modelu
Skrót klawiszowy do natychmiastowego przełączania modeli bez przerywania przepływu pracy

Szybkie odniesienie

Model	Koszt wejścia / wyjścia	Domyślny kontekst	Maks kontekst	Najlepszy dla
Claude Opus 4.6	$5 / $25 na 1M tokenów	200k	1M	Domyślnie dla wszystkiego — najlepsza wydajność agentyczna
Claude Sonnet 4.5	$3 / $15 na 1M tokenów	200k	1M	Świadoma budżetowo codzienna praca, duże potrzeby kontekstowe
Gemini 3 Pro	$2 / $12 na 1M tokenów	200k	1M	Ekstremalny kontekst, multimodalność (analiza obrazów/diagramów)
GPT-5.2	$1.75 / $14 na 1M tokenów	272k	—	Silna alternatywa, dobry do pracy nad UI
Composer 1	$1.25 / $10 na 1M tokenów	200k	—	Krytyczna szybkość iteracji w Cursor
Grok Code	$0.20 / $1.50 na 1M tokenów	256k	—	Bardzo przyjazne budżetowo proste zadania

Claude Opus 4.6: Twój domyślny model

Claude Opus 4.6 to zalecany domyślny model dla wszystkich prac kodowania w Cursor. Ma najwyższe wyniki SWE-Bench, najlepszą wydajność agentyczną (niezawodnie obsługuje wieloetapowe użycie narzędzi) i produkuje najbardziej architektonicznie poprawny kod.

Kiedy używać Opus 4.6

Każde zadanie, dopóki nie będziesz mieć konkretnego powodu do przełączenia
Złożony refaktoring wieloplikowy
Projektowanie architektury i planowanie systemu
Audyty bezpieczeństwa i przeglądy kodu
Generowanie testów dla niuansowanej logiki biznesowej
Każde zadanie, gdzie zrobienie tego dobrze za pierwszym razem oszczędza więcej pieniędzy niż kosztuje model

Wskazówki dotyczące promptów dla Opus 4.6

Opus 4.6 korzysta z celów wysokiego poziomu z ograniczeniami, zamiast z mikrozarządzania krok po kroku. Pozwól mu rozumować.

Przeanalizuj system uwierzytelniania we wszystkich plikach w src/auth/ i src/middleware/.
Zidentyfikuj luki w zabezpieczeniach i problemy architektoniczne.
Zaproponuj plan refaktoryzacji, który odnosi się do każdego problemu.
Przed wdrożeniem wyjaśnij swoje rozumowanie i zapytaj, czy chcę dostosować podejście.

Claude Sonnet 4.5: Budżetowy koń roboczy

Sonnet 4.5 kosztuje 40% mniej niż Opus 4.6 na tokenach wejściowych i 40% mniej na tokenach wyjściowych. Dla prostych zadań — pisania funkcji narzędziowej, dodawania pola do formularza, generowania standardowych endpointów CRUD — różnica w jakości jest minimalna.

Kiedy przełączyć się na Sonnet 4.5

Rutynowe kodowanie, gdzie wzorzec jest dobrze ugruntowany
Zadania, gdzie i tak będziesz przeglądać i iterować
Gdy twój miesięczny budżet użycia się wyczerpuje
Długie rozmowy, gdzie potrzebujesz trybu Max (1M kontekstu), ale chcesz zarządzać kosztami

Praktyczny test

Jeśli możesz opisać zadanie w jednym zdaniu, a oczekiwane wyjście jest przewidywalne, Sonnet 4.5 sobie poradzi. Jeśli zadanie wymaga ważenia kompromisów lub zrozumienia subtelnych implikacji architektonicznych, zostań przy Opus 4.6.

Utwórz funkcję narzędziową TypeScript, która debounce'uje funkcje asynchroniczne.
Powinna obsługiwać anulowanie i zwracać wynik ostatniego wywołania.
Dołącz kompleksowe testy używając Vitest.

Gemini 3 Pro: Specjalista od kontekstu

Główną cechą Gemini 3 Pro jest jego okno kontekstowe 1M tokenów (dostępne przez tryb Max). Gdy potrzebujesz, aby AI zrozumiało całą twoją bazę kodu na raz — nie tylko pliki, które ręcznie referencjonujesz — Gemini 3 Pro to model do wyboru.

Kiedy przełączyć się na Gemini 3 Pro

Analizowanie dużych baz kodu (50k+ linii), gdzie zrozumienie międzymodułowe ma znaczenie
Praca z obrazami — wklej zrzut ekranu błędu UI lub projekt Figma bezpośrednio do czatu
Przeglądanie diagramów architektonicznych lub dokumentacji zawierającej elementy wizualne
Zadania, gdzie objętość kontekstu ma większe znaczenie niż głębokość rozumowania

Przewaga multimodalna

Gemini 3 Pro obsługuje obrazy natywnie. Przeciągnij zrzut ekranu do czatu Cursor i poproś o odtworzenie układu, zidentyfikowanie błędu wizualnego lub wdrożenie projektu z makiety.

Załączyłem zrzut ekranu naszego obecnego dashboardu. Odstępy między
kartami metryk są niespójne, a legenda wykresu zachodzi na siebie na mobile.
Napraw responsywny układ w src/components/Dashboard.tsx, aby dopasować
odstępy z naszego systemu projektowego (siatka bazowa 8px).

GPT-5.2 i Composer 1: Wyspecjalizowane role

GPT-5.2 to silny model ogólnego przeznaczenia dostępny natywnie w Cursor. Ma domyślne okno kontekstowe 272k i dobrze radzi sobie z pracą frontendową, generowaniem UI i naprawianiem błędów. Użyj go, gdy chcesz innej “perspektywy” — czasami przełączenie modeli odblokowuje problem, z którym jeden model ciągle sobie nie radzi.

Composer 1 to własny model Cursor, zoptymalizowany pod kątem szybkości w edytorze. Kończy większość tur w mniej niż 30 sekund i kosztuje znacznie mniej niż modele graniczne. Użyj go do szybkiej iteracji: szybkie zmiany stylu, małe refaktory i zadania, gdzie i tak będziesz iterować pięć razy.

Drzewo decyzyjne

Gdy pojawi się nowe zadanie, przejdź przez to:

Czy to złożone, wieloplikowe zadanie lub decyzja architektoniczna?

Tak: Użyj Claude Opus 4.6. Jakość rozumowania sama się spłaca.
Czy to proste, dobrze zdefiniowane zadanie z przewidywalnym wyjściem?

Tak: Użyj Claude Sonnet 4.5 lub Composer 1 (jeśli szybkość ma znaczenie).
Czy muszę przeanalizować więcej niż 200k tokenów kontekstu?

Tak: Użyj Gemini 3 Pro z trybem Max lub modeli Claude w trybie Max.
Czy pracuję z obrazami, zrzutami ekranu lub diagramami?

Tak: Użyj Gemini 3 Pro dla jego natywnego wsparcia multimodalnego.
Czy utknąłem i obecny model ciągle popełnia ten sam błąd?

Tak: Przełącz się na inny model. GPT-5.2 lub inny model Claude często podchodzi do problemu inaczej.

Przełączanie modeli w Cursor

Selektor modelu jest w panelu agenta, tuż obok selektora trybu. Możesz przełączać modele w trakcie rozmowy — nowy model podejmuje istniejący kontekst.

Skrót klawiszowy: Naciśnij Cmd+. (macOS) lub Ctrl+. (Windows/Linux), aby szybko przełączać tryby. Dla wyboru modelu kliknij nazwę modelu w panelu agenta.

Tryb Auto

Cursor oferuje ustawienie Auto, które automatycznie wybiera najlepszy model dla każdego żądania na podstawie złożoności zadania i bieżącej dostępności API. Auto używa mieszanego cennika ($1.25 wejście, $6.00 wyjście na 1M tokenów) i automatycznie obsługuje degradację modelu — jeśli API jednego modelu jest wolne, kieruje do innego.

Dla początkujących Auto to rozsądny punkt wyjścia. Gdy rozwiniesz wyczucie, który model pasuje do którego zadania, ręczny wybór daje większą kontrolę i często lepsze wyniki.

Optymalizacja kosztów w praktyce

Typowe miesięczne wzorce użycia

Styl developera	Główny model	Szacowany koszt miesięczny
Cały Opus 4.6	Claude Opus 4.6	$100-200
Mieszany (zalecany)	Opus dla złożonych, Sonnet/Composer dla rutynowych	$60-120
Świadomy budżetowo	Sonnet 4.5 + Composer 1	$30-60

Strategie oszczędzania kosztów

Rozpoczynaj rozmowy od nowa — długie rozmowy gromadzą kontekst, który kosztuje przy każdej wiadomości
Używaj referencji @ zamiast wklejania dużych bloków kodu — Cursor obsługuje referencje do plików bardziej efektywnie
Przełącz się na Composer 1 do iteracji — jeśli zamierzasz wysłać 10 wiadomości dopracowując CSS, tani model jest w porządku
Włączaj tryb Max tylko gdy potrzeba — nie zostawiaj go włączonego na stałe

Gdy coś się zepsuje

Model wydaje się gorszy: Modele nie regresują, ale wydajność API się zmienia. Jeśli model produkuje niższej jakości wyjście niż zwykle, spróbuj tego samego promptu 10 minut później lub przełącz się tymczasowo na inny model.

Przełączanie modeli w trakcie rozmowy traci kontekst: To rzadkie, ale może się zdarzyć przy bardzo długich rozmowach. Jeśli zauważysz pogorszoną jakość po przełączeniu, rozpocznij nowy czat z nowym modelem i referencjonuj konkretne pliki.

Tryb Auto ciągle wybiera model, którego nie lubisz: Wyłącz Auto i wybieraj ręcznie. Dwie sekundy potrzebne na wybór modelu są warte spójności.

Użycie się kończy przed końcem miesiąca: Sprawdź swoje użycie w Ustawieniach. Jeśli wypalajesz tokeny Opus 4.6 na zadaniach, które Sonnet 4.5 mógłby obsłużyć, przesuń swój domyślny model dla rutynowej pracy.

Co dalej

Zasady projektowe Skonfiguruj .cursor/rules/, aby AI generowało kod zgodny z konwencjami twojego zespołu od samego pierwszego promptu.