Strategia wyboru modelu

Jesteś w trakcie tworzenia funkcji, agent właśnie przedstawił solidny plan implementacji i teraz potrzebujesz, aby napisał faktyczny kod. Czy zostawiasz Auto, czy wybierasz model ręcznie? Opus 5 jest drogi, Sonnet 5 może wystarczyć, Gemini 3.1 Pro oferuje duży kontekst, a Cursor ma teraz dwa modele first-party z różnych klas wag: Grok 4.5 i Composer 2.5. Ten artykuł daje ci framework decyzyjny, dzięki któremu wybór modelu staje się dwusekundową decyzją, a nie pięciominutową debatą.

Co osiągniesz

Jasną rekomendację domyślnego modelu (i dlaczego jest domyślny)
Drzewo decyzyjne wskazujące, kiedy przełączać modele na podstawie typu zadania, nie domysłów
Względne profile kosztu, aby planować użycie bez traktowania zmiennego miesięcznego limitu jako stałego
Praktyczne dostosowania promptów dla mocnych stron każdego modelu
Skrót klawiszowy do natychmiastowego przełączania modeli bez przerywania przepływu pracy

Szybkie odniesienie

Model	Koszt wejścia / wyjścia	Zwykły kontekst Cursora	Limit Max / modelu	Najlepszy dla
Composer 2.5	$3 / $15 (Fast) lub $0.50 / $2.50 (Standard) na 1M tokenów	200k	—	Szybkie kodowanie; Fast jest domyślnym wariantem po wybraniu Composer
Claude Fable 5	$10 / $50 na 1M tokenów	200k	1M	Tier o najwyższych możliwościach — zadania dłuższe niż jedna sesja
Claude Opus 5	$5 / $25 na 1M tokenów	200k	1M	Model domyślny: kodowanie agentyczne, złożone rozumowanie, obsługa komputera, pełny zakres effort od low do max
Claude Opus 4.8	$5 / $25 na 1M tokenów	200k	1M	Poprzedni Opus; zastąpiony przez Opus 5 w tej samej cenie
Claude Sonnet 5	$2 / $10 promocyjnie; $3 / $15 po 31 sierpnia	200k	1M	Świadoma budżetowo codzienna praca, extended thinking
Claude Haiku 4.5	$1 / $5 na 1M tokenów	200k	200k	Najszybszy Claude, jakość blisko granicy dla skupionych zadań
Gemini 3.1 Pro	$2 / $12 do 200k wejścia; $4 / $18 powyżej	200k	1M	Ekstremalny kontekst, multimodalność (analiza obrazów/diagramów)
GPT-5.6 Sol	$5 / $30 na 1M tokenów	200k	~1,05M	Najnowszy frontier OpenAI — silne agentyczne kodowanie, obsługa komputera, research
Grok 4.5	$2 / $6 standard; $4 / $18 fast na 1M tokenów	200k	500k API	Długotrwałe kodowanie i szersza praca z komputerem na powierzchniach Cursora
Grok Code	$0.20 / $1.50 na 1M tokenów	200k	256k	Bardzo przyjazne budżetowo proste zadania

Composer 2.5: Specjalista Cursora nastawiony na szybkość

Composer 2.5 został wydany 18 maja 2026 jako specjalista kodowania Cursora. Bazuje na checkpoincie Kimi K2.5 z dalszym pretrainingiem i reinforcement learning Cursora i jest dostrojony pod szybką, tanią iterację. Fast jest domyślnym wariantem po wybraniu Composer; bieżąca dokumentacja Cursora nie wskazuje Composer jako stałego modelu Auto.

W bieżącym Artificial Analysis Coding Agent Index v1.1 Composer 2.5 osiąga 52 w Cursor CLI (około 16% DeepSWE, 67% Terminal-Bench v2 i 72% SWE-Atlas-QnA). Starszy wynik 62 pochodził z majowego indeksu v1.0 i nie jest bezpośrednio porównywalny, bo zmienił się koszyk benchmarków.

Kiedy zostać przy Composer 2.5

Szybka iteracja i poprawki stylu, gdzie i tak będziesz dopracowywać 5-10 razy
Dobrze zakresione refaktory w jednym pliku lub module
“Szybkie pytanie” inline edit podczas pracy nad większym planem
Uruchamianie wielu agentów równolegle w Agents Window — szybkość Composer 2.5 utrzymuje wszystkie panele responsywne

Kiedy się przełączyć

Zadanie dotyka cross-module architektury lub kodu wrażliwego na bezpieczeństwo — Opus 5
Potrzebujesz rozumowania po bazie kodu 500k linii — Gemini 3.1 Pro lub Opus 5 w trybie 1M
Bieżący model ciągle popełnia ten sam błąd — świeży model często przełamuje pętlę

Grok 4.5: Długotrwała praca z komputerem

Cursor i SpaceXAI wydali Grok 4.5 8 lipca 2026 po wspólnym treningu modelu mixture-of-experts na danych interakcji z Cursorem oraz szerszym miksie STEM i knowledge work. Model celuje w długie zadania programistyczne i szerszą pracę z komputerem; jest dostępny w aplikacji desktopowej, web, iOS, CLI i SDK. Tryb standard kosztuje $2/$6 za milion tokenów wejścia/wyjścia, a fast $4/$18. Cursor wyklucza CursorBench z porównania premierowego, ponieważ trening Grok 4.5 przypadkowo zawierał starszy snapshot kodu Cursora.

Grok 4.5 nie jest następcą produktowym Composer 2.5. Cursor mówi, że modele należą do różnych klas wag, Composer pozostanie dostępny, a firma będzie rozwijać kolejne modele tej wielkości. Używaj Grok do szerszej, trudniejszej i dłuższej pracy, a Composer do tańszych, szybszych pętli kodowania. Wyniki premierowe Cursora podają odpowiednio dla Grok 4.5 i Composer 2.5: 64,7 wobec 54,0 w SWE-Bench Pro, 83,3 wobec 73,0 w Terminal-Bench 2.1 i 62 wobec 18 w DeepSWE 1.0. Artificial Analysis zmierzył Grok 4.5 + Grok Build na 76 w bieżącym indeksie agentów kodowania wobec 52 dla Composer 2.5 + Cursor CLI. Oba porównania traktuj jako snapshoty całego systemu z podanymi wersjami benchmarków i różnymi harnessami agentów, nie izolowane pomiary wag modeli.

16 czerwca SpaceX podpisał umowę przejęcia Anysphere/Cursor przy implikowanej wycenie $60 mld. Na 11 lipca nie było to zakończone przejęcie przez xAI: transakcja nadal podlegała warunkom zamknięcia i zgodom regulacyjnym, a finalizację przewidywano na III kwartał 2026. xAI wcześniej dołączyło do SpaceX, a połączona działalność AI używa marki SpaceXAI.

Claude Fable 5: Tier o najwyższych możliwościach

Wydany 9 czerwca 2026 i dostępny w selektorze modelu Cursor, Claude Fable 5 (claude-fable-5) to tier Anthropic o najwyższych możliwościach — opisywany jako “model klasy Mythos, który uczyniliśmy bezpiecznym do ogólnego użytku”. Anthropic podaje, że jego przewaga nad resztą rodziny rośnie z długością i złożonością zadania, i tak należy to czytać: Fable jest do pracy dłuższej niż jedna sesja, nie do rutynowej przepustowości. Opus 5 wyprzedza go teraz w większości opublikowanych pomiarów, w tym w Intelligence Index od Artificial Analysis. Ma okno kontekstowe 1M tokenów i udostępnia pełen zakres poziomów effort: low, medium, high, xhigh i max, przy zawsze włączonym myśleniu.

Haczyk to koszt: przy $10 / $50 na 1M tokenów jest dokładnie 2x droższy od Opus 5, więc wypala twój budżet użycia dwa razy szybciej. Zanim za to zapłacisz, podnieś poziom effort w Opus 5 — low i medium w obecnej generacji często wypadają lepiej niż xhigh w poprzednich modelach, więc przegląd poziomów effort jest tańszy niż zmiana tieru. W planach Claude Fable 5 jest od 20 lipca 2026 na stałe wliczony w Max i Team Premium, z limitem 50% tygodniowych limitów użycia; Pro i Team Standard sięgają po niego przez usage credits — szczegóły znajdziesz w dodatku z porównaniem modeli.

Claude Opus 5: Model domyślny do poważnej pracy

Claude Opus 5 (claude-opus-5) to obecny Opus od Anthropic, wydany 24 lipca 2026 w tej samej cenie $5 / $25 co Opus 4.8. Oferuje wydajność agentyczną na poziomie state-of-the-art — Anthropic raportuje wyniki SOTA w Frontier-Bench v0.1 i GDPval-AA v2, zwycięstwo nad Fable 5 w OSWorld 2.0 przy około jednej trzeciej kosztu oraz wynik CursorBench 3.2 mieszczący się w 0,5 punktu od szczytu Fable 5 przy poziomie effort max. Obsługuje wysokorozdzielcze wejście obrazów (do 2576px na dłuższej krawędzi / 3.75MP) dla analizy zrzutów ekranu/artefaktów, a jego granica wiedzy z maja 2026 jest najświeższa spośród modeli Claude. W Cursorze wybierz go jawnie w selektorze modeli; Max Mode włączaj tylko wtedy, gdy większy kontekst uzasadnia dodatkowe opóźnienie i koszt.

Kiedy używać Opus 5

Złożony refaktoring wieloplikowy
Projektowanie architektury i planowanie systemu
Audyty bezpieczeństwa i przeglądy kodu
Generowanie testów dla niuansowanej logiki biznesowej
Workflow obsługi komputera / zrzutów ekranu (rozdzielczość 2576px z mapowaniem pikseli 1:1)
Każde zadanie, gdzie zrobienie tego dobrze za pierwszym razem oszczędza więcej pieniędzy niż kosztuje model

Wskazówki dotyczące promptów dla Opus 5

Opus 5 udostępnia pełny zakres poziomów effort low/medium/high/xhigh/max i domyślnie używa high; xhigh pasuje do większości kodowania agentycznego. Trzy nawyki do zmiany względem starszych modeli: sam weryfikuje swoją pracę bez proszenia, więc rusztowania typu “dokładnie sprawdź odpowiedź” usuń, a nie przepisuj — takie instrukcje powodują teraz nadmierną weryfikację. Domyślnie pisze dłuższe odpowiedzi, a poziom effort nie jest dźwignią, która je skraca; poproś o zwięzłość wprost. Może też po cichu rozszerzyć zakres zadania, więc określ granicę, gdy chcesz dokładnie tego, o co prosisz, i niczego obok.

Przeanalizuj system uwierzytelniania we wszystkich plikach w src/auth/ i src/middleware/.
Zidentyfikuj luki w zabezpieczeniach i problemy architektoniczne.
Zaproponuj plan refaktoryzacji, który odnosi się do każdego problemu.
Przed wdrożeniem wyjaśnij swoje rozumowanie i zapytaj, czy chcę dostosować podejście.

Claude Sonnet 5: Budżetowy koń roboczy

Przy promocyjnej stawce $2/$10 Sonnet 5 kosztuje o 60% mniej za tokeny wejściowe i wyjściowe niż Opus 5 za $5/$25; po 31 sierpnia stawka $3/$15 będzie niższa o 40%. Model zachowuje pełne okno kontekstu 1M i często jest opłacalnym wyborem do prostych zadań, takich jak funkcje narzędziowe, pola formularzy i standardowe endpointy CRUD — sprawdź to jednak na własnym workloadzie zamiast zakładać identyczną jakość.

Kiedy przełączyć się na Sonnet 5

Rutynowe kodowanie, gdzie wzorzec jest dobrze ugruntowany
Zadania, gdzie i tak będziesz przeglądać i iterować
Gdy twój miesięczny budżet użycia się wyczerpuje
Długie rozmowy, gdzie potrzebujesz 1M kontekstu, ale chcesz zarządzać kosztami

Praktyczny test

Jeśli możesz opisać zadanie w jednym zdaniu, a oczekiwane wyjście jest przewidywalne, Sonnet 5 sobie poradzi. Jeśli zadanie wymaga ważenia kompromisów lub zrozumienia subtelnych implikacji architektonicznych, zostań przy Opus 5.

Utwórz funkcję narzędziową TypeScript, która debounce'uje funkcje asynchroniczne.
Powinna obsługiwać anulowanie i zwracać wynik ostatniego wywołania.
Dołącz kompleksowe testy używając Vitest.

Claude Haiku 4.5: Szybki, tani, blisko granicy jakości

Haiku 4.5 (claude-haiku-4-5) to najszybszy Claude w cenie $1/$5 za MTok z kontekstem 200k. Jest zauważalnie lepszy niż cokolwiek w swojej półce dla skupionych zadań: krótkich refaktorów, wyjaśnień kodu, feedbacku w stylu lintera. W Agents Window wrzuć go w jeden panel jako “szybkiego reviewera” który inspektuje wyjście Opus 5 podczas gdy Opus dalej iteruje.

Gemini 3.1 Pro: Specjalista od kontekstu

Główną cechą Gemini 3.1 Pro jest jego okno kontekstowe 1M tokenów (dostępne przez tryb Max). Gdy potrzebujesz, aby AI zrozumiało całą twoją bazę kodu na raz — nie tylko pliki, które ręcznie referencjonujesz — Gemini 3.1 Pro to model do wyboru.

Kiedy przełączyć się na Gemini 3.1 Pro

Analizowanie dużych baz kodu (50k+ linii), gdzie zrozumienie międzymodułowe ma znaczenie
Praca z obrazami — wklej zrzut ekranu błędu UI lub projekt Figma bezpośrednio do czatu
Przeglądanie diagramów architektonicznych lub dokumentacji zawierającej elementy wizualne
Zadania, gdzie objętość kontekstu ma większe znaczenie niż głębokość rozumowania

Przewaga multimodalna

Gemini 3.1 Pro obsługuje obrazy natywnie. Przeciągnij zrzut ekranu do czatu Cursor i poproś o odtworzenie układu, zidentyfikowanie błędu wizualnego lub wdrożenie projektu z makiety.

Załączyłem zrzut ekranu naszego obecnego dashboardu. Odstępy między
kartami metryk są niespójne, a legenda wykresu zachodzi na siebie na mobile.
Napraw responsywny układ w src/components/Dashboard.tsx, aby dopasować
odstępy z naszego systemu projektowego (siatka bazowa 8px).

GPT-5.6 Sol i Gemini 3.1 Pro: Alternatywny front

GPT-5.6 Sol osiągnął general availability 9 lipca 2026 i jest flagowym modelem OpenAI, dostępnym w selektorze modelu Cursor. Wyróżnia się w agentycznym kodowaniu, obsłudze komputera, pracy z wiedzą i przepływach research. W cenie $5/$30 za MTok z kontekstem około 1,05M konkuruje z modelami frontier premium. Użyj go, gdy chcesz innej “perspektywy” — czasami przełączenie rodzin modeli odblokowuje problem, z którym jedna rodzina ciągle sobie nie radzi. /best-of-n uruchamia zadanie w kilku równoległych worktrees (agentach), abyś mógł porównać diffy i scalić najlepszy — skieruj każdy worktree na inny model (powiedzmy Composer 2.5, Opus 5 i GPT-5.6 Sol), aby porównać rodziny bezpośrednio.

Gemini 3.1 Pro pozostaje sztandarowym wyborem do pracy multimodalnej. Przeciągnij zrzut ekranu do Agents Window lub Design Mode i poproś o odtworzenie układu, zidentyfikowanie błędu wizualnego lub wdrożenie z makiety.

Drzewo decyzyjne

Gdy pojawi się nowe zadanie, przejdź przez to:

Czy chcesz, by Cursor routował dynamicznie?

Tak: zostaw Auto. Jeśli ważniejsze są przewidywalnie niski koszt i szybka iteracja, wybierz ręcznie Composer 2.5.
Czy to złożone, wieloplikowe zadanie lub decyzja architektoniczna?

Tak: Użyj Claude Opus 5 (podnieś effort do xhigh lub max dla najtrudniejszego rozumowania). Dla absolutnie najtrudniejszych z nich — migracji obejmujących całą bazę kodu, budowania aplikacji od zera — użyj Claude Fable 5, jeśli budżet na to pozwala. Lub spróbuj /best-of-n aby porównać z GPT-5.6 Sol i Composer 2.5.
Czy to proste, dobrze zdefiniowane zadanie z przewidywalnym wyjściem?

Tak: Użyj Claude Sonnet 5 lub zostań przy Composer 2.5 (jeśli szybkość ma znaczenie). Claude Haiku 4.5 jest szybszy i tańszy dla skupionych zadań.
Czy muszę przeanalizować więcej niż 200k tokenów kontekstu?

Tak: Włącz Max Mode i wybierz Opus 5, Sonnet 5, GPT-5.6 Sol lub Gemini 3.1 Pro — z zastrzeżeniem limitu, który Cursor udostępnia dla danego modelu.
Czy pracuję z obrazami, zrzutami ekranu lub diagramami?

Tak: Opus 5 (wysokorozdzielcze wsparcie 2576px), Gemini 3.1 Pro (natywna multimodalność) lub GPT-5.6 Sol (obsługa komputera).
Czy utknąłem i obecny model ciągle popełnia ten sam błąd?

Tak: Przełącz rodzinę modeli. /best-of-n to najszybszy sposób na wypróbowanie trzech opcji naraz.

Przełączanie modeli w Cursor

Selektor modelu jest w panelu agenta, tuż obok selektora trybu. Możesz przełączać modele w trakcie rozmowy — nowy model podejmuje istniejący kontekst. W Agents Window Cursor 3.0 możesz uruchamiać różne modele na różnych zakładkach agenta jednocześnie.

Skrót klawiszowy: Naciśnij Cmd+. (macOS) lub Ctrl+. (Windows/Linux), aby szybko przełączać tryby. Dla wyboru modelu kliknij nazwę modelu w panelu agenta.

Tryb Auto (routing dynamiczny)

Tryb Auto w Cursor 3.x wybiera model premium, który uważa za niezawodny dla bieżącego zadania, i może przełączyć go przy pogorszeniu odpowiedzi dostawcy. Cursor nie gwarantuje publicznie stałego modelu dla każdego żądania ani nie dokumentuje Composer 2.5 jako trwałego domyślnego modelu Auto. Jeśli potrzebujesz konkretnego modelu, profilu opóźnienia lub przewidywalnej stawki tokenowej, wybierz go ręcznie i sprawdź później dashboard użycia.

Dla początkujących Auto to rozsądny punkt wyjścia. Gdy rozwiniesz wyczucie, który model pasuje do którego zadania, ręczny wybór daje większą kontrolę i często lepsze wyniki.

Optymalizacja kosztów w praktyce

Względne wzorce użycia

Styl developera	Główny model	Względny profil kosztu
Cały Opus 5 / `xhigh`	Claude Opus 5	Najwyższy; tokeny premium i większy effort kumulują zużycie
Mieszany (zalecany)	Composer 2.5 wybierany ręcznie dla rutyny, Opus 5 dla złożonych	Umiarkowany; wydawaj tokeny premium tylko tam, gdzie zmieniają wynik
Świadomy budżetowo	Composer 2.5 Standard + Sonnet 5 + Haiku 4.5	Najniższy z tych wzorców; preferuj modele o niższej stawce i krótszy kontekst

Strategie oszczędzania kosztów

Wybieraj Composer 2.5 ręcznie do taniej iteracji; Auto zostaw, gdy dynamiczna niezawodność jest ważniejsza niż stały model
Rozpoczynaj rozmowy od nowa — długie rozmowy gromadzą kontekst, który kosztuje przy każdej wiadomości
Używaj referencji @ zamiast wklejania dużych bloków kodu — Cursor obsługuje referencje do plików bardziej efektywnie
Rezerwuj Opus 5 xhigh dla naprawdę trudnych problemów — wyższy poziom effort zużywa materialnie więcej tokenów
Włączaj tryb Max tylko gdy potrzeba — nie zostawiaj go włączonego na stałe

Gdy coś się zepsuje

Model wydaje się gorszy: Wydajność API, konfiguracja hosta i aliasy mogą się zmieniać. Sprawdź status i changelog Cursora, powtórz kontrolowany prompt i tymczasowo zmień model, jeśli wynik jest konsekwentnie gorszy.

Przełączanie modeli w trakcie rozmowy traci kontekst: To rzadkie, ale może się zdarzyć przy bardzo długich rozmowach. Jeśli zauważysz pogorszoną jakość po przełączeniu, rozpocznij nowy czat z nowym modelem i @-referencjonuj konkretne pliki.

Tryb Auto ciągle wybiera model, którego nie lubisz: Wyłącz Auto i wybieraj ręcznie. Dwie sekundy potrzebne na wybór modelu są warte spójności.

Użycie się kończy przed końcem miesiąca: Sprawdź swoje użycie w Ustawieniach. Jeśli wypalajesz tokeny Opus 5 na zadaniach, które Sonnet 5 lub Composer 2.5 mógłby obsłużyć, przesuń swój domyślny model dla rutynowej pracy.

Odpowiedzi Opus 5 są zbyt zwięzłe: Poproś wprost o potrzebny poziom szczegółu albo zwiększ effort do xhigh przy trudniejszym rozumowaniu. Jeśli styl nadal nie pasuje do zadania, porównaj kontrolnie inną rodzinę modeli w świeżej rozmowie.

Źródła weryfikacji

Cursor: bieżąca dokumentacja modeli i Auto, premiera Grok 4.5 i premiera Composer 2.5
Wyniki niezależne: ranking agentów kodowania Artificial Analysis, analiza Grok 4.5 i metodologia v1.1
Status transakcji: Form 8-K SpaceX złożony w SEC

Co dalej

Zasady projektowe Skonfiguruj .cursor/rules/, aby AI generowało kod zgodny z konwencjami twojego zespołu od samego pierwszego promptu.