Przejdź do głównej zawartości

Strategia wyboru modelu

Jesteś w trakcie tworzenia funkcji, agent właśnie przedstawił solidny plan implementacji i teraz potrzebujesz, aby napisał faktyczny kod. Czy zostajesz przy domyślnym modelu, czy przełączasz? Słyszałeś, że Opus 4.8 jest “najlepszy”, ale jest też najdroższy. Sonnet 4.6 jest tańszy, ale nie jesteś pewien, czy poradzi sobie ze złożonością. Gemini 3.1 Pro ma ogromne okno kontekstowe, ale nigdy go nie próbowałeś. Composer 2.5 jest domyślny w trybie Auto w Cursor 3.0. Tymczasem wybór modelu pokazuje długą listę opcji i zero wskazówek. Ten artykuł daje ci framework decyzyjny, dzięki któremu wybór modelu staje się dwusekundową decyzją, a nie pięciominutową debatą.

  • Jasną rekomendację domyślnego modelu (i dlaczego jest domyślny)
  • Drzewo decyzyjne wskazujące, kiedy przełączać modele na podstawie typu zadania, nie domysłów
  • Szacunki kosztów na zadanie, dzięki czemu możesz zabudżetować miesięczne użycie
  • Praktyczne dostosowania promptów dla mocnych stron każdego modelu
  • Skrót klawiszowy do natychmiastowego przełączania modeli bez przerywania przepływu pracy
ModelKoszt wejścia / wyjściaDomyślny kontekstMaks kontekstNajlepszy dla
Composer 2.5$3 / $15 (fast, domyślny) lub $0.50 / $2.50 (standard) na 1M tokenów200kDomyślny w trybie Auto w Cursor 3.x; iteracja krytyczna dla szybkości
Claude Fable 5$10 / $50 na 1M tokenów1M1MNowy najwyższy tier ponad Opusem — najtrudniejsze wieloplikowe refaktory, budowanie aplikacji od zera, długotrwałe zadania
Claude Opus 4.8$5 / $25 na 1M tokenów1M1MTop-tier agentyczne kodowanie, złożone rozumowanie, poziomy effort high/xhigh/max
Claude Sonnet 4.6$3 / $15 na 1M tokenów1M1MŚwiadoma budżetowo codzienna praca, extended thinking
Claude Haiku 4.5$1 / $5 na 1M tokenów200k200kNajszybszy Claude, jakość blisko granicy dla skupionych zadań
Gemini 3.1 Pro$2 / $12 na 1M tokenów200k1MEkstremalny kontekst, multimodalność (analiza obrazów/diagramów)
GPT-5.5$5 / $30 na 1M tokenów1M1MNajnowszy frontier OpenAI — silne agentyczne kodowanie, obsługa komputera, research
Grok Code$0.20 / $1.50 na 1M tokenów256kBardzo przyjazne budżetowo proste zadania

Cursor 3.0 (2 kwietnia 2026) uczynił Composer domyślnym modelem w trybie Auto; aktualnym domyślnym modelem Auto jest Composer 2.5 (wydany 18 maja 2026). To własny, skupiony na kodowaniu model Anysphere, wytrenowany na bazie Kimi K2.5 od Moonshot z ciągłym pretreningiem i ukierunkowanym runem RL (25x więcej syntetycznych zadań niż Composer 2). Osiąga 63.2 w CursorBench v3.1 i jest dostrojony pod szybką, niskokosztową iterację — Cursor pozycjonuje go jako model kodowania klasy frontier za około jedną dziesiątą kosztu na token w porównaniu do porównywalnych modeli.

  • Szybka iteracja i poprawki stylu, gdzie i tak będziesz dopracowywać 5-10 razy
  • Dobrze zakresione refaktory w jednym pliku lub module
  • “Szybkie pytanie” inline edit podczas pracy nad większym planem
  • Uruchamianie wielu agentów równolegle w Agents Window — szybkość Composer 2.5 utrzymuje wszystkie panele responsywne
  • Zadanie dotyka cross-module architektury lub kodu wrażliwego na bezpieczeństwo — Opus 4.8
  • Potrzebujesz rozumowania po bazie kodu 500k linii — Gemini 3.1 Pro lub Opus 4.8 w trybie 1M
  • Bieżący model ciągle popełnia ten sam błąd — świeży model często przełamuje pętlę

Wydany 9 czerwca 2026 i dostępny już w selektorze modelu Cursor, Claude Fable 5 (claude-fable-5) to nowy tier ponad Opusem — Anthropic opisuje go jako “model klasy Mythos, który uczyniliśmy bezpiecznym do ogólnego użytku”, a jego możliwości przewyższają wszystko, co firma kiedykolwiek udostępniła ogólnie. W praktyce jest wyraźnie lepszy od Opus 4.8 w złożonych wieloplikowych refaktoryzacjach, naprawianiu błędów, budowaniu aplikacji od zera i długotrwałych zadaniach wymagających szczytowej inteligencji. Ma okno kontekstowe 1M tokenów i udostępnia pełen zakres poziomów effort: low, medium, high, xhigh i max.

Haczyk to koszt: przy $10 / $50 na 1M tokenów jest dokładnie 2x droższy od Opus 4.8, więc wypala twój budżet użycia dwa razy szybciej — rezerwuj go do pracy, przy której Opus 4.8 faktycznie nie daje rady. Jeśli korzystasz też z płatnych planów Claude (Pro, Max, Team, Enterprise rozliczany per stanowisko), od 9 do 22 czerwca 2026 Fable 5 jest tam wliczony bez dodatkowych opłat — szczegóły znajdziesz w dodatku z porównaniem modeli.

Claude Opus 4.8 to flagowy model Anthropic w tierze Opus (Fable 5 plasuje się teraz nad nim), wydany 28 maja 2026. Ma najwyższe wyniki SWE-Bench, wydajność agentyczną z najwyższej półki (niezawodnie obsługuje wieloetapowe użycie narzędzi) i obsługuje wysokorozdzielcze wejście obrazów (do 2576px na dłuższej krawędzi / 3.75MP) dla analizy zrzutów ekranu/artefaktów. W Cursor jest dostępny na pickerze modelu oraz w trybach Auto High / Max.

  • Złożony refaktoring wieloplikowy
  • Projektowanie architektury i planowanie systemu
  • Audyty bezpieczeństwa i przeglądy kodu
  • Generowanie testów dla niuansowanej logiki biznesowej
  • Workflow obsługi komputera / zrzutów ekranu (rozdzielczość 2576px z mapowaniem pikseli 1:1)
  • Każde zadanie, gdzie zrobienie tego dobrze za pierwszym razem oszczędza więcej pieniędzy niż kosztuje model

Opus 4.8 udostępnia poziomy effort high/xhigh/max (xhigh mieści się między high a max) i domyślnie używa high. Podąża również bardziej dosłownie za instrukcjami — jeśli twoje prompty dla Opus 4.8 miały rusztowania typu “dokładnie sprawdź układ slajdu przed zwróceniem”, spróbuj je usunąć i re-baseline. Długość odpowiedzi kalibruje się teraz do postrzeganej złożoności zadania, więc spodziewaj się zwięźlejszego wyjścia dla prostych pytań.

Sonnet 4.6 kosztuje 40% mniej niż Opus 4.8 na tokenach wejściowych i 40% mniej na tokenach wyjściowych, z pełnym oknem kontekstu 1M. Dla prostych zadań — pisania funkcji narzędziowej, dodawania pola do formularza, generowania standardowych endpointów CRUD — różnica w jakości jest minimalna.

  • Rutynowe kodowanie, gdzie wzorzec jest dobrze ugruntowany
  • Zadania, gdzie i tak będziesz przeglądać i iterować
  • Gdy twój miesięczny budżet użycia się wyczerpuje
  • Długie rozmowy, gdzie potrzebujesz 1M kontekstu, ale chcesz zarządzać kosztami

Jeśli możesz opisać zadanie w jednym zdaniu, a oczekiwane wyjście jest przewidywalne, Sonnet 4.6 sobie poradzi. Jeśli zadanie wymaga ważenia kompromisów lub zrozumienia subtelnych implikacji architektonicznych, zostań przy Opus 4.8.

Claude Haiku 4.5: Szybki, tani, blisko granicy jakości

Dział zatytułowany „Claude Haiku 4.5: Szybki, tani, blisko granicy jakości”

Haiku 4.5 (claude-haiku-4-5) to najszybszy Claude w cenie $1/$5 za MTok z kontekstem 200k. Jest zauważalnie lepszy niż cokolwiek w swojej półce dla skupionych zadań: krótkich refaktorów, wyjaśnień kodu, feedbacku w stylu lintera. W Agents Window wrzuć go w jeden panel jako “szybkiego reviewera” który inspektuje wyjście Opus 4.8 podczas gdy Opus dalej iteruje.

Główną cechą Gemini 3.1 Pro jest jego okno kontekstowe 1M tokenów (dostępne przez tryb Max). Gdy potrzebujesz, aby AI zrozumiało całą twoją bazę kodu na raz — nie tylko pliki, które ręcznie referencjonujesz — Gemini 3.1 Pro to model do wyboru.

  • Analizowanie dużych baz kodu (50k+ linii), gdzie zrozumienie międzymodułowe ma znaczenie
  • Praca z obrazami — wklej zrzut ekranu błędu UI lub projekt Figma bezpośrednio do czatu
  • Przeglądanie diagramów architektonicznych lub dokumentacji zawierającej elementy wizualne
  • Zadania, gdzie objętość kontekstu ma większe znaczenie niż głębokość rozumowania

Gemini 3.1 Pro obsługuje obrazy natywnie. Przeciągnij zrzut ekranu do czatu Cursor i poproś o odtworzenie układu, zidentyfikowanie błędu wizualnego lub wdrożenie projektu z makiety.

GPT-5.5 (wydany 23 kwietnia 2026) to najnowszy frontierowy model OpenAI, dostępny w selektorze modelu Cursor. Wyróżnia się w agentycznym kodowaniu, obsłudze komputera, pracy z wiedzą i przepływach research. W cenie $5/$30 za MTok z kontekstem 1M konkuruje bezpośrednio z Opus 4.8. Użyj go, gdy chcesz innej “perspektywy” — czasami przełączenie rodzin modeli odblokowuje problem, z którym jedna rodzina ciągle sobie nie radzi. /best-of-n uruchamia zadanie w kilku równoległych worktrees (agentach), abyś mógł porównać diffy i scalić najlepszy — skieruj każdy worktree na inny model (powiedzmy Composer 2.5, Opus 4.8 i GPT-5.5), aby porównać rodziny bezpośrednio.

Gemini 3.1 Pro pozostaje sztandarowym wyborem do pracy multimodalnej. Przeciągnij zrzut ekranu do Agents Window lub Design Mode i poproś o odtworzenie układu, zidentyfikowanie błędu wizualnego lub wdrożenie z makiety.

Gdy pojawi się nowe zadanie, przejdź przez to:

  1. Czy tryb Auto jest włączony i zadanie jest lekkie?

    Tak: Composer 2.5 obsłuży to w sekundach. Pozwól Cursor robić swoje.

  2. Czy to złożone, wieloplikowe zadanie lub decyzja architektoniczna?

    Tak: Użyj Claude Opus 4.8 (podnieś effort do xhigh lub max dla najtrudniejszego rozumowania). Dla absolutnie najtrudniejszych z nich — migracji obejmujących całą bazę kodu, budowania aplikacji od zera — użyj Claude Fable 5, jeśli budżet na to pozwala. Lub spróbuj /best-of-n aby porównać z GPT-5.5 i Composer 2.5.

  3. Czy to proste, dobrze zdefiniowane zadanie z przewidywalnym wyjściem?

    Tak: Użyj Claude Sonnet 4.6 lub zostań przy Composer 2.5 (jeśli szybkość ma znaczenie). Claude Haiku 4.5 jest szybszy i tańszy dla skupionych zadań.

  4. Czy muszę przeanalizować więcej niż 200k tokenów kontekstu?

    Tak: Użyj Opus 4.8, Sonnet 4.6, GPT-5.5 lub Gemini 3.1 Pro — wszystkie wspierają kontekst 1M.

  5. Czy pracuję z obrazami, zrzutami ekranu lub diagramami?

    Tak: Opus 4.8 (wysokorozdzielcze wsparcie 2576px), Gemini 3.1 Pro (natywna multimodalność) lub GPT-5.5 (obsługa komputera).

  6. Czy utknąłem i obecny model ciągle popełnia ten sam błąd?

    Tak: Przełącz rodzinę modeli. /best-of-n to najszybszy sposób na wypróbowanie trzech opcji naraz.

Selektor modelu jest w panelu agenta, tuż obok selektora trybu. Możesz przełączać modele w trakcie rozmowy — nowy model podejmuje istniejący kontekst. W Agents Window Cursor 3.0 możesz uruchamiać różne modele na różnych zakładkach agenta jednocześnie.

Skrót klawiszowy: Naciśnij Cmd+. (macOS) lub Ctrl+. (Windows/Linux), aby szybko przełączać tryby. Dla wyboru modelu kliknij nazwę modelu w panelu agenta.

Tryb Auto w Cursor 3.x domyślnie wybiera Composer 2.5. Gdy żądanie jest na tyle złożone, że Composer 2.5 mógłby mieć problem, Auto automatycznie kieruje do Opus 4.8 lub Sonnet 4.6. Auto używa mieszanego cennika ($1.25 wejście, $6.00 wyjście na 1M tokenów) i obsługuje degradację modeli — jeśli API jednego dostawcy jest wolne, przekierowuje.

Dla początkujących Auto to rozsądny punkt wyjścia. Gdy rozwiniesz wyczucie, który model pasuje do którego zadania, ręczny wybór daje większą kontrolę i często lepsze wyniki.

Styl developeraGłówny modelSzacowany koszt miesięczny
Cały Opus 4.8 / xhighClaude Opus 4.8$100-200
Mieszany (zalecany)Composer 2.5 (Auto) dla rutyny, Opus 4.8 dla złożonych$40-100
Świadomy budżetowoComposer 2.5 + Sonnet 4.6 + Haiku 4.5$25-60
  1. Pozwól Auto wybrać Composer 2.5 domyślnie — to najtańsza opcja szybkiej jakości dla iteracji
  2. Rozpoczynaj rozmowy od nowa — długie rozmowy gromadzą kontekst, który kosztuje przy każdej wiadomości
  3. Używaj referencji @ zamiast wklejania dużych bloków kodu — Cursor obsługuje referencje do plików bardziej efektywnie
  4. Rezerwuj Opus 4.8 xhigh dla naprawdę trudnych problemów — wyższy poziom effort zużywa materialnie więcej tokenów
  5. Włączaj tryb Max tylko gdy potrzeba — nie zostawiaj go włączonego na stałe

Model wydaje się gorszy: Modele nie regresują, ale wydajność API się zmienia. Jeśli model produkuje niższej jakości wyjście niż zwykle, spróbuj tego samego promptu 10 minut później lub przełącz się tymczasowo na inny model.

Przełączanie modeli w trakcie rozmowy traci kontekst: To rzadkie, ale może się zdarzyć przy bardzo długich rozmowach. Jeśli zauważysz pogorszoną jakość po przełączeniu, rozpocznij nowy czat z nowym modelem i @-referencjonuj konkretne pliki.

Tryb Auto ciągle wybiera model, którego nie lubisz: Wyłącz Auto i wybieraj ręcznie. Dwie sekundy potrzebne na wybór modelu są warte spójności.

Użycie się kończy przed końcem miesiąca: Sprawdź swoje użycie w Ustawieniach. Jeśli wypalajesz tokeny Opus 4.8 na zadaniach, które Sonnet 4.6 lub Composer 2.5 mógłby obsłużyć, przesuń swój domyślny model dla rutynowej pracy.

Odpowiedzi Opus 4.8 wydają się płaskie: Opus 4.8 podąża za instrukcjami bardziej dosłownie i ma krótszą domyślną odpowiedź. Jeśli potrzebujesz cieplejszego rozwlekłego stylu Opus 4.8, możesz przypiąć Opus 4.8 jako opcję legacy — ale większość użytkowników adaptuje się szybko przez podniesienie poziomu effort do xhigh.