Przejdź do głównej zawartości

Strategia wyboru modelu

Jesteś w trakcie tworzenia funkcji, agent właśnie przedstawił solidny plan implementacji i teraz potrzebujesz, aby napisał faktyczny kod. Czy zostajesz przy domyślnym modelu, czy przełączasz? Słyszałeś, że Opus 4.7 jest “najlepszy”, ale jest też najdroższy. Sonnet 4.6 jest tańszy, ale nie jesteś pewien, czy poradzi sobie ze złożonością. Gemini 3 Pro ma ogromne okno kontekstowe, ale nigdy go nie próbowałeś. Composer 2 jest domyślny w trybie Auto w Cursor 3.x. Tymczasem wybór modelu pokazuje dziewięć opcji i zero wskazówek. Ten artykuł daje ci framework decyzyjny, dzięki któremu wybór modelu staje się dwusekundową decyzją, a nie pięciominutową debatą.

  • Jasną rekomendację domyślnego modelu (i dlaczego jest domyślny)
  • Drzewo decyzyjne wskazujące, kiedy przełączać modele na podstawie typu zadania, nie domysłów
  • Szacunki kosztów na zadanie, dzięki czemu możesz zabudżetować miesięczne użycie
  • Praktyczne dostosowania promptów dla mocnych stron każdego modelu
  • Skrót klawiszowy do natychmiastowego przełączania modeli bez przerywania przepływu pracy
ModelKoszt wejścia / wyjściaDomyślny kontekstMaks kontekstNajlepszy dla
Composer 2$1.25 / $10 na 1M tokenów200kDomyślny w Auto w Cursor 3.x; iteracja krytyczna dla szybkości
Claude Opus 4.7$5 / $25 na 1M tokenów1M1MTop-tier agentyczne kodowanie, złożone rozumowanie, poziom effort xhigh
Claude Sonnet 4.6$3 / $15 na 1M tokenów1M1MŚwiadoma budżetowo codzienna praca, extended thinking
Claude Haiku 4.5$1 / $5 na 1M tokenów200k200kNajszybszy Claude, jakość blisko granicy dla skupionych zadań
Gemini 3 Pro$2 / $12 na 1M tokenów200k1MEkstremalny kontekst, multimodalność (analiza obrazów/diagramów)
GPT-5.5$5 / $30 na 1M tokenów1M1MNajnowszy frontier OpenAI — silne agentyczne kodowanie, obsługa komputera, research
Grok Code$0.20 / $1.50 na 1M tokenów256kBardzo przyjazne budżetowo proste zadania

Od Cursor 3.0 (2 kwietnia 2026), Composer 2 jest domyślnym modelem w trybie Auto. To własny model kodowania Anysphere, trenowany na bazie Kimi K2.5 z ciągłym pretreningiem i 4x skalowanym runem RL na wierzchu. CursorBench 61.3 (w górę z 44.2 dla Composer 1.5), 200+ tokenów/s na niestandardowych kernelach GPU i typowe tury agenta pod 30 sekund.

  • Szybka iteracja i poprawki stylu, gdzie i tak będziesz dopracowywać 5-10 razy
  • Dobrze zakresione refaktory w jednym pliku lub module
  • “Szybkie pytanie” inline edit podczas pracy nad większym planem
  • Uruchamianie wielu agentów równolegle w Agents Window — szybkość Composer 2 utrzymuje wszystkie panele responsywne
  • Zadanie dotyka cross-module architektury lub kodu wrażliwego na bezpieczeństwo — Opus 4.7
  • Potrzebujesz rozumowania po bazie kodu 500k linii — Gemini 3 Pro lub Opus 4.7 w trybie 1M
  • Bieżący model ciągle popełnia ten sam błąd — świeży model często przełamuje pętlę

Claude Opus 4.7 to flagowy dostępny model Anthropic (wydany 16 kwietnia 2026). Ma najwyższe wyniki SWE-Bench, najlepszą wydajność agentyczną (niezawodnie obsługuje wieloetapowe użycie narzędzi) i jest pierwszym modelem Claude z wysokorozdzielczym wsparciem obrazów (2576px / 3.75MP) dla analizy zrzutów ekranu/artefaktów. W Cursor jest dostępny na pickerze modelu oraz w trybach Auto High / Max.

  • Złożony refaktoring wieloplikowy
  • Projektowanie architektury i planowanie systemu
  • Audyty bezpieczeństwa i przeglądy kodu
  • Generowanie testów dla niuansowanej logiki biznesowej
  • Workflow obsługi komputera / zrzutów ekranu (rozdzielczość 2576px z mapowaniem pikseli 1:1)
  • Każde zadanie, gdzie zrobienie tego dobrze za pierwszym razem oszczędza więcej pieniędzy niż kosztuje model

Opus 4.7 wprowadza poziom effort xhigh jako nowe najwyższe ustawienie. Podąża również bardziej dosłownie za instrukcjami — jeśli twoje prompty dla Opus 4.6 miały rusztowania typu “dokładnie sprawdź układ slajdu przed zwróceniem”, spróbuj je usunąć i re-baseline. Długość odpowiedzi kalibruje się teraz do postrzeganej złożoności zadania, więc spodziewaj się zwięźlejszego wyjścia dla prostych pytań.

Sonnet 4.6 kosztuje 40% mniej niż Opus 4.7 na tokenach wejściowych i 40% mniej na tokenach wyjściowych, z pełnym oknem kontekstu 1M. Dla prostych zadań — pisania funkcji narzędziowej, dodawania pola do formularza, generowania standardowych endpointów CRUD — różnica w jakości jest minimalna.

  • Rutynowe kodowanie, gdzie wzorzec jest dobrze ugruntowany
  • Zadania, gdzie i tak będziesz przeglądać i iterować
  • Gdy twój miesięczny budżet użycia się wyczerpuje
  • Długie rozmowy, gdzie potrzebujesz 1M kontekstu, ale chcesz zarządzać kosztami

Jeśli możesz opisać zadanie w jednym zdaniu, a oczekiwane wyjście jest przewidywalne, Sonnet 4.6 sobie poradzi. Jeśli zadanie wymaga ważenia kompromisów lub zrozumienia subtelnych implikacji architektonicznych, zostań przy Opus 4.7.

Claude Haiku 4.5: Szybki, tani, blisko granicy jakości

Dział zatytułowany „Claude Haiku 4.5: Szybki, tani, blisko granicy jakości”

Haiku 4.5 (claude-haiku-4-5) to najszybszy Claude w cenie $1/$5 za MTok z kontekstem 200k. Jest zauważalnie lepszy niż cokolwiek w swojej półce dla skupionych zadań: krótkich refaktorów, wyjaśnień kodu, feedbacku w stylu lintera. W Agents Window wrzuć go w jeden panel jako “szybkiego reviewera” który inspektuje wyjście Opus 4.7 podczas gdy Opus dalej iteruje.

Główną cechą Gemini 3 Pro jest jego okno kontekstowe 1M tokenów (dostępne przez tryb Max). Gdy potrzebujesz, aby AI zrozumiało całą twoją bazę kodu na raz — nie tylko pliki, które ręcznie referencjonujesz — Gemini 3 Pro to model do wyboru.

  • Analizowanie dużych baz kodu (50k+ linii), gdzie zrozumienie międzymodułowe ma znaczenie
  • Praca z obrazami — wklej zrzut ekranu błędu UI lub projekt Figma bezpośrednio do czatu
  • Przeglądanie diagramów architektonicznych lub dokumentacji zawierającej elementy wizualne
  • Zadania, gdzie objętość kontekstu ma większe znaczenie niż głębokość rozumowania

Gemini 3 Pro obsługuje obrazy natywnie. Przeciągnij zrzut ekranu do Agents Window lub Design Mode i poproś o odtworzenie układu, zidentyfikowanie błędu wizualnego lub wdrożenie projektu z makiety.

GPT-5.5 (wydany 23 kwietnia 2026) to najnowszy frontierowy model OpenAI, dostępny w selektorze modelu Cursor. Wyróżnia się w agentycznym kodowaniu, obsłudze komputera, pracy z wiedzą i przepływach research. W cenie $5/$30 za MTok z kontekstem 1M konkuruje bezpośrednio z Opus 4.7. Użyj go, gdy chcesz innej “perspektywy” — czasami przełączenie rodzin modeli odblokowuje problem, z którym jedna rodzina sobie nie radzi. /best-of-n (nowa w Cursor 3.0) uruchamia to samo zadanie w Composer 2, Opus 4.7 i GPT-5.5 równolegle w worktrees i porównuje wyniki.

Gdy pojawi się nowe zadanie, przejdź przez to:

  1. Czy tryb Auto jest włączony i zadanie jest lekkie?

    Tak: Composer 2 obsłuży to w sekundach. Pozwól Cursor robić swoje.

  2. Czy to złożone, wieloplikowe zadanie lub decyzja architektoniczna?

    Tak: Użyj Claude Opus 4.7 (xhigh effort dla najgłębszego rozumowania). Lub spróbuj /best-of-n aby porównać z GPT-5.5 i Composer 2.

  3. Czy to proste, dobrze zdefiniowane zadanie z przewidywalnym wyjściem?

    Tak: Użyj Claude Sonnet 4.6 lub zostań przy Composer 2 (jeśli szybkość ma znaczenie). Claude Haiku 4.5 jest szybszy i tańszy dla skupionych zadań.

  4. Czy muszę przeanalizować więcej niż 200k tokenów kontekstu?

    Tak: Użyj Opus 4.7, Sonnet 4.6, GPT-5.5 lub Gemini 3 Pro — wszystkie wspierają kontekst 1M.

  5. Czy pracuję z obrazami, zrzutami ekranu lub diagramami?

    Tak: Opus 4.7 (wysokorozdzielcze wsparcie 2576px), Gemini 3 Pro (natywna multimodalność) lub GPT-5.5 (obsługa komputera).

  6. Czy utknąłem i obecny model ciągle popełnia ten sam błąd?

    Tak: Przełącz rodzinę modeli. /best-of-n to najszybszy sposób na wypróbowanie trzech opcji naraz.

Selektor modelu jest w panelu agenta, tuż obok selektora trybu. Możesz przełączać modele w trakcie rozmowy — nowy model podejmuje istniejący kontekst. W Agents Window Cursor 3.0 możesz uruchamiać różne modele na różnych zakładkach agenta jednocześnie.

Skrót klawiszowy: Naciśnij Cmd+. (macOS) lub Ctrl+. (Windows/Linux), aby szybko przełączać tryby. Dla wyboru modelu kliknij nazwę modelu w panelu agenta.

Tryb Auto w Cursor 3.x domyślnie wybiera Composer 2. Gdy żądanie jest na tyle złożone, że Composer 2 mógłby mieć problem, Auto automatycznie kieruje do Opus 4.7 lub Sonnet 4.6. Auto używa mieszanego cennika ($1.25 wejście, $6.00 wyjście na 1M tokenów) i obsługuje degradację modeli — jeśli API jednego dostawcy jest wolne, przekierowuje.

Dla początkujących Auto to rozsądny punkt wyjścia. Gdy rozwiniesz wyczucie, który model pasuje do którego zadania, ręczny wybór daje większą kontrolę i często lepsze wyniki.

Styl developeraGłówny modelSzacowany koszt miesięczny
Cały Opus 4.7 / xhighClaude Opus 4.7$100-200
Mieszany (zalecany)Composer 2 (Auto) dla rutyny, Opus 4.7 dla złożonych$40-100
Świadomy budżetowoComposer 2 + Sonnet 4.6 + Haiku 4.5$25-60
  1. Pozwól Auto wybrać Composer 2 domyślnie — to najtańsza opcja szybkiej jakości dla iteracji
  2. Rozpoczynaj rozmowy od nowa — długie rozmowy gromadzą kontekst, który kosztuje przy każdej wiadomości
  3. Używaj referencji @ zamiast wklejania dużych bloków kodu — Cursor obsługuje referencje do plików bardziej efektywnie
  4. Rezerwuj Opus 4.7 xhigh dla naprawdę trudnych problemów — wyższy poziom effort zużywa materialnie więcej tokenów
  5. Włączaj tryb Max tylko gdy potrzeba — nie zostawiaj go włączonego na stałe

Model wydaje się gorszy: Modele nie regresują, ale wydajność API się zmienia. Jeśli model produkuje niższej jakości wyjście niż zwykle, spróbuj tego samego promptu 10 minut później lub przełącz się tymczasowo na inny model.

Przełączanie modeli w trakcie rozmowy traci kontekst: To rzadkie, ale może się zdarzyć przy bardzo długich rozmowach. Jeśli zauważysz pogorszoną jakość po przełączeniu, rozpocznij nowy czat z nowym modelem i @-referencjonuj konkretne pliki.

Tryb Auto ciągle wybiera model, którego nie lubisz: Wyłącz Auto i wybieraj ręcznie. Dwie sekundy potrzebne na wybór modelu są warte spójności.

Użycie się kończy przed końcem miesiąca: Sprawdź swoje użycie w Ustawieniach. Jeśli wypalajesz tokeny Opus 4.7 na zadaniach, które Sonnet 4.6 lub Composer 2 mógłby obsłużyć, przesuń swój domyślny model dla rutynowej pracy.

Odpowiedzi Opus 4.7 wydają się płaskie: Opus 4.7 podąża za instrukcjami bardziej dosłownie i ma krótszą domyślną odpowiedź. Jeśli potrzebujesz cieplejszego rozwlekłego stylu Opus 4.6, możesz przypiąć Opus 4.6 jako opcję legacy — ale większość użytkowników adaptuje się szybko przez podniesienie poziomu effort do xhigh.