Przejdź do głównej zawartości

Strategia wyboru modelu

Jesteś w trakcie tworzenia funkcji, agent właśnie przedstawił solidny plan implementacji i teraz potrzebujesz, aby napisał faktyczny kod. Czy zostajesz przy domyślnym modelu, czy przełączasz? Słyszałeś, że Opus 4.6 jest “najlepszy”, ale jest też najdroższy. Sonnet 4.5 jest tańszy, ale nie jesteś pewien, czy poradzi sobie ze złożonością. Gemini 3 Pro ma ogromne okno kontekstowe, ale nigdy go nie próbowałeś. Tymczasem wybór modelu w Cursor pokazuje osiem opcji i zero wskazówek. Ten artykuł daje ci framework decyzyjny, dzięki któremu wybór modelu staje się dwusekundową decyzją, a nie pięciominutową debatą.

  • Jasną rekomendację domyślnego modelu (i dlaczego jest domyślny)
  • Drzewo decyzyjne wskazujące, kiedy przełączać modele na podstawie typu zadania, nie domysłów
  • Szacunki kosztów na zadanie, dzięki czemu możesz zabudżetować miesięczne użycie
  • Praktyczne dostosowania promptów dla mocnych stron każdego modelu
  • Skrót klawiszowy do natychmiastowego przełączania modeli bez przerywania przepływu pracy
ModelKoszt wejścia / wyjściaDomyślny kontekstMaks kontekstNajlepszy dla
Claude Opus 4.6$5 / $25 na 1M tokenów200k1MDomyślnie dla wszystkiego — najlepsza wydajność agentyczna
Claude Sonnet 4.5$3 / $15 na 1M tokenów200k1MŚwiadoma budżetowo codzienna praca, duże potrzeby kontekstowe
Gemini 3 Pro$2 / $12 na 1M tokenów200k1MEkstremalny kontekst, multimodalność (analiza obrazów/diagramów)
GPT-5.2$1.75 / $14 na 1M tokenów272kSilna alternatywa, dobry do pracy nad UI
Composer 1$1.25 / $10 na 1M tokenów200kKrytyczna szybkość iteracji w Cursor
Grok Code$0.20 / $1.50 na 1M tokenów256kBardzo przyjazne budżetowo proste zadania

Claude Opus 4.6 to zalecany domyślny model dla wszystkich prac kodowania w Cursor. Ma najwyższe wyniki SWE-Bench, najlepszą wydajność agentyczną (niezawodnie obsługuje wieloetapowe użycie narzędzi) i produkuje najbardziej architektonicznie poprawny kod.

  • Każde zadanie, dopóki nie będziesz mieć konkretnego powodu do przełączenia
  • Złożony refaktoring wieloplikowy
  • Projektowanie architektury i planowanie systemu
  • Audyty bezpieczeństwa i przeglądy kodu
  • Generowanie testów dla niuansowanej logiki biznesowej
  • Każde zadanie, gdzie zrobienie tego dobrze za pierwszym razem oszczędza więcej pieniędzy niż kosztuje model

Opus 4.6 korzysta z celów wysokiego poziomu z ograniczeniami, zamiast z mikrozarządzania krok po kroku. Pozwól mu rozumować.

Sonnet 4.5 kosztuje 40% mniej niż Opus 4.6 na tokenach wejściowych i 40% mniej na tokenach wyjściowych. Dla prostych zadań — pisania funkcji narzędziowej, dodawania pola do formularza, generowania standardowych endpointów CRUD — różnica w jakości jest minimalna.

  • Rutynowe kodowanie, gdzie wzorzec jest dobrze ugruntowany
  • Zadania, gdzie i tak będziesz przeglądać i iterować
  • Gdy twój miesięczny budżet użycia się wyczerpuje
  • Długie rozmowy, gdzie potrzebujesz trybu Max (1M kontekstu), ale chcesz zarządzać kosztami

Jeśli możesz opisać zadanie w jednym zdaniu, a oczekiwane wyjście jest przewidywalne, Sonnet 4.5 sobie poradzi. Jeśli zadanie wymaga ważenia kompromisów lub zrozumienia subtelnych implikacji architektonicznych, zostań przy Opus 4.6.

Główną cechą Gemini 3 Pro jest jego okno kontekstowe 1M tokenów (dostępne przez tryb Max). Gdy potrzebujesz, aby AI zrozumiało całą twoją bazę kodu na raz — nie tylko pliki, które ręcznie referencjonujesz — Gemini 3 Pro to model do wyboru.

  • Analizowanie dużych baz kodu (50k+ linii), gdzie zrozumienie międzymodułowe ma znaczenie
  • Praca z obrazami — wklej zrzut ekranu błędu UI lub projekt Figma bezpośrednio do czatu
  • Przeglądanie diagramów architektonicznych lub dokumentacji zawierającej elementy wizualne
  • Zadania, gdzie objętość kontekstu ma większe znaczenie niż głębokość rozumowania

Gemini 3 Pro obsługuje obrazy natywnie. Przeciągnij zrzut ekranu do czatu Cursor i poproś o odtworzenie układu, zidentyfikowanie błędu wizualnego lub wdrożenie projektu z makiety.

GPT-5.2 to silny model ogólnego przeznaczenia dostępny natywnie w Cursor. Ma domyślne okno kontekstowe 272k i dobrze radzi sobie z pracą frontendową, generowaniem UI i naprawianiem błędów. Użyj go, gdy chcesz innej “perspektywy” — czasami przełączenie modeli odblokowuje problem, z którym jeden model ciągle sobie nie radzi.

Composer 1 to własny model Cursor, zoptymalizowany pod kątem szybkości w edytorze. Kończy większość tur w mniej niż 30 sekund i kosztuje znacznie mniej niż modele graniczne. Użyj go do szybkiej iteracji: szybkie zmiany stylu, małe refaktory i zadania, gdzie i tak będziesz iterować pięć razy.

Gdy pojawi się nowe zadanie, przejdź przez to:

  1. Czy to złożone, wieloplikowe zadanie lub decyzja architektoniczna?

    Tak: Użyj Claude Opus 4.6. Jakość rozumowania sama się spłaca.

  2. Czy to proste, dobrze zdefiniowane zadanie z przewidywalnym wyjściem?

    Tak: Użyj Claude Sonnet 4.5 lub Composer 1 (jeśli szybkość ma znaczenie).

  3. Czy muszę przeanalizować więcej niż 200k tokenów kontekstu?

    Tak: Użyj Gemini 3 Pro z trybem Max lub modeli Claude w trybie Max.

  4. Czy pracuję z obrazami, zrzutami ekranu lub diagramami?

    Tak: Użyj Gemini 3 Pro dla jego natywnego wsparcia multimodalnego.

  5. Czy utknąłem i obecny model ciągle popełnia ten sam błąd?

    Tak: Przełącz się na inny model. GPT-5.2 lub inny model Claude często podchodzi do problemu inaczej.

Selektor modelu jest w panelu agenta, tuż obok selektora trybu. Możesz przełączać modele w trakcie rozmowy — nowy model podejmuje istniejący kontekst.

Skrót klawiszowy: Naciśnij Cmd+. (macOS) lub Ctrl+. (Windows/Linux), aby szybko przełączać tryby. Dla wyboru modelu kliknij nazwę modelu w panelu agenta.

Cursor oferuje ustawienie Auto, które automatycznie wybiera najlepszy model dla każdego żądania na podstawie złożoności zadania i bieżącej dostępności API. Auto używa mieszanego cennika ($1.25 wejście, $6.00 wyjście na 1M tokenów) i automatycznie obsługuje degradację modelu — jeśli API jednego modelu jest wolne, kieruje do innego.

Dla początkujących Auto to rozsądny punkt wyjścia. Gdy rozwiniesz wyczucie, który model pasuje do którego zadania, ręczny wybór daje większą kontrolę i często lepsze wyniki.

Styl developeraGłówny modelSzacowany koszt miesięczny
Cały Opus 4.6Claude Opus 4.6$100-200
Mieszany (zalecany)Opus dla złożonych, Sonnet/Composer dla rutynowych$60-120
Świadomy budżetowoSonnet 4.5 + Composer 1$30-60
  1. Rozpoczynaj rozmowy od nowa — długie rozmowy gromadzą kontekst, który kosztuje przy każdej wiadomości
  2. Używaj referencji @ zamiast wklejania dużych bloków kodu — Cursor obsługuje referencje do plików bardziej efektywnie
  3. Przełącz się na Composer 1 do iteracji — jeśli zamierzasz wysłać 10 wiadomości dopracowując CSS, tani model jest w porządku
  4. Włączaj tryb Max tylko gdy potrzeba — nie zostawiaj go włączonego na stałe

Model wydaje się gorszy: Modele nie regresują, ale wydajność API się zmienia. Jeśli model produkuje niższej jakości wyjście niż zwykle, spróbuj tego samego promptu 10 minut później lub przełącz się tymczasowo na inny model.

Przełączanie modeli w trakcie rozmowy traci kontekst: To rzadkie, ale może się zdarzyć przy bardzo długich rozmowach. Jeśli zauważysz pogorszoną jakość po przełączeniu, rozpocznij nowy czat z nowym modelem i referencjonuj konkretne pliki.

Tryb Auto ciągle wybiera model, którego nie lubisz: Wyłącz Auto i wybieraj ręcznie. Dwie sekundy potrzebne na wybór modelu są warte spójności.

Użycie się kończy przed końcem miesiąca: Sprawdź swoje użycie w Ustawieniach. Jeśli wypalajesz tokeny Opus 4.6 na zadaniach, które Sonnet 4.5 mógłby obsłużyć, przesuń swój domyślny model dla rutynowej pracy.