Krajobraz rozwoju AI zmienia się co tydzień. Pojawiają się nowe modele, zmieniają się ceny, a funkcje lądują we wszystkich trzech narzędziach. Ta strona śledzi aktualizacje, które mają znaczenie, dzięki czemu możesz pozostać na bieżąco bez śledzenia każdego changelogu.
Wyścig o pracę autonomiczną nie zwolnił tempa w czerwcu: Cursor wepchnął Design Mode do przeglądarki i kanw, Claude Code ustalił ultracode jako słowo kluczowe wyzwalające dynamiczne przepływy pracy, Codex wydał parowanie kontrolerów dla bezgłowych flot, a Anthropic wydał Claude Fable 5 — nowy poziom modeli powyżej Opusa.
Claude Fable 5 — nowy poziom modeli powyżej Opusa9 czerwca: model klasy Mythos, który uczyniono bezpiecznym do ogólnego użytku; w Claude Code od v2.1.170 (`/model fable`) i w selektorze modeli Cursora. $10/$50 za MTok — od 9 do 22 czerwca wliczony w plany Pro/Max/Team i Enterprise (rozliczane per stanowisko).
Cursor 3.7 — Canvas Design Mode4–5 czerwca: Design Mode działa teraz w przeglądarce i wewnątrz kanw — wielokrotny wybór elementów, narracja głosowa podczas pracy agenta, interaktywny raport zużycia kontekstu i pełnoekranowe współdzielone kanwy.
Cursor SDK — niestandardowe narzędzia i auto-review4 czerwca: udostępnij własne funkcje lokalnemu agentowi przez `local.customTools`, kieruj bezgłowe wywołania narzędzi przez klasyfikator auto-review, wybierz magazyny JSONL/SQLite i zagnieżdżaj subagenty na dowolną głębokość.
Cursor 3.6 — Auto-review Run Mode29 maja: tryb run działający dłużej przy mniejszej liczbie promptów — wywołania z listy dozwolonych uruchamiają się natychmiast, wywołania sandboxowalne są sandboxowane, reszta trafia do subagenta klasyfikatora. Plus Organizations dla Enterprise (3 czerwca).
Claude Code: `ultracode` to słowo kluczowe workflowv2.1.160 (2 czerwca) zmieniła nazwę wyzwalacza dynamicznych przepływów pracy z `workflow` na `ultracode`, wyróżnianego na fioletowo. v2.1.156–158 dodały auto-load pluginów `.claude/skills` oraz tryb auto na Bedrock/Vertex/Foundry.
Claude Code v2.1.166 — modele zapasowe6 czerwca: skonfiguruj do trzech `fallbackModel`-i próbowanych po kolei, gdy główny jest przeciążony, wzorce glob w regułach deny (`*` blokuje wszystkie narzędzia) oraz utwardzone przesyłanie wiadomości między sesjami.
Codex v0.137 — parowanie kontrolerów, równoległe wyszukiwanie w sieci4 czerwca: klienci `codex remote-control` mogą inicjować parowanie i zarządzać przyznaniami kontrolera; plugin list zyskuje output JSON; samodzielne wyszukiwania w sieci działają równolegle. v0.136 dodała sesje `/archive`.
Nowi oficjalni wydawcy skillsOpenAI, Google Gemini, LangChain, Vercel, Prisma, Convex, Deepgram, Box, Contentful, Contentstack i Base publikują teraz oficjalne agent skills na skills.sh.
Pivotalny miesiąc: Anthropic wydał Claude Opus 4.8 i dynamiczne przepływy pracy, a wszystkie trzy narzędzia dopełniły swoje pierwszorzędne prymitywy pracy autonomicznej w ciągu kilku tygodni od siebie.
Claude Opus 4.8 + dynamiczne przepływy pracy28 maja: nowy flagowy model Anthropic — około czterokrotnie rzadziej pozostawiający nieoznaczone wady w kodzie niż Opus 4.7 — plus dynamiczne przepływy pracy (podgląd badawczy) orkiestrujące od dziesiątek do setek (nawet do 1 000) subagentów ze skryptu, oraz `ultracode`, by Claude sam decydował, kiedy taki uruchomić.
Claude Code: /goal i agent view`/goal` ustawia weryfikowalny stan końcowy, a Claude pracuje turami, aż zostanie spełniony. `claude agents` to nowy dashboard dla każdej sesji w tle. Oba wydane w v2.1.139 11 maja.
Cursor 3.3 — PR review, Build in Parallel7 maja: przeprojektowany PR review (zakładki Reviews/Commits/Changes), quick action Build in Parallel, Split changes into PRs, przypięte quick-action pills. Bugbot przechodzi na rozliczanie usage-based.
Codex v0.129 — `/vim`, `/hooks` browser7 maja: modalna edycja Vim w composerze, przeprojektowany resume/fork picker, theme-aware status line, browser `/hooks` z pre/post-compaction execution.
Cursor w Microsoft Teams11 maja: wzmianka `@Cursor` w dowolnym kanale Teams deleguje pracę do agentów chmurowych. Automatyczny wybór repo i modelu z kontekstu promptu.
Cursor 3.2 — `/multitask`24 kwietnia: async subagenty równolegle zamiast w kolejce. Multi-root workspaces do sesji cross-repo agenta w jednej rozmowie.
Claude Code: 5-godzinne limity podwojoneMaj 2026: 5-godzinne limity użycia podwojone dla Pro / Max / Team / Enterprise, aby wspierać nowe długotrwałe workflow agentów.
Fundamentalna zmiana z forka VS Code na dedykowany workspace do pracy z agentami:
Agents Window
Nowy wielorepozytorium interfejs do równoległego uruchamiania agentów w różnych środowiskach — lokalnie, w worktrees, w chmurze i przez remote SSH. Scentralizowany sidebar pokazuje wszystkich agentów. Przełącz przez Cmd+Shift+P → Agents Window.
Design Mode
Adnotowanie elementów UI bezpośrednio w przeglądarce dla precyzyjnego wizualnego feedbacku. Użyj ⌘+Shift+D do przełączania, Shift+przeciągnij do zaznaczania, ⌘+L do dodania elementu do czatu, ⌥+klik do dodania do inputu.
Agent Tabs i Worktrees
Wyświetlaj wiele czatów obok siebie lub w siatce. Nowe polecenie /worktree tworzy izolowane git worktrees. /best-of-n uruchamia zadania równolegle na wielu modelach i porównuje wyniki.
Pluginy i Enterprise
MCP Apps wspierają ustrukturyzowaną treść dla bogatszych outputów. Wtyczki firm trzecich domyślnie wyłączone dla Enterprise. Nazwy grup katalogowych w logach audytu. Zarządzanie sekretami self-hosted cloud agents.
Pierwszy model ogólnego przeznaczenia z natywną obsługą komputera, teraz domyślny na wszystkich powierzchniach OpenAI:
Natywna Obsługa Komputera
Pierwszy model ogólnego przeznaczenia z najnowocześniejszymi możliwościami obsługi komputera — 75% na OSWorld. Agenty mogą obsługiwać komputery i realizować złożone przepływy pracy między aplikacjami.
Kontekst 1M Tokenów
Obsługuje do 1M tokenów kontekstu. Łączy wiodące w branży możliwości kodowania z GPT-5.3-Codex, jednocześnie ulepszając użycie narzędzi w środowiskach programistycznych.
Najlepsze Benchmarki
57.7% na SWE-bench Pro (kodowanie), 83% na GDPval (praca z wiedzą). Znaczące ulepszenia w zadaniach profesjonalnych obejmujących arkusze kalkulacyjne, prezentacje i dokumenty.
Dostępny Wszędzie
Wdrażany w ChatGPT, Codex i API jako domyślny model. Wariant GPT-5.4 Pro dostępny dla maksymalnej wydajności przy złożonych zadaniach.
Agenty zawsze aktywne, działające według harmonogramów lub reagujące na zdarzenia:
Wyzwalacze zdarzeń: Slack, Linear, GitHub, PagerDuty i webhooks — agenty uruchamiają sandboxowane środowiska chmurowe ze skonfigurowanymi MCP i modelami
Narzędzie pamięci: Agenty uczą się z przeszłych uruchomień i poprawiają się z powtórzeniami w powtarzających się zadaniach
Szablony bezpieczeństwa: Przeglądanie ponad 3000 wewnętrznych PR tygodniowo, wykrywanie ponad 200 podatności dedykowanymi agentami audytu bezpieczeństwa
Pipeline incydentów: Alerty PagerDuty → analiza logów Datadog → podsumowania Slack z proponowanymi poprawkami, w pełni zautomatyzowane
Codex rozszerzył zasięg platformowy i możliwości CLI:
Aplikacja Windows (4 marca): Natywne wsparcie PowerShell i natywny sandbox Windows z tokenami ograniczonymi na poziomie OS i kontrolą uprawnień systemu plików (ACL)
CLI 0.117: Wtyczki jako workflow pierwszej klasy z synchronizacją produktową, sub-agenty z adresowaniem opartym na ścieżkach, konfiguracja tytułu terminala przez /title
CLI 0.118: Sandbox Windows z sieciowaniem proxy-only, logowanie ChatGPT device-code, prompt+stdin dla codex exec, dynamiczne bearer tokeny dla niestandardowych dostawców modeli
Najnowszy model Claude i nowa domyślna rekomendacja dla wszystkich złożonych zadań kodowania:
Najlepsze Wyniki SWE-Bench
Najlepsza wydajność na SWE-Bench Verified wśród wszystkich dostępnych modeli. Doskonałe zachowanie agentowe i utrzymane rozumowanie przez długie zadania.
Ulepszona Wydajność Agentowa
Ulepszone użycie narzędzi w setkach narzędzi. Lepsza odporność na prompt injection. Bardziej niezawodne wykonywanie zadań wieloetapowych.
200K Context Window
200K tokenów kontekstu z limitem 64K outputu. Parametr effort dla regulowanej głębokości rozumowania. Ulepszenia pamięci dla złożonych zadań.
Dostępny Wszędzie
Dostępny w Claude Code, Cursor (przez wybór modelu) i przez API Anthropic. Zalecany z planami subskrypcyjnymi Max/Ultra dla pełnego dostępu.
Claude Fable 5 (9 czerwca): wymaga Claude Code v2.1.170+; wliczony w plany Pro, Max, Team i Enterprise (rozliczane per stanowisko) od 9 do 22 czerwca 2026 — 23 czerwca 2026 zostaje usunięty z tych planów, a dalsze użycie wymaga kredytów użycia
Claude Opus 4.8 (28 maja): Nowy domyślny model Claude Code z wysiłkiem xhigh; dynamiczne przepływy pracy + ultracode wymagają v2.1.154+
GPT-5.5: Nowy domyślny w Codex i ChatGPT, zastępuje GPT-5.4 (uwaga na wyższą cenę API $5/$30)
Cursor Composer 2.5: Nowy domyślny model kodowania w Cursor, zastępuje Composer 2
Cursor 3.0: Nowy interfejs Agents Window zastępuje stary layout — cloud agents usunięte z Editora
Claude Code: /simplify to teraz /code-review (v2.1.147); dodaj --fix, by wprowadzić ustalenia (v2.1.152)
Claude Code v2.1.84+: Polecenia /tag i /vim usunięte (użyj /config → Editor mode zamiast tego)
Claude Code v2.1.160 (2 czerwca): słowo kluczowe wyzwalające dynamiczne przepływy pracy zmieniło się z workflow na ultracode — wpisanie „workflow” już nie uruchamia przebiegu, choć poproszenie własnymi słowami nadal działa
Rotacja kluczy API: Rotuj klucze starsze niż 6 miesięcy jako najlepsza praktyka bezpieczeństwa