Krajobraz rozwoju AI zmienia się co tydzień. Pojawiają się nowe modele, zmieniają się ceny, a funkcje lądują we wszystkich trzech narzędziach. Ta strona śledzi aktualizacje, które mają znaczenie, dzięki czemu możesz pozostać na bieżąco bez śledzenia każdego changelogu.
Fundamentalna zmiana z forka VS Code na dedykowany workspace do pracy z agentami:
Agents Window
Nowy wielorepozytorium interfejs do równoległego uruchamiania agentów w różnych środowiskach — lokalnie, w worktrees, w chmurze i przez remote SSH. Scentralizowany sidebar pokazuje wszystkich agentów. Przełącz przez Cmd+Shift+P → Agents Window.
Design Mode
Adnotowanie elementów UI bezpośrednio w przeglądarce dla precyzyjnego wizualnego feedbacku. Użyj ⌘+Shift+D do przełączania, Shift+przeciągnij do zaznaczania, ⌘+L do dodania elementu do czatu, ⌥+klik do dodania do inputu.
Agent Tabs i Worktrees
Wyświetlaj wiele czatów obok siebie lub w siatce. Nowe polecenie /worktree tworzy izolowane git worktrees. /best-of-n uruchamia zadania równolegle na wielu modelach i porównuje wyniki.
Pluginy i Enterprise
MCP Apps wspierają ustrukturyzowaną treść dla bogatszych outputów. Wtyczki firm trzecich domyślnie wyłączone dla Enterprise. Nazwy grup katalogowych w logach audytu. Zarządzanie sekretami self-hosted cloud agents.
Pierwszy model ogólnego przeznaczenia z natywną obsługą komputera, teraz domyślny na wszystkich powierzchniach OpenAI:
Natywna Obsługa Komputera
Pierwszy model ogólnego przeznaczenia z najnowocześniejszymi możliwościami obsługi komputera — 75% na OSWorld. Agenty mogą obsługiwać komputery i realizować złożone przepływy pracy między aplikacjami.
Kontekst 1M Tokenów
Obsługuje do 1M tokenów kontekstu. Łączy wiodące w branży możliwości kodowania z GPT-5.3-Codex, jednocześnie ulepszając użycie narzędzi w środowiskach programistycznych.
Najlepsze Benchmarki
57.7% na SWE-bench Pro (kodowanie), 83% na GDPval (praca z wiedzą). Znaczące ulepszenia w zadaniach profesjonalnych obejmujących arkusze kalkulacyjne, prezentacje i dokumenty.
Dostępny Wszędzie
Wdrażany w ChatGPT, Codex i API jako domyślny model. Wariant GPT-5.4 Pro dostępny dla maksymalnej wydajności przy złożonych zadaniach.
Agenty zawsze aktywne, działające według harmonogramów lub reagujące na zdarzenia:
Wyzwalacze zdarzeń: Slack, Linear, GitHub, PagerDuty i webhooks — agenty uruchamiają sandboxowane środowiska chmurowe ze skonfigurowanymi MCP i modelami
Narzędzie pamięci: Agenty uczą się z przeszłych uruchomień i poprawiają się z powtórzeniami w powtarzających się zadaniach
Szablony bezpieczeństwa: Przeglądanie ponad 3000 wewnętrznych PR tygodniowo, wykrywanie ponad 200 podatności dedykowanymi agentami audytu bezpieczeństwa
Pipeline incydentów: Alerty PagerDuty → analiza logów Datadog → podsumowania Slack z proponowanymi poprawkami, w pełni zautomatyzowane
Codex rozszerzył zasięg platformowy i możliwości CLI:
Aplikacja Windows (4 marca): Natywne wsparcie PowerShell i natywny sandbox Windows z tokenami ograniczonymi na poziomie OS i kontrolą uprawnień systemu plików (ACL)
CLI 0.117: Wtyczki jako workflow pierwszej klasy z synchronizacją produktową, sub-agenty z adresowaniem opartym na ścieżkach, konfiguracja tytułu terminala przez /title
CLI 0.118: Sandbox Windows z sieciowaniem proxy-only, logowanie ChatGPT device-code, prompt+stdin dla codex exec, dynamiczne bearer tokeny dla niestandardowych dostawców modeli
Najnowszy model Claude i nowa domyślna rekomendacja dla wszystkich złożonych zadań kodowania:
Najlepsze Wyniki SWE-Bench
Najlepsza wydajność na SWE-Bench Verified wśród wszystkich dostępnych modeli. Doskonałe zachowanie agentowe i utrzymane rozumowanie przez długie zadania.
Ulepszona Wydajność Agentowa
Ulepszone użycie narzędzi w setkach narzędzi. Lepsza odporność na prompt injection. Bardziej niezawodne wykonywanie zadań wieloetapowych.
200K Context Window
200K tokenów kontekstu z limitem 64K outputu. Parametr effort dla regulowanej głębokości rozumowania. Ulepszenia pamięci dla złożonych zadań.
Dostępny Wszędzie
Dostępny w Claude Code, Cursor (przez wybór modelu) i przez API Anthropic. Zalecany z planami subskrypcyjnymi Max/Ultra dla pełnego dostępu.