Przejdź do głównej zawartości

Najnowsze Aktualizacje

Krajobraz rozwoju AI zmienia się co tydzień. Pojawiają się nowe modele, zmieniają się ceny, a funkcje lądują we wszystkich trzech narzędziach. Ta strona śledzi aktualizacje, które mają znaczenie, dzięki czemu możesz pozostać na bieżąco bez śledzenia każdego changelogu.

Fundamentalna zmiana z forka VS Code na dedykowany workspace do pracy z agentami:

Agents Window

Nowy wielorepozytorium interfejs do równoległego uruchamiania agentów w różnych środowiskach — lokalnie, w worktrees, w chmurze i przez remote SSH. Scentralizowany sidebar pokazuje wszystkich agentów. Przełącz przez Cmd+Shift+P → Agents Window.

Design Mode

Adnotowanie elementów UI bezpośrednio w przeglądarce dla precyzyjnego wizualnego feedbacku. Użyj ⌘+Shift+D do przełączania, Shift+przeciągnij do zaznaczania, ⌘+L do dodania elementu do czatu, ⌥+klik do dodania do inputu.

Agent Tabs i Worktrees

Wyświetlaj wiele czatów obok siebie lub w siatce. Nowe polecenie /worktree tworzy izolowane git worktrees. /best-of-n uruchamia zadania równolegle na wielu modelach i porównuje wyniki.

Pluginy i Enterprise

MCP Apps wspierają ustrukturyzowaną treść dla bogatszych outputów. Wtyczki firm trzecich domyślnie wyłączone dla Enterprise. Nazwy grup katalogowych w logach audytu. Zarządzanie sekretami self-hosted cloud agents.

Duże dodatki funkcjonalności w wielu szybkich wydaniach:

  • Narzędzie PowerShell (Windows): Natywny rozwój na Windows bez WSL — opt-in preview dla PowerShell jako pełnoprawnego narzędzia
  • Kreator konfiguracji Bedrock: Interaktywna prowadzona konfiguracja z ekranu logowania — uwierzytelnianie AWS, konfiguracja regionu, weryfikacja poświadczeń i przypinanie modelu
  • Polecenie /powerup: Interaktywne lekcje z animowanymi demami uczącymi funkcji Claude Code
  • Podział kosztów per model: /cost pokazuje podział kosztów per model i cache-hit dla użytkowników subskrypcji
  • Odroczone uprawnienia hooków: Decyzja "defer" w hookach PreToolUse dla sesji headless, plus hook PermissionDenied po odmowach auto mode
  • Narzędzie Write 60% szybsze: Ulepszone obliczanie diff na dużych plikach
  • Nazwane subagenty: Subagenty pojawiają się w typeahead @ z deklarowalnym frontmatter initialPrompt
  • Warunkowe hooki: Pole if dla hooków używające składni reguł uprawnień
  • Przeszukiwanie transkryptów: Naciśnij / w trybie Ctrl+O, n/N do nawigacji między wynikami

Ulepszenia aplikacji i CLI Codex z wydań kwietniowych:

  • Wyszukiwanie wątków: Przeszukuj przeszłe wątki ze skrótem w sidebarze i skrótami klawiaturowymi
  • Motywy: Wybierz bazowy motyw i dostosuj kolory akcentu, tła, pierwszego planu oraz czcionki
  • Przebudowane automatyzacje: Wybierz wykonywanie lokalne lub worktree, niestandardowe poziomy rozumowania i szablony wielokrotnego użytku
  • Sandbox Windows: Sieciowanie proxy-only z regułami egress na poziomie OS dla aplikacji Windows
  • Wtyczki pierwszej klasy: Synchronizuj wtyczki na starcie, przeglądaj w /plugins, jaśniejsza obsługa instalacji/usuwania
  • Sub-agenty: Adresowanie oparte na ścieżkach (/root/agent_a) ze strukturalnym przesyłaniem wiadomości między agentami

Pierwszy model ogólnego przeznaczenia z natywną obsługą komputera, teraz domyślny na wszystkich powierzchniach OpenAI:

Natywna Obsługa Komputera

Pierwszy model ogólnego przeznaczenia z najnowocześniejszymi możliwościami obsługi komputera — 75% na OSWorld. Agenty mogą obsługiwać komputery i realizować złożone przepływy pracy między aplikacjami.

Kontekst 1M Tokenów

Obsługuje do 1M tokenów kontekstu. Łączy wiodące w branży możliwości kodowania z GPT-5.3-Codex, jednocześnie ulepszając użycie narzędzi w środowiskach programistycznych.

Najlepsze Benchmarki

57.7% na SWE-bench Pro (kodowanie), 83% na GDPval (praca z wiedzą). Znaczące ulepszenia w zadaniach profesjonalnych obejmujących arkusze kalkulacyjne, prezentacje i dokumenty.

Dostępny Wszędzie

Wdrażany w ChatGPT, Codex i API jako domyślny model. Wariant GPT-5.4 Pro dostępny dla maksymalnej wydajności przy złożonych zadaniach.

OpenAI uruchomił Codex Security — agenta bezpieczeństwa aplikacji dostępnego dla klientów Enterprise, Business i edukacyjnych:

  • Modelowanie zagrożeń: Buduje specyficzne dla projektu modele zagrożeń ujmujące strukturę systemu, granice zaufania i punkty ekspozycji
  • Głębokie wykrywanie podatności: Identyfikuje złożone podatności, które narzędzia analizy statycznej pomijają, kategoryzowane według realnego wpływu
  • Sprawdzony w skali: Przeskanowano ponad 1.2M commitów w beta, znaleziono 792 krytyczne ustalenia, w tym przepełnienia sterty GnuTLS i obejścia 2FA
  • Edytowalne modele zagrożeń: Zespoły mogą edytować wygenerowane modele zagrożeń, aby agent był zgodny z ich wymaganiami bezpieczeństwa

Agenty zawsze aktywne, działające według harmonogramów lub reagujące na zdarzenia:

  • Wyzwalacze zdarzeń: Slack, Linear, GitHub, PagerDuty i webhooks — agenty uruchamiają sandboxowane środowiska chmurowe ze skonfigurowanymi MCP i modelami
  • Narzędzie pamięci: Agenty uczą się z przeszłych uruchomień i poprawiają się z powtórzeniami w powtarzających się zadaniach
  • Szablony bezpieczeństwa: Przeglądanie ponad 3000 wewnętrznych PR tygodniowo, wykrywanie ponad 200 podatności dedykowanymi agentami audytu bezpieczeństwa
  • Pipeline incydentów: Alerty PagerDuty → analiza logów Datadog → podsumowania Slack z proponowanymi poprawkami, w pełni zautomatyzowane

Frontierowy model kodowania Cursor zbudowany wewnętrznie:

  • Architektura: Mixture-of-Experts (MoE) zbudowany na Kimi K2.5, wzbogacony o własne kontynuowane pretrenowanie i reinforcement learning Cursor
  • Benchmarki: 61.3 CursorBench, 61.7 Terminal-Bench 2.0, 73.7 SWE-bench Multilingual — przewyższa Claude Opus 4.6 na Terminal-Bench
  • Ceny: $0.50/$2.50 za 1M tokenów (standardowy), $1.50/$7.50 (szybki wariant z tą samą inteligencją)
  • 200K kontekstu: Zoptymalizowany do edycji wielu plików, generowania kodu, refaktoryzacji i długich łańcuchów zadań przez setki akcji

Funkcja enterprise do uruchamiania cloud agents w infrastrukturze klienta:

  • Baza kodu, wykonywanie narzędzi, wyniki budowania i sekrety nigdy nie opuszczają sieci klienta
  • Te same możliwości co Cursor-hosted agents: izolowane VM, pełne środowiska deweloperskie, multi-model harnesses, wtyczki
  • Do 10 workerów na użytkownika, 50 na zespół
  • Używany przez Brex, Money Forward i Notion

Codex rozszerzył zasięg platformowy i możliwości CLI:

  • Aplikacja Windows (4 marca): Natywne wsparcie PowerShell i natywny sandbox Windows z tokenami ograniczonymi na poziomie OS i kontrolą uprawnień systemu plików (ACL)
  • CLI 0.117: Wtyczki jako workflow pierwszej klasy z synchronizacją produktową, sub-agenty z adresowaniem opartym na ścieżkach, konfiguracja tytułu terminala przez /title
  • CLI 0.118: Sandbox Windows z sieciowaniem proxy-only, logowanie ChatGPT device-code, prompt+stdin dla codex exec, dynamiczne bearer tokeny dla niestandardowych dostawców modeli

Ciągły strumień ulepszeń i utwardzania platformy:

  • Flaga --bare: Skryptowy tryb -p pomijający hooki, LSP i wtyczki dla czystej automatyzacji
  • --channels: Relay uprawnień dla przekierowania telefonicznego do doświadczeń mobilnych typu Cursor
  • Managed-settings drop-in: Katalog managed-settings.d/ dla kompozycji konfiguracji enterprise
  • Przeszukiwanie transkryptów: Naciśnij / w trybie Ctrl+O, n/N do nawigacji między dopasowaniami
  • Ctrl+X Ctrl+E: Otwórz zewnętrzny edytor do kompozycji promptów
  • Wklejane obrazy: Wstawiają chip [Image #N] do referencji w promptach

Najnowszy model Claude i nowa domyślna rekomendacja dla wszystkich złożonych zadań kodowania:

Najlepsze Wyniki SWE-Bench

Najlepsza wydajność na SWE-Bench Verified wśród wszystkich dostępnych modeli. Doskonałe zachowanie agentowe i utrzymane rozumowanie przez długie zadania.

Ulepszona Wydajność Agentowa

Ulepszone użycie narzędzi w setkach narzędzi. Lepsza odporność na prompt injection. Bardziej niezawodne wykonywanie zadań wieloetapowych.

200K Context Window

200K tokenów kontekstu z limitem 64K outputu. Parametr effort dla regulowanej głębokości rozumowania. Ulepszenia pamięci dla złożonych zadań.

Dostępny Wszędzie

Dostępny w Claude Code, Cursor (przez wybór modelu) i przez API Anthropic. Zalecany z planami subskrypcyjnymi Max/Ultra dla pełnego dostępu.

Najnowsze ulepszenia Claude Code:

  • Zakresy stron PDF: Określ dokładne strony przy czytaniu PDF (np. @file.pdf:1-5)
  • Metryki tokenów: Nowe polecenie /usage ze szczegółowym podziałem tokenów wejścia/wyjścia
  • Ulepszenia OAuth: Lepsza obsługa błędów i zarządzanie refresh token
  • Sprawdzanie zdrowia MCP: Automatyczny restart dla niedziałających serwerów MCP

Główna aktualizacja doświadczenia agenta:

  • Subagents: Wyspecjalizowane subagenty do testowania, dokumentacji, refaktoryzacji. Definiuj niestandardowe subagenty w .cursor/agents/
  • Skills (SKILL.md): Definicje umiejętności wielokrotnego użytku z manifestami SKILL.md. Dziel się między projektami i zespołami
  • 40x szybsze hooks: Niemal natychmiastowe wykonywanie hook
  • Cursor Blame: AI-powered git blame z kontekstem
  • Wyjaśnienia agenta: Agenty zadają pytania wyjaśniające przed złożonymi zadaniami
  • Tryby CLI Plan/Ask: cursor --plan i cursor --ask dla użycia offline
  • Przekazywanie do cloud: Użyj sufiksu &, aby przekazać zadania do cloud agents

Najnowszy model zasilający wszystkie powierzchnie Codex:

  • Ulepszona wydajność kodowania we wszystkich językach
  • Lepsze radzenie sobie z długim kontekstem z automatycznym kompaktowaniem
  • Ulepszone użycie narzędzi dla integracji MCP
  • Dostępny w Codex App, CLI, rozszerzeniach IDE i Cloud
  • Wsparcie SKILL.md: Definiuj niestandardowe umiejętności w .claude/skills/
  • Rozgałęzianie sesji: Twórz gałęzie z dowolnego punktu rozmowy
  • Flaga --from-pr: Rozpocznij z kontekstem z GitHub pull request
  • Historia klawiszy strzałek: Nawiguj historię promptów klawiszami góra/dół
  • Przekazywanie do cloud: Użyj sufiksu &, aby przekazać zadania do cloud agents
  • Dostosowywanie layoutu: Przeciągaj i upuszczaj układy paneli
  • Wsparcie wielu monitorów: Synchronizacja layoutu między wyświetlaczami
  • 25% redukcja pamięci: Lepsze radzenie sobie z dużymi plikami
  • Ulepszone odzyskiwanie po awarii: Zwiększona stabilność dla długich sesji

Automatyzacje Codex przeszły z beta do GA:

  • Przypisywanie GitHub issue do @codex
  • Integracja Slack dla kanałów zespołowych
  • Automatyzacja ticketów Linear
  • Zaplanowane zadania oparte na cron
  • Wszystkie automatyzacje działają jako sandboxed cloud agents

Tryb Debug

Instrumentacja logów runtime dla automatycznej analizy przyczyn źródłowych. Działa w wielu stackach technologicznych i językach.

Visual Style Editor

Projektowanie wizualne w czasie rzeczywistym w Cursor Browser. Modyfikuj elementy i kolory bezpośrednio w live preview.

Multi-Agent Judging

Uruchom równoległych agentów na tym samym zadaniu, następnie automatyczna ocena wybiera najlepsze rozwiązanie.

Przypięte Czaty

Przypinaj ważne rozmowy w sidebarze agenta dla szybkiego dostępu.

  • Background agents: Uruchamiaj zadania podczas kontynuowania pracy
  • Nazwane sesje: /rename do nazwania, /resume <name> do wznowienia
  • Katalog .claude/rules/: Wsparcie dla rules obok CLAUDE.md
  • Sugestie promptów: Claude sugeruje follow-up prompty (Tab do akceptacji)
  • Przełączanie modelu (Alt+P): Przełączaj modele podczas komponowania promptu

OpenAI uruchomił Codex Cloud — background agents działające na infrastrukturze OpenAI:

  • Izolacja Git worktree dla każdego zadania
  • Równoległe wykonywanie zadań (do 10 współbieżnych)
  • Tworzenie GitHub PR po zakończeniu
  • Integracje powiadomień Slack i Linear
  • Pierwszy model przekraczający 80% na SWE-Bench Verified
  • Uruchomiono aplikację desktopową Claude Code (natywne doświadczenie ze wszystkimi funkcjami CLI)
  • Użytkownicy Pro zyskali dostęp do Opus 4.5
  • Zwiększona odporność na prompt injection i możliwości agenta
  • 8 równoległych agentów: Uruchom do 8 agentów jednocześnie
  • Cursor Composer 1: 4x szybszy model (250 tokenów/sek)
  • Sandboxed terminals: Bezpieczne środowiska wykonawcze (macOS)
  • Tryb głosowy: Kontrola agenta speech-to-text
  • Zastąpił GPT-5.1-Codex-Max
  • Wyspecjalizowany w naprawianiu bugów i generowaniu UI
  • Wytrzymałość zadań 24+ godziny przez kompaktowanie
  • Dostępny w Cursor i GitHub Copilot
  • Wykrywanie bugów w edytorze badające twoje zmiany
  • Instant Grep (beta) dla wszystkich poleceń grep agenta
  • Ulepszone Plan Mode z interaktywnymi pytaniami wyjaśniającymi

OpenAI udostępnił open-source Codex CLI:

  • Pełne źródło dostępne na GitHub
  • Akceptowane wkłady społeczności
  • Architektura wtyczek dla rozszerzeń
  • Wsparcie cross-platform (macOS, Linux, Windows)
ModelDostawcaKontekstNajlepszy DoCena (na 1M tokenów)
Claude Opus 4.6Anthropic200KDomyślny dla wszystkich złożonych zadań$5 / $25
Claude Sonnet 4.5Anthropic1MŚwiadomy budżetu, duży kontekst$3 / $15
GPT-5.4OpenAI1MDomyślny na wszystkich powierzchniach Codex/ChatGPT$2.50 / $10
GPT-5.2OpenAI200K+Naprawianie bugów, generowanie UI (Cursor)$1.25 / $10
Cursor Composer 2Cursor200KSzybka lokalna iteracja w Cursor$0.50 / $2.50
Gemini 3 ProGoogle1MMultimodal, ekstremalny kontekst$2 / $12
  • GPT-4, GPT-4.1, GPT-4o (zastąpione przez serię GPT-5.x)
  • GPT-5.1-Codex-Max (zastąpiony przez GPT-5.2 i GPT-5.3-Codex)
  • GPT-5.3-Codex (zastąpiony przez GPT-5.4 jako domyślny)
  • Cursor Composer 1 (zastąpiony przez Composer 2)
  • Seria Claude 3.x (całkowicie zastąpiona przez serię 4.5+)
  • o1-preview, o1-mini (przestarzałe)
  1. Atlassian MCP — Integracja Jira i Confluence
  2. Cloudflare MCP — Zarządzanie Workers, R2 i D1
  3. Vercel MCP — Automatyzacja wdrażania
  4. Supabase MCP — Operacje bazy danych i auth
  5. Linear MCP — Integracja śledzenia issues
  6. Stripe MCP — Automatyzacja przetwarzania płatności

Ekosystem Agent Skills znacznie się rozszerzył:

  • Marketplace Skills.sh teraz hostuje ponad 200 umiejętności
  • Universal CLI: npx skills add <owner/repo> działa w ponad 35 agentach
  • Popularne umiejętności: wdrażanie Cloudflare, code review, integracja Atlassian, generowanie dokumentacji API

SOC 2 Type II

Cursor i Claude Code Enterprise utrzymują certyfikację SOC 2 Type II. Codex Enterprise w toku.

Zwiększona Prywatność

Wszystkie trzy narzędzia gwarantują brak trenowania na kodzie w płatnych tierach. Plany enterprise dodają opcje rezydencji danych.

Logowanie Audytu

Kompleksowe ścieżki audytu dla wszystkich interakcji AI. Dostępne w planach enterprise dla wszystkich trzech narzędzi.

Zgodność GDPR

Pełna zgodność GDPR z rezydencją danych UE dla Cursor i Claude Code Enterprise.

Settings > Update > Auto-update. Wybierz kanał “Stable” lub “Beta”.

  • Changelogs: Cursor | Claude Code | Codex
  • Blogi: Cursor | Anthropic | OpenAI
  • Social: Śledź @cursor_ai, @AnthropicAI, @OpenAI na X/Twitter
  • Społeczność: Dołącz do serwerów Discord dla ogłoszeń w czasie rzeczywistym
  1. Cursor 3.0: Nowy interfejs Agents Window zastępuje stary layout — cloud agents usunięte z Editora
  2. GPT-5.4: Nowy domyślny model dla Codex i ChatGPT, zastępuje GPT-5.3-Codex
  3. Cursor Composer 2: Nowy domyślny model kodowania w Cursor, zastępuje Composer 1
  4. Claude Code v2.1.84+: Polecenia /tag i /vim usunięte (użyj /config → Editor mode zamiast tego)
  5. Claude Code v2.1+: Wsparcie SKILL.md wymaga v2.1.17+
  6. Rotacja kluczy API: Rotuj klucze starsze niż 6 miesięcy jako najlepsza praktyka bezpieczeństwa
ElementWycofanyZamiennikKoniec Wsparcia
Cursor v2.x Editor cloud agentsKwiecień 2026Agents WindowKwiecień 2026
GPT-5.3-CodexMarzec 2026GPT-5.4Marzec 2026
Cursor Composer 1Marzec 2026Composer 2Marzec 2026
Cursor v1.xLuty 2026v3.0+Luty 2026
Claude Code tylko WSLSierpień 2025Natywny WindowsSierpień 2025
Protokół MCP v1Październik 2025MCP v2.1Październik 2025

Ostatnia aktualizacja: 24 kwietnia 2026