Twój CTO przeczytał wpis na blogu o „10x dzięki AI” i teraz chce plan migracji na piątek. Problem: każde studium przypadku, jakie znajdujesz, to referencja od dostawcy z podejrzanie okrągłą liczbą i bez żadnego odtwarzalnego przepływu pracy. Nie wniesiesz „zaoszczędzono 2 mln USD” na spotkanie planistyczne — musisz wiedzieć, co zespół faktycznie wpisał do agenta.
Ten artykuł przeprowadza Cię przez jedyny publicznie udokumentowany, weryfikowalny zestaw wewnętrznych wdrożeń Claude Code (własne zespoły Anthropic), wyciąga wzorce, które zadecydowały o ich powodzeniu, i zamienia każdy z nich w prompt gotowy do uruchomienia pierwszego dnia. Tam, gdzie przepływ pracy różni się między Cursor, Claude Code i Codex, pokazujemy wszystkie trzy.
Trzeźwe spojrzenie na jedyne w pełni udokumentowane wewnętrzne wdrożenie programowania z AI, z cytatem, który wkleisz do dokumentu planistycznego
Trzy prompty do skopiowania, które odtwarzają wzorce używane przez te zespoły: wdrożenie się w bazie kodu, generowanie wsadowe na podstawie pliku z danymi oraz przekształcenie jednorazowego notatnika w trwałe narzędzie
Prosty, uczciwy model ROI, który wypełnisz swoimi liczbami — nie wymyślonymi
Lista „Gdy to się psuje” z trybami awarii, które po cichu zabijają pilotaże
Udokumentowane wdrożenie: wewnętrzne zespoły Anthropic
Anthropic opublikował, jak jego własne zespoły nieprodukcyjne korzystają z Claude Code. Są one cenne właśnie dlatego, że opisują interakcję, a nie tylko rezultat.
Infrastruktura danych: debugowanie ze zrzutu ekranu
Podczas incydentu produkcyjnego zespół Infrastruktury Danych wkleił do Claude Code zrzut ekranu dashboardu Kubernetes. Agent zdiagnozował wyczerpanie adresów IP podów i wygenerował dokładne komendy do utworzenia nowej puli IP — oszczędzając około 20 minut w trakcie awarii. Wartością wielokrotnego użytku nie jest „AI oszczędza 20 minut”; jest nią to, że multimodalny agent potrafi zamienić nieczytelny dashboard w krok runbooka, dzięki czemu dyżurujący inżynierowie bez głębokiej wiedzy sieciowej mogą działać.
Marketing wzrostu: wtyczka Figma generująca 100 wariantów reklam
Jednoosobowy dział marketingu wydajnościowego zbudował agentowy przepływ pracy, który wczytuje plik CSV z wynikami reklam, oraz wtyczkę Figma generującą do 100 wariantów reklam przez podmianę nagłówków i opisów — skracając godziny ręcznego tworzenia wariantów. Przenoszalny wzorzec to „zapętl agenta na pliku z danymi, by wygenerować ustrukturyzowany wynik”, identyczny niezależnie od tego, czy wynikiem są teksty reklam, fixture’y testowe, czy zaślepki migracyjne.
Nauka o danych: od jednorazowego notatnika do narzędzia, które zostaje
Naukowcy zajmujący się danymi użyli Claude Code do budowy złożonych dashboardów wizualizacyjnych bez samodzielnego pisania JavaScriptu, przechodząc od jednorazowych notatników do trwałych, współdzielonych aplikacji w TypeScript. Wzorzec: opisz rzecz, którą wciąż wyprowadzasz ręcznie od nowa, i pozwól agentowi zbudować wokół niej małą aplikację.
Trzy powyższe ruchy wielokrotnego użytku — diagnozuj-z-kontekstu, generuj-wsadowo-z-pliku, zbuduj-trwałe-narzędzie — są niezależne od narzędzia. Różni się to, jak kierujesz agenta na swój projekt. Oto krok wdrożeniowy na dzień pierwszy w każdym narzędziu.
Otwórz repozytorium w Cursor i użyj trybu Agent (agent automatycznie czyta workspace i .cursor/rules). Aby uchwycić konwencje tak, by każda kolejna sesja zaczynała się z mocnym osadzeniem, wygeneruj plik reguł:
Read the project structure, package.json, and the three largest source
files. Draft a .cursor/rules/project.mdc that captures our stack, our
directory layout, our test command, and the two or three conventions a new
contributor would get wrong. Keep it under 40 lines.
Przejrzyj diff w widoku inline w Cursor przed zaakceptowaniem — pliki reguł rozjeżdżają się z rzeczywistością, więc trzymaj je krótkie i sprawdzone.
Z katalogu głównego repozytorium uruchom claude, pozwól mu zinwentaryzować bazę kodu, a potem zacommituj wygenerowany plik kontekstu:
Explore this repository and write a CLAUDE.md at the root. Capture: the
stack and runtime, how to install and run tests, the build/deploy command,
and the conventions a new engineer most often gets wrong here. Keep it tight
— bullet points, no prose padding.
Przy dużym monolicie poproś Claude Code, by użył sub-agentów, dzięki czemu odczyta więcej drzewa równolegle bez przepełnienia okna kontekstu. Później uruchamiaj go headless w CI poleceniem claude -p --output-format json, gdy przepływ pracy się sprawdzi.
Codex czyta plik AGENTS.md jako kontekst projektu. W Codex CLI (lub rozszerzeniu IDE) uruchom:
Read this repo and write an AGENTS.md at the root describing the stack, the
test and build commands, and the conventions a new contributor would miss.
Then list three independent tasks from our backlog that are safe to run in
parallel as separate Codex Cloud tasks.
Sugestia zadań równoległych wykorzystuje mocną stronę Codexa: rozprosz je jako asynchroniczne zadania Cloud i przeglądaj diffy w miarę ich napływania, zamiast niańczyć jedną sesję.
Realistyczny model ROI (wypełnij własnymi liczbami)
Zostaniesz poproszony o uzasadnienie wydatku. Oprzyj się pokusie pożyczenia cudzej nagłówkowej liczby. Zamiast tego zbuduj najmniejszy obronny model i mierz się względem niego. Tabela poniżej to szablon poglądowy — każdy wpis jest miejscem na liczbę, którą zmierzysz we własnym zespole, a nie raportowanym wynikiem.
Poglądowy model 12-miesięczny — każdą liczbę zastąp zmierzonymi danymi
Dane wejściowe
Skąd je wziąć
Przykładowy placeholder
Pełny koszt godziny pracy programisty
Finanse / w pełni obciążone wynagrodzenie
twoja liczba
Godziny/tydzień na zadaniach, które oddelegujesz
Tydzień śledzenia czasu
twoja liczba
Realistyczny czas zaoszczędzony na tych zadaniach
Twój 2-tygodniowy pilotaż, zmierzony
zachowawczo, twoja liczba
Subskrypcja narzędzia na stanowisko / miesiąc
Cennik dostawcy
twoja liczba
Godziny wdrożenia/szkolenia na programistę
Twój plan wdrożenia
twoja liczba
Jak przeprowadzić pilotaż, który daje prawdziwe dowody
Wybierz jedno bolesne, mierzalne zadanie. Nie „przyspieszmy nas” — coś w stylu „czas od otwarcia PR do pierwszego komentarza w przeglądzie” albo „godziny na dodanie endpointu CRUD z testami”. Zarejestruj punkt odniesienia przez dwa tygodnie zanim wprowadzisz narzędzie.
Uruchom jeden z powyższych promptów na dokładnie tym zadaniu z dwoma lub trzema ochotnikami. Trzymaj prompt we wspólnym pliku, aby wszyscy uruchamiali to samo i dało się porównać.
Zarejestruj stan przed/po na wybranej metryce. Arkusz z datami, zadaniem i zmierzoną liczbą bije każde studium przypadku od dostawcy.
Zapisz tryby awarii, na które trafiłeś (zobacz niżej) i sposób, w jaki sobie z nimi poradziłeś. To najcenniejszy artefakt — to on sprawia, że wdrożenie da się powtórzyć, zamiast być przypadkiem.
Agent z przekonaniem generuje prawdopodobne, ale błędne komendy. Historia z debugowaniem dashboardu działa, bo człowiek zweryfikował każdy krok kubectl przed uruchomieniem. Nigdy nie pozwól agentowi wykonywać zmian w infrastrukturze bez nadzoru podczas incydentu — niech proponuje, a ty weryfikujesz. Twoje prompty powinny wprost mówić „do not run anything”.
Generowanie wsadowe rozjeżdża się z twoim realnym schematem. Gdy zapętlasz agenta na pliku CSV lub innym pliku z danymi, po cichu wymyśli on nazwy kolumn albo założy typy. Zawsze proś go o oznaczenie przyjętych założeń (powyższe prompty to robią) i wyrywkowo sprawdzaj kilka wygenerowanych wyników względem źródła.
„Trwałe narzędzie” staje się nieutrzymywanym shadow IT. Wzorzec notatnik-do-aplikacji jest potężny i niebezpieczny — możesz skończyć z pięcioma jednorazowymi aplikacjami React, których nikt nie jest właścicielem. Zdecyduj z góry, czy narzędzie awansuje do prawdziwego repozytorium z testami, czy pozostaje osobistym skryptem.
Twoja liczba ROI nie przetrwa pierwszego sceptyka. Jeśli nie umiesz odpowiedzieć „zmierzone jak, na ilu próbkach?”, nie masz jeszcze wyniku — masz wrażenie. Wróć do mniejszego, zmierzonego twierdzenia.
Pliki kontekstu gniją.CLAUDE.md, AGENTS.md czy .cursor/rules, które rozjeżdżają się z rzeczywistością, czynią agenta gorszym, bo teraz z przekonaniem podąża za nieaktualnymi konwencjami. Traktuj je jak kod: przeglądaj zmiany, trzymaj je krótkie, usuwaj to, co przestało być prawdą.