Wierność
Czy artefakt odpowiada briefowi i referencjom? Na etapie 1 — czy makieta odzwierciedla referencje i brand guide? Na etapie 4 — czy kod odpowiada tokenom i komponentom z pakietu przekazania?
Czteroetapowy pipeline działa tylko wtedy, gdy każde przekazanie jest naprawdę dobre. Słaby artefakt na etapie 1 nie zostanie uratowany przez silnego agenta na etapie 4 — zostanie wiernie przetłumaczony na słaby kod. Ta strona to bramka jakości, która działa przy każdym przekazaniu.
Błędy kumulują się przez pipeline. Makieta 6/10 daje prototyp 6/10, daje system projektowy 6/10, daje kod 6/10. Koszt naprawy problemu rośnie na każdym etapie:
Ocena + iteracja na bramce zapobiega downstream’owej pracy do powtórki. Sednem nie jest perfekcjonizm — sednem jest to, że model, który właśnie wyprodukował artefakt, jest jego najtańszym recenzentem.
Stosuj je na każdym etapie. Wymiary są stałe; zmieniają się tylko wagi.
Wierność
Czy artefakt odpowiada briefowi i referencjom? Na etapie 1 — czy makieta odzwierciedla referencje i brand guide? Na etapie 4 — czy kod odpowiada tokenom i komponentom z pakietu przekazania?
Spójność
Czy artefakt trzyma się wewnętrznie? Skale typografii używane konsekwentnie. Rytm odstępów. Jeden głos w tekście. Stany rozwiązywane wedle reguły, nie na czuja.
Kompletność
Czy edge case’y, stany i tekst są wypełnione? Bez ???, bez lorem ipsum, bez “Cecha 1 / Cecha 2”, każdy komponent ma każdy stan z macierzy.
Rzemiosło
Czy jest dopracowane na tyle, że obcy założyłby, że zrobił to projektant lub starszy inżynier? Odczyt na poziomie smaku.
Oceń każdy 0–10. Wynik artefaktu to minimum z czterech, nie średnia — 10/10 w trzech wymiarach i 4/10 w czwartym to artefakt 4/10. Najsłabszy wymiar to to, co odziedziczą Twoje etapy w dół.
Uruchom go w tej samej sesji, która wyprodukowała artefakt. Model, który go zbudował, ma najwięcej kontekstu do recenzji — a poproszenie go, by zagrał wrogiego recenzenta, wydobywa tryby porażki, które tryb pochwał wygładza.
Zastąp {ARTEFACT} dosłowną nazwą: “the mockup”, “index.html”, “the design system handoff bundle”, “the tokens.css and component skeletons you just produced”.
Pętla jest wszędzie taka sama; różni się to, jak każde narzędzie utrzymuje świeżo zbudowany artefakt w zasięgu, by krytyka recenzowała rzecz prawdziwą, a nie jej streszczenie.
Trzymaj plik artefaktu otwarty (np. index.html, tokens.css) i uruchom krytykę w czacie trybu agenta, by ponownie wczytał otwarty edytor. Dodaj plik @-wzmianką, jeśli agent odpływa do innego kontekstu. Użyj checkpointa przed follow-upem “doprowadź do 10”, byś mógł cofnąć złą iterację.
Uruchom krytykę w tej samej sesji terminala, która wygenerowała artefakt — plik jest już w kontekście, a Claude Code wczyta go z dysku przed recenzją. Wskaż ścieżkę wprost (Re-read tokens.css, then critique it), by oceniał zapisany plik, a nie własne wspomnienie.
Uruchom na tym samym tasku/worktree, który wyprodukował artefakt (App, IDE lub CLI), by diff pozostał w zasięgu. W powierzchni IDE trzymaj plik w working secie; w aplikacji kontynuuj ten sam task, zamiast zaczynać nowy, by oceniany artefakt był tym, który dopiero co napisał.
Klauzula “stop and tell me what you need” jest ważna. W przeciwnym razie model będzie iterował w kółko, gdy prawdziwym blokerem jest decyzja, którą musisz podjąć Ty (decyzja brandowa, kompromis produktowy, brakujące wymaganie).
Wymiary są te same; wagi nie.
| Etap | Najcięższe wagi | Dlaczego |
|---|---|---|
| 1 — Makieta | Wierność, Rzemiosło | Makieta ustawia sufit wizualny. Niech referencje są odzwierciedlone, a polish wysoki; kompletność wypełni etap 2. |
| 2 — Prototyp HTML | Kompletność, Spójność | To tu są implementowane stany. Każdy przycisk potrzebuje każdego stanu. Spójność łapie odchyły od makiety. |
| 3 — System projektowy | Spójność, Kompletność | System jest zdefiniowany przez swoją spójność między ekranami i stanami. Oba wymiary ważą tyle samo. |
| 4 — Kod + dokumentacja | Wierność, Rzemiosło | Wierność wobec pakietu przekazania (bez wymyślonych tokenów). Rzemiosło w kodzie (dopasowanie do istniejących konwencji, brak martwego kodu, prawdziwe typy). |
Nie iteruj w nieskończoność. Trzy powody, by dostarczyć przy mniej niż 10/10:
Każdy etap pipeline’u linkuje tutaj przy swoim przekazaniu. W razie wątpliwości — oceniaj. Koszt jednorazowego uruchomienia pętli to minuta. Koszt kumulujących się błędów przez cztery etapy to powtórka.