Wierność
Czy artefakt odpowiada briefowi i referencjom? Na etapie 1 — czy makieta odzwierciedla referencje i brand guide? Na etapie 4 — czy kod odpowiada tokenom i komponentom z pakietu przekazania?
Czteroetapowy pipeline działa tylko wtedy, gdy każde przekazanie jest naprawdę dobre. Słaby artefakt na etapie 1 nie zostanie uratowany przez silnego agenta na etapie 4 — zostanie wiernie przetłumaczony na słaby kod. Ta strona to bramka jakości, która działa przy każdym przekazaniu.
Błędy kumulują się przez pipeline. Makieta 6/10 daje prototyp 6/10, daje system projektowy 6/10, daje kod 6/10. Koszt naprawy problemu rośnie na każdym etapie:
Ocena + iteracja na bramce zapobiega downstream’owej pracy do powtórki. Sednem nie jest perfekcjonizm — sednem jest, że model, który właśnie wyprodukował artefakt, jest najtańszym recenzentem.
Stosuj je na każdym etapie. Wymiary są stałe; zmieniają się tylko wagi.
Wierność
Czy artefakt odpowiada briefowi i referencjom? Na etapie 1 — czy makieta odzwierciedla referencje i brand guide? Na etapie 4 — czy kod odpowiada tokenom i komponentom z pakietu przekazania?
Spójność
Czy artefakt trzyma się wewnętrznie? Skale typografii używane konsekwentnie. Rytm odstępów. Jeden głos w tekście. Stany rozwiązywane wedle reguły, nie na czuja.
Kompletność
Czy edge case’y, stany i tekst są wypełnione? Bez ???, bez lorem ipsum, bez “Cecha 1 / Cecha 2”, każdy komponent ma każdy stan z macierzy.
Rzemiosło
Czy jest dopracowane na tyle, że obcy założyłby, że zrobił to projektant lub starszy inżynier? Odczyt na poziomie smaku.
Oceń każdy 0–10. Wynik artefaktu to minimum z czterech, nie średnia — 10/10 w trzech wymiarach i 4/10 w czwartym to artefakt 4/10. Najsłabszy wymiar to to, co odziedziczą Twoje etapy w dół.
Uruchom go w tym samym wątku ChatGPT lub Claude, który wyprodukował artefakt. Model, który go zbudował, ma najwięcej kontekstu do recenzji — a poproszenie go, by zagrał wrogiego recenzenta, wydobywa tryby porażki, które tryb pochwał wygładza.
Wyprodukowałeś {ARTEFAKT}. Teraz zagraj wrogiego starszego recenzenta.Oceń go 0-10 w wymiarach: Wierność, Spójność, Kompletność, Rzemiosło.Dla każdego wymiaru ocenionego poniżej 10, wymień każdy konkretnyproblem, który trzyma go z dala od 10. Cytuj konkretne lokalizacje(nazwa komponentu, region makiety, linia kodu).Nie bądź uprzejmy. Nie podsumowuj. Nie mów "ogólnie jest dobrze".Zastąp {ARTEFAKT} dosłowną nazwą: “makieta”, “index.html”, “pakiet przekazania systemu projektowego”, “tokens.css i szkielety komponentów, które właśnie wyprodukowałeś”.
Teraz napraw każdy problem, który wymieniłeś. Wyprodukuj zrewidowany{ARTEFAKT}. Następnie ponownie oceń go w tych samych czterechwymiarach i wymień pozostałe luki z konkretnymi lokalizacjami.Powtarzaj, aż wszystkie cztery wymiary będą 10/10, lub trafiszna ograniczenie, którego nie jesteś w stanie rozwiązać beze mnie —w takim wypadku zatrzymaj się i powiedz mi dokładnie, czegopotrzebujesz.Klauzula “zatrzymaj się i powiedz mi czego potrzebujesz” jest ważna. W przeciwnym razie model będzie iterował w kółko, gdy prawdziwym blokerem jest decyzja, którą musisz podjąć Ty (decyzja brandowa, kompromis produktowy, brakujące wymaganie).
Wymiary są te same; wagi nie.
| Etap | Najcięższe wagi | Dlaczego |
|---|---|---|
| 1 — Makieta | Wierność, Rzemiosło | Makieta ustawia sufit wizualny. Niech referencje są odzwierciedlone, a polish wysoki; kompletność wypełni etap 2. |
| 2 — Prototyp HTML | Kompletność, Spójność | To tu są implementowane stany. Każdy przycisk potrzebuje każdego stanu. Spójność łapie odchyły od makiety. |
| 3 — System projektowy | Spójność, Kompletność | System jest zdefiniowany przez swoją spójność między ekranami i stanami. Oba wymiary ważą tyle samo. |
| 4 — Kod + dokumentacja | Wierność, Rzemiosło | Wierność wobec pakietu przekazania (bez wymyślonych tokenów). Rzemiosło w kodzie (dopasowanie do istniejących konwencji, brak martwego kodu, prawdziwe typy). |
Nie iteruj w nieskończoność. Trzy powody, by dostarczyć przy mniej niż 10/10:
Każdy etap pipeline’u linkuje tutaj przy swoim przekazaniu. W razie wątpliwości — oceniaj. Koszt jednorazowego uruchomienia pętli to minuta. Koszt kumulujących się błędów przez cztery etapy to powtórka.