Strategie dla milionowych linii kodu

Odziedziczyłeś trzymilionowy monolit. Pierwotni architekci odeszli dwa lata temu, dokumentacja opisuje system, który już nie istnieje, a twój pierwszy ticket dotyka klasy PaymentProcessor, którą importuje kilkanaście innych usług. Wrzucenie całości do asystenta AI po prostu przepełnia okno kontekstu i produkuje pewne siebie bzdury. Ten przewodnik pokazuje przepływy pracy, które naprawdę skalują się: wyszukiwanie semantyczne zamiast grepa, kontekst warstwowy zamiast „przeczytaj wszystko” i refactoring przyrostowy zamiast przepisywania na jeden raz.

Co z tego wyniesiesz

Konfigurację MCP do wyszukiwania semantycznego (Zilliz Claude Context) podłączoną do Cursora, Claude Code i Codeksa, dzięki czemu AI znajduje kod według intencji, a nie dopasowania ciągu znaków
Wielokrotnego użytku prompt do rekonesansu architektury mapujący nieznaną bazę kodu z góry na dół
Technikę hierarchii kontekstu, która utrzymuje skupienie AI na właściwych 20% zamiast dławienia się całym repozytorium
Gotowy do skopiowania prompt do analizy wpływu zależności, pozwalający planować zmiany łamiące bez zaskakiwania innych zespołów
Prompt w stylu strangler fig do bezpiecznego opakowywania i dekompozycji kodu legacy
Konkretne kroki naprawcze na wypadek, gdy indeks się zdezaktualizuje, AI zacznie halucynować liczbę zależności albo równoległy refactoring się zderzy

Dlaczego AI pomaga w tej skali

Semantycznie, nie tekstowo

Dzięki indeksowi wektorowemu zapytanie „znajdź wszystkie przepływy uwierzytelniania” wydobywa kod OAuth, JWT i sesji, nawet gdy żaden z nich nie dzieli słowa kluczowego.

Śledzenie zależności

AI podąża za importami i miejscami wywołań przez granice modułów znacznie szybciej, niż zdołasz klikać przez „znajdź użycia”.

Testy charakteryzacyjne

Dla nieudokumentowanego kodu legacy AI tworzy testy, które przypinają obecne zachowanie, żebyś mógł refaktoryzować bez strachu.

To ty pozostajesz architektem

AI wykonuje mechaniczne skanowanie i boilerplate. To ty podejmujesz decyzje domenowe i architektoniczne, których ono podjąć nie potrafi.

Semantyczne wyszukiwanie kodu z Zilliz Claude Context

Wyszukiwanie tekstowe zawodzi w skali, bo powiązany kod rzadko dzieli słownictwo. Indeks semantyczny zbudowany na embeddingach wektorowych to naprawia. Utrzymywany serwer to Zilliz Claude Context (@zilliz/claude-context-mcp — wcześniej publikowany jako code-context). Konfiguracja MCP jest niemal identyczna we wszystkich trzech narzędziach; różni się tylko polecenie rejestracji.

Dodaj do ~/.cursor/mcp.json:

{
  "mcpServers": {
    "claude-context": {
      "command": "npx",
      "args": ["-y", "@zilliz/claude-context-mcp@latest"],
      "env": {
        "EMBEDDING_PROVIDER": "OpenAI",
        "OPENAI_API_KEY": "your-api-key",
        "MILVUS_TOKEN": "your-zilliz-key"
      }
    }
  }
}

claude mcp add claude-context \
  -e OPENAI_API_KEY=your-api-key \
  -e MILVUS_TOKEN=your-zilliz-key \
  -- npx -y @zilliz/claude-context-mcp@latest

codex mcp add claude-context \
  --env OPENAI_API_KEY=your-api-key \
  --env MILVUS_TOKEN=your-zilliz-key \
  -- npx -y @zilliz/claude-context-mcp@latest

Albo dodaj go bezpośrednio do ~/.codex/config.toml:

[mcp_servers.claude-context]
command = "npx"
args = ["-y", "@zilliz/claude-context-mcp@latest"]
env = { EMBEDDING_PROVIDER = "OpenAI", OPENAI_API_KEY = "your-api-key", MILVUS_TOKEN = "your-zilliz-key" }

Po zaindeksowaniu pytasz o koncepcje, a serwer zwraca odpowiednie pliki niezależnie od nazewnictwa. Dla wrażliwych baz kodu, które nie mogą sięgnąć do chmurowego API embeddingów, LuotoCompany/cursor-local-indexing uruchamia lokalny indeks ChromaDB i udostępnia go przez lokalny endpoint SSE:

Dodaj do ~/.cursor/mcp.json:

{
  "mcpServers": {
    "workspace-code-search": {
      "url": "http://localhost:8978/sse"
    }
  }
}

claude mcp add --transport sse workspace-code-search http://localhost:8978/sse

codex mcp add workspace-code-search --url http://localhost:8978/sse

To utrzymuje kod źródłowy na twojej własnej infrastrukturze — właściwy wybór dla usług finansowych, opieki zdrowotnej czy pracy w sektorze obronnym, gdzie kod nie może opuścić sieci.

Rekonesans architektury

Od czego zacząć z nieznanym monolitem? Z góry na dół. Skłoń AI do zbudowania modelu mentalnego, zanim czegokolwiek dotkniesz, a potem zagłęb się w obszar, którego naprawdę dotyczy twój ticket.

Agent Cursora sam zbiera kontekst z zaindeksowanej bazy kodu — wystarczy opisać, czego chcesz. Użyj @Folders, aby zawęzić pytanie do jednego obszaru, i @Code, aby wskazać konkretny fragment:

@Folders services/auth
Explain the authentication and authorization architecture: where tokens
are issued, how refresh works, and which services validate them.

Aby uzyskać precyzyjne odniesienie, zaznacz funkcję w edytorze i dodaj ją przez @Code, zanim poprosisz agenta o prześledzenie miejsc jej wywołań.

Zawęź sesję do katalogu, który cię interesuje, flagą --add-dir przy starcie (lub /add-dir <path> w trakcie sesji), a potem pytaj od ogółu do szczegółu. Użyj wzmianek ścieżkowych z @, aby wciągnąć konkretny plik do kontekstu:

Analyze this codebase and build a mental model of the system architecture.
Cover: core business domains, service boundaries, data-flow patterns, and
external dependencies. Present it as an overview for a new senior engineer.

Następnie zagłęb się przez wyszukiwanie semantyczne za pomocą serwera MCP:

Using claude-context, find all payment-processing flows. I need entry
points, state management during processing, external provider integration,
and the retry/error-handling logic. Reference @services/payment as you go.

Umieść AGENTS.md w katalogu głównym repozytorium (plik kontekstu projektu w Codeksie, odpowiednik CLAUDE.md czy .cursor/rules) opisujący domeny i konwencje, a potem uruchom /init wewnątrz TUI, aby Codex go zainicjował. Przy dużym refactoringu pracuj w dedykowanym git worktree, żeby eksploracja nigdy nie dotykała twojego głównego checkoutu:

Map this codebase top-down: business domains, service boundaries, data
flow, and external dependencies. Then locate the payment-processing flow
and summarize its entry points and retry logic.

Gotowy do skopiowania prompt — rekonesans architektury nieznanej bazy kodu:

Analyze this codebase and create a mental model of the system architecture.
Focus on:
1. Core business domains and bounded contexts
2. Service boundaries and how they communicate (HTTP, gRPC, events)
3. Data-flow patterns and where state lives
4. External dependencies and integration points

Present it as a high-level overview suitable for a senior engineer joining
the team today. Flag anything that looks like an architectural smell.

Zarządzanie kontekstem na skalę

Największy błąd przy dużych bazach kodu to ładowanie wszystkiego naraz. Twój asystent nie potrzebuje wszystkich trzech milionów linii — potrzebuje właściwego wycinka we właściwym momencie. Pomyśl o tym jak o przybliżaniu na mapie: kontynent, kraj, miasto, ulica.

Poziom domeny (widok z 10 000 stóp)

What are the main bounded contexts in this system, and how do the payment,
user, and inventory domains interact?

Poziom usługi (widok z 1000 stóp)

Within the payment domain, explain the service architecture and the main
APIs each service exposes.

Poziom komponentu (widok ze 100 stóp)

Show me how PaymentProcessor handles credit-card transactions and what its
retry strategy is for failed charges.

Poziom implementacji (poziom gruntu)

In PaymentProcessor.processCard(), why is there a 30-second timeout, and is
the synchronized block safe to remove?

Utrzymywanie skupionego kontekstu

Każde narzędzie ma własny mechanizm zawężania tego, co widzi AI. Zasada jest identyczna: ładuj wąsko, rozszerzaj tylko, gdy odpowiedź tego wymaga.

Zawężaj za pomocą @Folders i @Code, a stałe reguły zakoduj jako Project Rule, żeby nie powtarzać ich w każdym prompcie:

# In .cursor/rules/payment.mdc  (a Project Rule with glob: services/payment/**)
When working with payment code:
- All monetary amounts are integer cents — never floats
- Mutations require an idempotency key
- Never log full card numbers (PCI)
- Add audit logging for every state transition

Dla prostych projektów AGENTS.md w katalogu głównym repozytorium sprawdza się jako prostsza alternatywa dla strukturalnych reguł.

Użyj hierarchii plików CLAUDE.md — plik z każdego katalogu nakłada się na swoich rodziców, dając AI skupiony kontekst w miarę przemieszczania się po drzewie:

/CLAUDE.md                        # System-wide conventions
/services/CLAUDE.md               # Service-layer patterns
/services/payment/CLAUDE.md       # Payment-specific rules

Przełączaj się czysto między niepowiązanymi zadaniami za pomocą /clear i /add-dir:

/clear
/add-dir services/payment
Analyze the payment-processing flow.

/clear
/add-dir services/users
Review the authentication implementation.

Codex czyta AGENTS.md z katalogu głównego repozytorium i z każdego podkatalogu, więc umieszczaj skupione instrukcje obok kodu, którym mają zarządzać:

# In services/payment/AGENTS.md
This service handles all payment processing.
- Amounts are integer cents to avoid floating-point error
- Idempotency keys required on all transactions
- PCI: never log full card numbers

Przy równoległej eksploracji uruchamiaj po jednym worktree na zadanie, żeby konteksty pozostawały odizolowane, a twoja główna gałąź — nietknięta.

Gotowy do skopiowania prompt — celowany graf zależności (unika ładowania całego repozytorium):

Build a dependency graph for the UserService module only:
1. What services does it depend on, and why?
2. What services depend on it?
3. Are there any circular dependencies?
4. Which dependencies look tightly coupled and could be replaced with an
   interface or an event?

Do not scan unrelated modules. Cite the file and line for each dependency.

Refactoring przyrostowy

Refactoring milionowej bazy kodu to jak remont szpitala podczas trwającej operacji — nie możesz wszystkiego wyłączyć. Wzorzec, który działa: odkryj, ustanów szablon, migruj małymi partiami, zweryfikuj.

Weźmy bazę kodu Node.js wciąż naszpikowaną callbackami error-first. Ręczna migracja do async/await zajęłaby miesiące. Zamiast tego skłoń AI do skategoryzowania pracy według ryzyka, a potem wygenerowania jednej wielokrotnego użytku transformacji na kategorię:

// Before — error-first callback
function loadUser(id, callback) {
  db.query('SELECT * FROM users WHERE id = ?', [id], (err, rows) => {
    if (err) return callback(err);
    callback(null, rows[0]);
  });
}

// After — async, with a backward-compatible callback shim
async function loadUser(id, callback) {
  try {
    const rows = await db.query('SELECT * FROM users WHERE id = ?', [id]);
    if (callback) return callback(null, rows[0]);
    return rows[0];
  } catch (err) {
    if (callback) return callback(err);
    throw err;
  }
}

Shim pozwala wywołującym migrować we własnym tempie. Stosuj transformację katalog po katalogu, uruchamiaj istniejące testy po każdej partii i śledź postęp — nigdy nie transformuj całego drzewa w jednym przebiegu.

Gotowy do skopiowania prompt — zaplanuj migrację z poziomami ryzyka:

Using the claude-context index, find every error-first callback in src/ and
categorize them by migration risk:
- Simple (single async op)
- Chains (sequential ops)
- Parallel (concurrent ops)
- Complex error handling or shared closure state

For each tier, produce ONE reusable async/await transformation template with
edge cases to watch for and a testing strategy. Recommend a migration order,
lowest risk first. Do not change any code yet.

Koordynacja równoległych refactoringów

Przy dużym przedsięwzięciu rozłożonym na zespół skłoń AI do podzielenia pracy tak, by zminimalizować konflikty między zespołami, a potem pilnuj uczciwości gałęzi:

Podziel według granic zależności

Analyze module dependencies and propose how to split this refactor across
four developers so their territories barely overlap. Flag any shared files
that two teams would both need to edit.

Gałąź na terytorium

git checkout -b refactor/user-services
git checkout -b refactor/payment-services
git checkout -b refactor/shared-utils

Wykrywaj kolizje wcześnie

Review the diffs across all refactor/* branches and identify conflicting
or breaking changes between teams before we attempt to merge.

Archeologia kodu legacy

Każda duża baza kodu ma warstwy archeologiczne — kod z różnych epok i filozofii, część z niego sprzed czasów obecnego zespołu. Klasyczny koszmar: 15 000-liniowa procedura składowana, której nikt nie rozumie, a która wciąż codziennie przetwarza prawdziwe pieniądze.

Wzorzec strangler fig pozwala modernizować bez przepisywania: opakuj kod legacy za czystym interfejsem, a potem wyodrębniaj fragmenty po jednym, uruchamiając stary i nowy równolegle, aż zaufasz nowej ścieżce.

Gotowy do skopiowania prompt — opakuj kod legacy w nowoczesną fasadę (pierwszy krok strangler fig):

Create a modern API facade that wraps the legacy billing stored procedure
(billing_mega_proc) without changing its behavior:
- REST endpoints for each billing operation
- Internally still call the stored procedure
- Translate its magic-number error codes into typed HTTP errors
- Return consistent JSON, and add structured logging
- Generate an OpenAPI spec for the new surface

Do not reimplement any billing logic yet — only wrap and adapt.

Gdy dokumentacja nie istnieje, testy stają się dokumentacją. Poproś AI o napisanie testów charakteryzacyjnych, które przypną obecne zachowanie — łącznie z dziwnymi fragmentami — tak by każda przyszła zmiana zmieniająca wyjście zawodziła głośno:

describe('Legacy OrderProcessor — current behavior', () => {
  it('returns status code 1 on a standard single-item order', async () => {
    const result = await processOrder({
      customerId: 123,
      items: [{ sku: 'WIDGET-1', quantity: 1 }],
    });
    expect(result.status).toBe(1); // 1 = success (undocumented magic number)
    expect(result.orderId).toMatch(/^ORD-\d{8}$/);
  });

  it('returns -99 when inventory is unavailable', async () => {
    const result = await processOrder({
      customerId: 123,
      items: [{ sku: 'OUT-OF-STOCK', quantity: 1 }],
    });
    expect(result.status).toBe(-99); // -99 = inventory error
  });
});

Koordynacja między zespołami

W milionowej bazie kodu różne zespoły posiadają różne terytoria. Najtrudniejsze jest wprowadzenie zmiany przekraczającej granicę bez zepsucia czegoś komuś innemu. Przed każdą zmianą łamiącą uzyskaj raport wpływu.

Gotowy do skopiowania prompt — analiza wpływu zależności przed zmianą łamiącą:

I need to change the signature of UserService.authenticate(). Analyze the
blast radius:
1. Every call site, grouped by owning service
2. The arguments each caller passes
3. How each handles the response shape and which errors it expects
4. Any indirect/transitive dependents

Then propose a backward-compatible migration: add authenticateV2(), route the
old method through it, and give me a deprecation timeline. Cite file and line
for each call site.

Połącz to z automatycznie generowanymi kontraktami. Poproś AI o wytworzenie specyfikacji OpenAPI i schematów zdarzeń dla usługi, z której korzysta inny zespół — to zamienia „idź przeczytaj nasz kod” w stabilną granicę, względem której mogą się integrować bez grzebania w twoich wnętrznościach.

Kiedy to się psuje

Przepływy pracy AI w dużych bazach kodu zawodzą na konkretne, rozpoznawalne sposoby. Poznaj sposób naprawy każdego z nich.

Indeks semantyczny dezaktualizuje się po dużym merge’u. Indeksy wektorowe dryfują, gdy tysiące linii zmienia się naraz, więc AI cytuje pliki, które się przeniosły albo już nie istnieją. Przeindeksuj po dużych merge’ach lub rebase’ach (Zilliz Claude Context przeindeksowuje przyrostowo przy zmianach plików, ale wymuś pełne przeindeksowanie po przepisaniu historii) i traktuj każdą ścieżkę pliku podaną przez AI jako twierdzenie do zweryfikowania szybkim otwarciem, a nie jako prawdę objawioną.

AI wymyśla precyzyjnie wyglądające liczby. Zapytaj „ile jest callbacków?” o ogromne repozytorium, a możesz dostać „47 832” — pewną siebie halucynację, bo nigdy faktycznie nie przeskanowało każdego pliku. Przepuść je przez prawdziwe narzędzie: „Use ripgrep / claude-context and report the exact count with the command you ran.” Ufaj liczbom tylko wtedy, gdy przychodzą z odtwarzalnym poleceniem.

Przepełnienia okna kontekstu. Wklejenie lub wzmiankowanie przez @ poddrzewa o 200 tys. linii pogarsza odpowiedzi i spala tokeny. Jeśli odpowiedzi robią się mgliste albo narzędzie obcina, załadowałeś za dużo — wróć do hierarchii kontekstu, zawęź do jednej usługi i rozszerzaj tylko, gdy odpowiedź tego wymaga.

Konflikty gałęzi przy równoległym refactoringu. Gdy dwa zespoły edytują współdzielony plik, który krok podziału przeoczył, dostajesz ciche zepsucie merge’a. Uruchom ponownie prompt do wykrywania kolizji między gałęziami przed każdą integracją i trzymaj współdzielone narzędzia na gałęzi jednego właściciela, zamiast je rozdzielać.

Serwer MCP nie chce się połączyć. Jeśli AI nie widzi indeksu, potwierdź, że serwer jest zarejestrowany (claude mcp list, codex mcp list lub sprawdź ~/.cursor/mcp.json) i że OPENAI_API_KEY / MILVUS_TOKEN są ustawione w jego env. Dla lokalnego serwera SSE zweryfikuj, że faktycznie nasłuchuje na localhost:8978, zanim zaczniesz debugować cokolwiek innego.

Co dalej

Jakość kodu na skalę — utrzymywanie spójnych standardów, gdy zmieniasz kod w całym monolicie
Zarządzanie monorepo — czyste zawężanie kontekstu AI, gdy wiele pakietów dzieli jedno repozytorium
Testy jednostkowe z AI — przekształcanie testów charakteryzacyjnych w prawdziwą siatkę bezpieczeństwa
Niezbędne serwery MCP — podłączanie serwerów MCP do bazy danych, gita i przeglądarki, by rozszerzyć te przepływy pracy