Projektowanie schematu bazy danych z Cursor

Zespół produktowy właśnie sfinalizował specyfikację wielodostępowego systemu billingowego SaaS. Potrzebujesz kont użytkowników, organizacji, planów subskrypcji, śledzenia zużycia, faktur i ścieżki audytu. Relacje nie są oczywiste — czy użytkownik należy do jednej organizacji, czy może należeć do kilku? Czy faktury są powiązane z subskrypcjami, czy z rekordami zużycia? A wymagania wydajnościowe nie są trywialne: dashboard billingowy musi się ładować w poniżej 200ms nawet dla organizacji z 50 000 miesięcznych zdarzeń zużycia.

Zaprojektowanie schematu dobrze za pierwszym podejściem oszczędza tygodnie bolesnych migracji później. Zrobienie tego źle oznacza albo uruchamianie ALTER TABLE na produkcyjnej bazie pod obciążeniem, albo utrzymywanie wstecznie kompatybilnych skryptów migracji, od których boli głowa. Tryb Ask w Cursor jest zaskakująco dobry w wykrywaniu problemów z normalizacją, brakujących indeksów i błędów w relacjach, zanim napiszesz swoją pierwszą migrację.

Co wyniesiesz z tej lekcji

Workflow promptowy do przekształcania wymagań biznesowych w znormalizowany schemat bazy danych z trybem Ask w Cursor
Prompt do generowania migracji, który produkuje pliki migracyjne Drizzle/Prisma/Knex ze wsparciem dla rollbacku
Technikę wykorzystania trybu Agent do generowania danych seed, które testują przypadki brzegowe twojego schematu
Prompt do optymalizacji indeksów, który wyłapuje zapytania N+1 i brakujące indeksy, zanim trafią na produkcję
Listę kontrolną modelowania danych, która zapobiega najczęstszym błędom w projektowaniu schematów

Workflow

Krok 1: Wyodrębnij encje i relacje z trybem Ask

Zacznij w trybie Ask. Nie skacz od razu do tworzenia tabel — najpierw opanuj model konceptualny. AI jest doskonałe w zadawaniu pytań uściślających, które ujawniają niejednoznaczności w wymaganiach.

Prompt do skopiowania — Ekstrakcja encji:

Projektuję bazę danych dla wielodostępowego systemu billingowego SaaS z takimi wymaganiami:

Użytkownicy rejestrują się i tworzą lub dołączają do organizacji
Każda organizacja subskrybuje plan (free, pro, enterprise)
Zużycie jest śledzone per organizacja per miesiąc (wywołania API, storage, minuty obliczeniowe)
Faktury są generowane miesięcznie na podstawie planu + nadmiarowego zużycia
Wszystkie zmiany w subskrypcjach i billingu muszą podlegać audytowi
Użytkownicy mogą mieć różne role w różnych organizacjach (owner, admin, member)

Zanim utworzysz jakiekolwiek tabele, zidentyfikuj:

Wszystkie encje i ich kluczowe atrybuty
Relacje między encjami (jeden-do-jednego, jeden-do-wielu, wiele-do-wielu)
Gdzie potrzebna jest tabela pośrednia vs klucz obcy
Niejednoznaczności w wymaganiach, które powinienem rozwiązać przed projektowaniem schematu
Możliwości denormalizacji dla wydajności zapytań

Nie pisz jeszcze SQL. Daj mi tylko model konceptualny.

Ten prompt celowo unika proszenia o SQL. Etap modelu konceptualnego wyłapuje błędy takie jak “czy użytkownik powinien należeć do jednej organizacji czy wielu?”, których naprawienie po utworzeniu tabel jest kosztowne. AI zazwyczaj ujawni 3-5 niejednoznaczności, które musisz rozwiązać z zespołem produktowym przed pisaniem kodu.

Krok 2: Wygeneruj schemat z prawidłowymi ograniczeniami

Gdy model konceptualny jest jasny, przełącz się na tryb Agent i wygeneruj właściwy schemat. Bądź precyzyjny co do ORM i bazy danych — ograniczenia i składnia różnią się znacząco.

Prompt do skopiowania — Generowanie schematu (Drizzle + PostgreSQL):

Na podstawie omówionego modelu encji wygeneruj kompletny schemat bazy danych za pomocą Drizzle ORM dla PostgreSQL:

Utwórz src/db/schema.ts ze wszystkimi tabelami, kolumnami i relacjami
Użyj prawidłowych typów PostgreSQL (uuid dla ID, timestamptz dla znaczników czasu, jsonb dla metadanych)
Dodaj wszystkie klucze obce z zachowaniem ON DELETE (CASCADE dla danych posiadanych, RESTRICT dla danych referencyjnych, SET NULL dla opcjonalnych referencji)
Dodaj ograniczenia unique tam, gdzie wymagają tego reguły biznesowe (np. jedna aktywna subskrypcja per organizacja)
Dodaj ograniczenia CHECK dla integralności danych (np. wartości zużycia nie mogą być ujemne)
Utwórz indeksy dla każdej kolumny klucza obcego i każdej kolumny używanej w klauzulach WHERE
Dodaj indeksy złożone dla zapytań, o których wiemy, że będą często uruchamiane:
- Zużycie per organizacja + miesiąc
- Faktury per organizacja + status
- Log audytu per typ encji + id encji + znacznik czasu
Dodaj created_at i updated_at do każdej tabeli z wartościami domyślnymi
Użyj enuma dla statusu subskrypcji: active, canceled, past_due, trialing

Wygeneruj również początkowy plik migracji.

Krok 3: Zwaliduj schemat względem rzeczywistych zapytań

Schemat, który wygląda czysto na papierze, może działać fatalnie pod rzeczywistymi wzorcami zapytań. Użyj trybu Ask, aby sprawdzić schemat względem faktycznych zapytań, które twoja aplikacja będzie wykonywać.

Prompt do skopiowania — Walidacja zapytań:

@src/db/schema.ts

Oto 10 najczęstszych zapytań, które ta aplikacja będzie wykonywać:

Pobierz wszystkie organizacje, do których należy użytkownik, z jego rolą w każdej
Pobierz aktualną subskrypcję i szczegóły planu dla organizacji
Pobierz podział zużycia w tym miesiącu dla organizacji
Wygeneruj fakturę: sumuj zużycie per typ dla danej organizacji i miesiąca
Pobierz ostatnich 50 wpisów logu audytu dla organizacji
Znajdź wszystkie organizacje ze statusem subskrypcji past_due
Pobierz miesięczny trend zużycia dla organizacji z ostatnich 12 miesięcy
Wyszukaj użytkowników po e-mailu we wszystkich organizacjach
Pobierz wszystkich członków organizacji z ich rolami
Zlicz łączną liczbę wywołań API we wszystkich organizacjach dla danego dnia

Dla każdego zapytania:

Napisz SQL (lub kod Drizzle query builder), który na nie odpowiada
Wskaż, czy jakiekolwiek zapytanie będzie wolne bez indeksu, którego nie stworzyliśmy
Oznacz każde zapytanie wymagające pełnego skanu tabeli
Zasugeruj zmiany w schemacie, jeśli zapytanie jest nadmiernie złożone

Ten krok prawie zawsze wyłapuje brakujące indeksy. Zapytanie o trend zużycia (zapytanie 7) zazwyczaj potrzebuje indeksu złożonego na (organization_id, month), który nie był oczywisty z samego schematu.

Krok 4: Wygeneruj dane seed testujące przypadki brzegowe

Dobre dane seed to nie losowe dane — to dane zaprojektowane do testowania ograniczeń schematu i ujawniania przypadków brzegowych.

Prompt do skopiowania — Generowanie danych seed:

@src/db/schema.ts

Utwórz skrypt seed w src/db/seed.ts, który wypełni bazę realistycznymi danymi testowymi pokrywającymi te scenariusze:

Organizacja na każdym typie planu (free, pro, enterprise) z odpowiednim poziomem zużycia
Użytkownik należący do 3 organizacji z różną rolą w każdej
Organizacja ze zużyciem przekraczającym limity planu (do testowania billingu nadmiarowego)
Organizacja z anulowaną subskrypcją i nieuregulowaną fakturą
Scenariusz granicy miesiąca: zużycie obejmujące ostatni dzień stycznia i początek lutego
Organizacja z dokładnie zerowym zużyciem (przypadek brzegowy dla generowania faktur)
10 000 wpisów logu audytu dla jednej organizacji (do testowania wydajności paginacji)
Użytkownik z tym samym adresem e-mail próbujący dołączyć do organizacji po raz drugi (test ograniczenia unikatowości)

Użyj składni insert().values() Drizzle. Dodaj jasny komentarz nad każdą sekcją wyjaśniający, jaki scenariusz testuje.

Uruchom skrypt seed. Jeśli jakikolwiek insert zakończy się błędem naruszenia ograniczenia, którego się nie spodziewałeś, to jest problem w projekcie schematu do naprawienia teraz, a nie na produkcji.

Krok 5: Napisz migracje ze wsparciem dla rollbacku

Każda migracja powinna być odwracalna. Tryb Agent może wygenerować zarówno migrację “up”, jak i “down” w jednym przebiegu.

Krok 6: Optymalizuj z EXPLAIN ANALYZE

Po wypełnieniu schematu danymi seed użyj Cursor do analizy wydajności zapytań i sugestii optymalizacji.

Kiedy to się psuje

AI sugeruje denormalizację zbyt agresywnie. Modele trenowane na treściach tutorialowych mają tendencję do rekomendowania przechowywania obliczonych wartości (jak “total_amount” na fakturach), aby uniknąć JOIN-ów. Dla systemu billingowego stwarza to ryzyka integralności danych — jeśli pozycja się zmieni, ale suma nie zostanie przeliczona, twoje faktury są nieprawidłowe. Denormalizuj tylko wtedy, gdy zmierzysz problem z wydajnością i ryzyko integralności jest akceptowalne.

Wygenerowane migracje nie są idempotentne. Jeśli migracja zawiedzie w połowie, ponowne uruchomienie nie powinno się wywalić. Dodaj sprawdzenia IF NOT EXISTS do CREATE TABLE i IF EXISTS do DROP. Poproś Agenta jawnie o uczynienie migracji idempotentymi.

Kaskady kluczy obcych usuwają za dużo danych. ON DELETE CASCADE na niewłaściwej relacji może wyczyścić całe tabele. Dla systemu billingowego prawie nic nie powinno mieć cascade-delete. Używaj RESTRICT domyślnie i CASCADE tylko dla prawdziwych relacji posiadania (jak usunięcie organizacji usuwa jej rekordy zużycia). Zawsze weryfikuj zachowanie ON DELETE w code review.

Zmiany schematu psują istniejące zapytania. Gdy zmieniasz nazwę kolumny lub typ, istniejący kod aplikacji się psuje. Użyj migracji dwufazowej: najpierw dodaj nową kolumnę, wdróż kod zapisujący do starej i nowej kolumny, potem usuń starą kolumnę w kolejnej migracji. Poproś Agenta o wygenerowanie pełnego planu dwufazowego.

AI generuje składnię specyficzną dla PostgreSQL dla SQLite. Jeśli twoje środowisko deweloperskie używa SQLite, ale produkcja PostgreSQL, napotkasz różnice w składni. Bądź precyzyjny co do docelowej bazy danych w swoim prompcie. Jeszcze lepiej, użyj abstrakcji dialektu Drizzle i testuj na tym samym silniku bazy, na którym wdrażasz.

Co dalej

Frontend UI z designów Zbuduj dashboard billingowy, który odpytuje schemat, który właśnie zaprojektowałeś.

Optymalizacja wydajności Sprofiluj zapytania do bazy pod obciążeniem i zoptymalizuj wolne.

Audyt bezpieczeństwa Przejrzyj schemat pod kątem problemów bezpieczeństwa: wektory SQL injection, ekspozycja wrażliwych danych, luki w kontroli dostępu.