Zarządzanie kosztami w chmurze i FinOps

Twój rachunek za chmurę skoczył w tym miesiącu o 40%. Dział finansowy chce wyjaśnienia do piątku, inżynieria przysięga, że nic się nie zmieniło, a jedyne, co masz, to dashboard Cost Explorera z 200 pozycjami i bez żadnej historii. Możesz spędzić dwa dni na eksportowaniu CSV-ek i tworzeniu tabel przestawnych w arkuszu — albo skierować asystenta AI na serwer MCP do kosztów i sprawić, by powiedział ci, które pięć usług się ruszyło, o ile i dlaczego.

Ten przewodnik pokazuje praktykom FinOps, inżynierom DevOps i zespołom platformowym, jak połączyć Cursor, Claude Code i Codex z prawdziwymi serwerami MCP do zarządzania kosztami i zamienić surowe dane billingowe w plany right-sizingu, alerty o anomaliach i prognozy, których naprawdę da się bronić podczas przeglądu budżetu.

Co z tego wyniesiesz

Działającą konfigurację MCP dla Vantage (wielochmurowość) i serwera AWS Labs Cost Explorer, skonfigurowaną identycznie w Cursor, Claude Code i Codex
Gotowy do wklejenia prompt, który wydobywa pięć najważniejszych okazji do oszczędności na bieżący miesiąc
Prompt do right-sizingu, który zwraca fazowy plan oznaczony poziomami ryzyka, a nie płaską listę instancji
Prompt do wykrywania anomalii, który odróżnia spodziewany wzrost od prawdziwego szoku rachunkowego
Jasne wyczucie tego, kiedy ten przepływ pracy się psuje — opłaty API, limity zapytań, nieaktualne tagi — i jak się z tego pozbierać

Skonfiguruj serwery MCP do kosztów

Te serwery udostępniają API billingu i użycia jako narzędzia, które asystent AI może wywoływać bezpośrednio. Konfiguracja jest identyczna w Cursor, Claude Code i Codex — różni się tylko plik, który czyta każde narzędzie (.cursor/mcp.json lub Ustawienia Cursora, .mcp.json dla Claude Code, ~/.codex/config.toml dla Codex). Skonfiguruj te dwa, a pokryjesz większość przypadków wielochmurowych.

Vantage (wielochmurowa platforma kosztowa)

Vantage agreguje wydatki z AWS, Azure, GCP, Kubernetes i SaaS za jednym API. Oficjalny serwer MCP działa przez npx i uwierzytelnia się tokenem bearer w trybie tylko do odczytu.

{
  "mcpServers": {
    "vantage": {
      "command": "npx",
      "args": ["-y", "vantage-mcp-server"],
      "env": {
        "VANTAGE_TOKEN": "your-read-only-vantage-token"
      }
    }
  }
}

Wygeneruj token z konta Vantage w sekcji API access i ogranicz go do odczytu — AI nigdy nie potrzebuje dostępu zapisu, by analizować wydatki.

AWS Cost Explorer (serwer MCP AWS Labs)

Serwer AWS Labs Cost Explorer to pakiet Pythona dystrybuowany przez PyPI i uruchamiany przez uvx, a nie zwykłe binarium npm. Czyta twoje istniejące poświadczenia AWS przez nazwany profil.

{
  "mcpServers": {
    "aws-cost-explorer": {
      "command": "uvx",
      "args": ["awslabs.cost-explorer-mcp-server@latest"],
      "env": {
        "FASTMCP_LOG_LEVEL": "ERROR",
        "AWS_REGION": "us-east-1",
        "AWS_PROFILE": "default"
      }
    }
  }
}

Dla Azure i GCP odpowiednikami są @azure/mcp (npx -y @azure/mcp@latest server start) oraz @google-cloud/gcloud-mcp (npx -y @google-cloud/gcloud-mcp), z których każdy czyta swój natywny łańcuch poświadczeń. Dodawaj je tylko wtedy, gdy faktycznie działasz w tych chmurach.

Codex czyta tę samą konfigurację w TOML

Codex przechowuje serwery MCP w ~/.codex/config.toml, a nie w JSON-ie. Te same dwa serwery wyglądają tak:

[mcp_servers.vantage]
command = "npx"
args = ["-y", "vantage-mcp-server"]
env = { VANTAGE_TOKEN = "your-read-only-vantage-token" }

[mcp_servers.aws-cost-explorer]
command = "uvx"
args = ["awslabs.cost-explorer-mcp-server@latest"]
env = { AWS_REGION = "us-east-1", AWS_PROFILE = "default" }

Przepływ pracy: od szoku rachunkowego do planu, którego da się bronić

Wzorzec jest taki sam niezależnie od narzędzia: podłącz serwer MCP do kosztów, zadaj skupione pytanie, a potem zweryfikuj rekomendację względem rzeczywistego zasobu, zanim zaczniesz działać. AI szybko znajduje kandydatów; to ty bierzesz na siebie decyzję o zmianie w produkcji.

Otwórz panel agenta i odwołaj się do serwerów po nazwie. Cursor trzyma analizę w twoim edytorze, więc możesz wrzucić ustalenia prosto do runbooka albo zmiany w Terraform.

@vantage @aws-cost-explorer Pull last month's spend grouped by
service and linked account. For the five services that grew the
most versus the prior month, tell me the dollar delta, the likely
driver (usage vs. price vs. new resources), and whether the growth
looks expected for a product scaling its user base. Output a table,
then a short prioritized list of what to investigate first.

Cursor zwraca tabelę, nad którą możesz iterować w miejscu — dopytuj o szczegóły, na przykład “drąż dalej w RDS”, bez powtarzania kontekstu.

Uruchom to z terminala, żeby analiza żyła obok repozytorium infrastruktury i mogła zasilić skrypt albo PR.

claude "Using the vantage and aws-cost-explorer MCP servers, find my
top 5 cost-growth drivers for last month vs. the prior month. For each,
give the dollar delta, the likely cause, and an expected-vs-anomalous
verdict. End with a prioritized investigation list."

Claude Code koordynuje oba serwery, agreguje dane i zapisuje podsumowanie w Markdownie, które możesz zacommitować do dokumentacji operacyjnej.

Codex czyta te same serwery z ~/.codex/config.toml i działa w CLI, IDE oraz Cloud.

codex "Analyze our multi-cloud spend via the vantage and
aws-cost-explorer MCP servers and produce a phased cost-reduction
plan: top 5 growth drivers, dollar deltas, likely causes, and an
expected-vs-anomalous call for each."

Uruchom to w zadaniu Codex Cloud, żeby trzymać analizę z dala od laptopa, albo w rozszerzeniu IDE, żeby wpleść wyniki w zmianę, którą już szkicujesz.

Typowa odpowiedź grupuje wydatki, szereguje czynniki wzrostu i oznacza, który wzrost jest łagodny. Na przykład może zgłosić, że RDS urósł, bo dodano trzy repliki odczytu (spodziewane przy nabieraniu ruchu), podczas gdy 45-procentowy skok w transferze międzyregionalnym nie ma pasującego wdrożenia i wymaga zbadania. Traktuj kwoty w dolarach jako punkt wyjścia — potwierdź je w konsoli dostawcy, zanim zameldujesz finansom, bo pokrycie tagami i granice kont kształtują to, co zwraca API.

Gotowe prompty do wklejenia

To wielokrotnego użytku przepisy. Nazywają prawdziwe usługi i proszą o opiniotwórcze wyniki, więc działają przy minimalnej edycji — podmień dostawcę albo próg i uruchom.

Znajdź pięć najważniejszych okazji do oszczędności w tym miesiącu:

Using @vantage and @aws-cost-explorer, analyze the current month's
spend and return my top 5 cost-savings opportunities ranked by
monthly dollar impact. For each: the resource or service, why it's
wasteful (idle, over-provisioned, wrong tier, no commitment), the
estimated monthly saving, and the effort to capture it (low/medium/high).
Exclude anything that would risk an SLA. Give me a table I can paste
into a ticket.

Wygeneruj fazowy plan right-sizingu z poziomami ryzyka:

Using @aws-cost-explorer, analyze actual CPU, memory, and IOPS
utilization vs. provisioned capacity for our EC2 and RDS fleet over
the last 30 days. Produce a right-sizing plan in three phases:
Phase 1 = zero-risk (remove orphaned volumes, idle load balancers),
Phase 2 = low-risk downsizing (instances under 30% sustained
utilization), Phase 3 = commitment changes (Savings Plans / Reserved
Instances). For each recommendation include the target size, the
monthly saving, and a risk level with the specific failure mode to
watch (e.g. throttling under burst load).

Skonfiguruj alerty o anomaliach, które ignorują spodziewany wzrost:

Using @vantage, design a cost anomaly-detection setup that minimizes
false positives. Define which dimensions to monitor (service, linked
account, region), how to set thresholds relative to a trailing baseline
rather than a fixed dollar amount, and rules to suppress alerts that
correlate with known events (a deploy, a marketing campaign, a planned
backfill). Output the alert conditions and an example of a true
positive vs. a benign spike I should not be paged for.

Alokacja kosztów i prognozowanie

Dwa kolejne zadania dopełniają praktykę FinOps: sprawienie, by wydatki dało się przypisać do zespołów, oraz zamienienie historii w budżet na przyszłość.

Zaprojektuj strategię tagowania i alokacji

Poproś asystenta, by przełożył strukturę twojej organizacji na egzekwowalny schemat tagów oraz metodę dzielenia współdzielonych zasobów (bazy danych, load balancery, bramki NAT), których żaden pojedynczy zespół nie posiada.

Using @vantage, design a cost-allocation strategy for an org with
product teams, shared platform teams, and dev/staging/production
environments. Define a required tag set, a fallback for untagged
spend, and a defensible method to split shared-resource costs
(by request volume, by CPU/memory share). Flag where allocation
will be approximate so I can set expectations with finance.

Przenieś historię do budżetu na przyszły rok

Podaj cztery ostatnie kwartały i swoje założenia wzrostu; poproś o prognozę z jawnymi buforami, a nie pojedynczą liczbą.

Using @vantage and @aws-cost-explorer, take our last four quarters
of actual spend and build a next-year monthly forecast. Inputs:
expected user growth, planned feature launches, and one new region.
Output a baseline projection, a growth allowance per team, a buffer
for unplanned cost, and the savings target needed to stay flat.
Show the assumptions so I can challenge them.

Zweryfikuj, zanim się zobowiążesz

Sprawdź wyrywkowo alokację AI względem prawdziwej faktury jednego zespołu i potwierdź, że mnożnik wzrostu z prognozy pasuje do twojego planu produktowego. Oparcie się na względnej historii (“ostatnie cztery kwartały → przyszły rok”) utrzymuje analizę aktualną, zamiast przypinać ją do roku kalendarzowego, który się zdezaktualizuje.

Kiedy to się psuje

Analiza kosztów zawodzi w przewidywalny sposób. Rozpoznawaj te sytuacje wcześnie:

Błędy uwierzytelniania lub uprawnień MCP. Najczęstszą awarią jest brakujący albo źle nadany token. Vantage potrzebuje VANTAGE_TOKEN (wystarczy tylko do odczytu); serwer AWS Labs potrzebuje poprawnego AWS_PROFILE z uprawnieniami IAM ce:Get*. Jeśli serwer startuje, ale każde zapytanie zwraca pustkę, prawie na pewno masz lukę w poświadczeniach lub uprawnieniach, a nie problem z kodem.
Opłaty i limity zapytań API Cost Explorera. Każde zapytanie kosztuje $0.01, a API dławi przy gwałtownym obciążeniu. Agent, który rozsiewa setki zapytań o dziennej granularności, może nabić koszt i zacząć się wykładać na błędach throttlingu. Najpierw zawężaj zapytania do granularności miesięcznej i drąż w dzienną tylko tam, gdzie to ma znaczenie.
Nieaktualne lub brakujące tagi alokacji kosztów. Alokacja i chargeback są tak dokładne, jak twoje tagi. Duży koszyk “untagged” po cichu zniekształca każdą liczbę per-zespół — traktuj pokrycie tagami jako wymóg, a nie miły dodatek.
Right-sizing, który powoduje throttling. Zmniejszenie instancji, która średnio wygląda na bezczynną, może ją zagłodzić podczas skoków ruchu. Zawsze sprawdzaj szczytowe (nie tylko średnie) wykorzystanie, zmieniaj po jednym poziomie naraz i obserwuj opóźnienia oraz wskaźniki błędów po każdej zmianie.
Zmyślone nazwy serwerów. Jeśli prompt odwołuje się do serwera, którego nigdy nie skonfigurowałeś (zwykłe binarium aws-cost-mcp, scope @kubernetes/mcp-server), wywołanie narzędzia po cichu nic nie robi, a AI może wymyślić wiarygodnie wyglądające liczby. Używaj dokładnych kluczy serwerów ze swojej konfiguracji, a dla Kubernetes prawdziwym pakietem jest pozbawiony scope’u kubernetes-mcp-server (npx -y kubernetes-mcp-server@latest).

Co dalej

Infrastruktura jako kod z AI — zamień plan right-sizingu w przejrzane zmiany Terraform
Monitoring i obserwowalność — skoreluj skoki kosztów z wdrożeniami i ruchem, które je wywołały
Pipeline’y CI/CD — dodaj bramki z szacunkiem kosztów do pull requestów, żeby wydatki były przeglądane, zanim trafią na produkcję

Kluczowe wnioski

Podłącz prawdziwe serwery MCP. Vantage przez npx i serwer AWS Labs Cost Explorer przez uvx — konfiguracja jest identyczna w Cursor, Claude Code i Codex.
Zadawaj skupione pytania, a nie “zoptymalizuj wszystko”. Powyższe prompty — top 5, fazowy right-sizing i wykrywanie anomalii — zwracają decyzje, na których da się działać.
Zawsze weryfikuj, zanim zmienisz produkcję. AI szybko znajduje kandydatów; decyzja należy do ciebie. Sprawdź szczytowe wykorzystanie, potwierdź kwoty w konsoli i obserwuj system po każdej zmianie.
Pilnuj licznika. Zapytania Cost Explorera kosztują po $0.01, a API ogranicza tempo — zawężaj zapytania i trzymaj serwer poza autonomicznymi pętlami.
Tagi decydują o wszystkim. Alokacja i prognozowanie są tak wiarygodne, jak pokrycie tagami, więc najpierw to napraw.