Zarządzanie kosztami w chmurze i FinOps
Twój rachunek za chmurę skoczył w tym miesiącu o 40%. Dział finansowy chce wyjaśnienia do piątku, inżynieria przysięga, że nic się nie zmieniło, a jedyne, co masz, to dashboard Cost Explorera z 200 pozycjami i bez żadnej historii. Możesz spędzić dwa dni na eksportowaniu CSV-ek i tworzeniu tabel przestawnych w arkuszu — albo skierować asystenta AI na serwer MCP do kosztów i sprawić, by powiedział ci, które pięć usług się ruszyło, o ile i dlaczego.
Ten przewodnik pokazuje praktykom FinOps, inżynierom DevOps i zespołom platformowym, jak połączyć Cursor, Claude Code i Codex z prawdziwymi serwerami MCP do zarządzania kosztami i zamienić surowe dane billingowe w plany right-sizingu, alerty o anomaliach i prognozy, których naprawdę da się bronić podczas przeglądu budżetu.
Co z tego wyniesiesz
Dział zatytułowany „Co z tego wyniesiesz”- Działającą konfigurację MCP dla Vantage (wielochmurowość) i serwera AWS Labs Cost Explorer, skonfigurowaną identycznie w Cursor, Claude Code i Codex
- Gotowy do wklejenia prompt, który wydobywa pięć najważniejszych okazji do oszczędności na bieżący miesiąc
- Prompt do right-sizingu, który zwraca fazowy plan oznaczony poziomami ryzyka, a nie płaską listę instancji
- Prompt do wykrywania anomalii, który odróżnia spodziewany wzrost od prawdziwego szoku rachunkowego
- Jasne wyczucie tego, kiedy ten przepływ pracy się psuje — opłaty API, limity zapytań, nieaktualne tagi — i jak się z tego pozbierać
Skonfiguruj serwery MCP do kosztów
Dział zatytułowany „Skonfiguruj serwery MCP do kosztów”Te serwery udostępniają API billingu i użycia jako narzędzia, które asystent AI może wywoływać bezpośrednio. Konfiguracja jest identyczna w Cursor, Claude Code i Codex — różni się tylko plik, który czyta każde narzędzie (.cursor/mcp.json lub Ustawienia Cursora, .mcp.json dla Claude Code, ~/.codex/config.toml dla Codex). Skonfiguruj te dwa, a pokryjesz większość przypadków wielochmurowych.
Vantage (wielochmurowa platforma kosztowa)
Dział zatytułowany „Vantage (wielochmurowa platforma kosztowa)”Vantage agreguje wydatki z AWS, Azure, GCP, Kubernetes i SaaS za jednym API. Oficjalny serwer MCP działa przez npx i uwierzytelnia się tokenem bearer w trybie tylko do odczytu.
{ "mcpServers": { "vantage": { "command": "npx", "args": ["-y", "vantage-mcp-server"], "env": { "VANTAGE_TOKEN": "your-read-only-vantage-token" } } }}Wygeneruj token z konta Vantage w sekcji API access i ogranicz go do odczytu — AI nigdy nie potrzebuje dostępu zapisu, by analizować wydatki.
AWS Cost Explorer (serwer MCP AWS Labs)
Dział zatytułowany „AWS Cost Explorer (serwer MCP AWS Labs)”Serwer AWS Labs Cost Explorer to pakiet Pythona dystrybuowany przez PyPI i uruchamiany przez uvx, a nie zwykłe binarium npm. Czyta twoje istniejące poświadczenia AWS przez nazwany profil.
{ "mcpServers": { "aws-cost-explorer": { "command": "uvx", "args": ["awslabs.cost-explorer-mcp-server@latest"], "env": { "FASTMCP_LOG_LEVEL": "ERROR", "AWS_REGION": "us-east-1", "AWS_PROFILE": "default" } } }}Dla Azure i GCP odpowiednikami są @azure/mcp (npx -y @azure/mcp@latest server start) oraz @google-cloud/gcloud-mcp (npx -y @google-cloud/gcloud-mcp), z których każdy czyta swój natywny łańcuch poświadczeń. Dodawaj je tylko wtedy, gdy faktycznie działasz w tych chmurach.
Codex czyta tę samą konfigurację w TOML
Dział zatytułowany „Codex czyta tę samą konfigurację w TOML”Codex przechowuje serwery MCP w ~/.codex/config.toml, a nie w JSON-ie. Te same dwa serwery wyglądają tak:
[mcp_servers.vantage]command = "npx"args = ["-y", "vantage-mcp-server"]env = { VANTAGE_TOKEN = "your-read-only-vantage-token" }
[mcp_servers.aws-cost-explorer]command = "uvx"args = ["awslabs.cost-explorer-mcp-server@latest"]env = { AWS_REGION = "us-east-1", AWS_PROFILE = "default" }Przepływ pracy: od szoku rachunkowego do planu, którego da się bronić
Dział zatytułowany „Przepływ pracy: od szoku rachunkowego do planu, którego da się bronić”Wzorzec jest taki sam niezależnie od narzędzia: podłącz serwer MCP do kosztów, zadaj skupione pytanie, a potem zweryfikuj rekomendację względem rzeczywistego zasobu, zanim zaczniesz działać. AI szybko znajduje kandydatów; to ty bierzesz na siebie decyzję o zmianie w produkcji.
Otwórz panel agenta i odwołaj się do serwerów po nazwie. Cursor trzyma analizę w twoim edytorze, więc możesz wrzucić ustalenia prosto do runbooka albo zmiany w Terraform.
@vantage @aws-cost-explorer Pull last month's spend grouped byservice and linked account. For the five services that grew themost versus the prior month, tell me the dollar delta, the likelydriver (usage vs. price vs. new resources), and whether the growthlooks expected for a product scaling its user base. Output a table,then a short prioritized list of what to investigate first.Cursor zwraca tabelę, nad którą możesz iterować w miejscu — dopytuj o szczegóły, na przykład “drąż dalej w RDS”, bez powtarzania kontekstu.
Uruchom to z terminala, żeby analiza żyła obok repozytorium infrastruktury i mogła zasilić skrypt albo PR.
claude "Using the vantage and aws-cost-explorer MCP servers, find mytop 5 cost-growth drivers for last month vs. the prior month. For each,give the dollar delta, the likely cause, and an expected-vs-anomalousverdict. End with a prioritized investigation list."Claude Code koordynuje oba serwery, agreguje dane i zapisuje podsumowanie w Markdownie, które możesz zacommitować do dokumentacji operacyjnej.
Codex czyta te same serwery z ~/.codex/config.toml i działa w CLI, IDE oraz Cloud.
codex "Analyze our multi-cloud spend via the vantage andaws-cost-explorer MCP servers and produce a phased cost-reductionplan: top 5 growth drivers, dollar deltas, likely causes, and anexpected-vs-anomalous call for each."Uruchom to w zadaniu Codex Cloud, żeby trzymać analizę z dala od laptopa, albo w rozszerzeniu IDE, żeby wpleść wyniki w zmianę, którą już szkicujesz.
Typowa odpowiedź grupuje wydatki, szereguje czynniki wzrostu i oznacza, który wzrost jest łagodny. Na przykład może zgłosić, że RDS urósł, bo dodano trzy repliki odczytu (spodziewane przy nabieraniu ruchu), podczas gdy 45-procentowy skok w transferze międzyregionalnym nie ma pasującego wdrożenia i wymaga zbadania. Traktuj kwoty w dolarach jako punkt wyjścia — potwierdź je w konsoli dostawcy, zanim zameldujesz finansom, bo pokrycie tagami i granice kont kształtują to, co zwraca API.
Gotowe prompty do wklejenia
Dział zatytułowany „Gotowe prompty do wklejenia”To wielokrotnego użytku przepisy. Nazywają prawdziwe usługi i proszą o opiniotwórcze wyniki, więc działają przy minimalnej edycji — podmień dostawcę albo próg i uruchom.
Alokacja kosztów i prognozowanie
Dział zatytułowany „Alokacja kosztów i prognozowanie”Dwa kolejne zadania dopełniają praktykę FinOps: sprawienie, by wydatki dało się przypisać do zespołów, oraz zamienienie historii w budżet na przyszłość.
-
Zaprojektuj strategię tagowania i alokacji
Poproś asystenta, by przełożył strukturę twojej organizacji na egzekwowalny schemat tagów oraz metodę dzielenia współdzielonych zasobów (bazy danych, load balancery, bramki NAT), których żaden pojedynczy zespół nie posiada.
Using @vantage, design a cost-allocation strategy for an org withproduct teams, shared platform teams, and dev/staging/productionenvironments. Define a required tag set, a fallback for untaggedspend, and a defensible method to split shared-resource costs(by request volume, by CPU/memory share). Flag where allocationwill be approximate so I can set expectations with finance. -
Przenieś historię do budżetu na przyszły rok
Podaj cztery ostatnie kwartały i swoje założenia wzrostu; poproś o prognozę z jawnymi buforami, a nie pojedynczą liczbą.
Using @vantage and @aws-cost-explorer, take our last four quartersof actual spend and build a next-year monthly forecast. Inputs:expected user growth, planned feature launches, and one new region.Output a baseline projection, a growth allowance per team, a bufferfor unplanned cost, and the savings target needed to stay flat.Show the assumptions so I can challenge them. -
Zweryfikuj, zanim się zobowiążesz
Sprawdź wyrywkowo alokację AI względem prawdziwej faktury jednego zespołu i potwierdź, że mnożnik wzrostu z prognozy pasuje do twojego planu produktowego. Oparcie się na względnej historii (“ostatnie cztery kwartały → przyszły rok”) utrzymuje analizę aktualną, zamiast przypinać ją do roku kalendarzowego, który się zdezaktualizuje.
Kiedy to się psuje
Dział zatytułowany „Kiedy to się psuje”Analiza kosztów zawodzi w przewidywalny sposób. Rozpoznawaj te sytuacje wcześnie:
- Błędy uwierzytelniania lub uprawnień MCP. Najczęstszą awarią jest brakujący albo źle nadany token. Vantage potrzebuje
VANTAGE_TOKEN(wystarczy tylko do odczytu); serwer AWS Labs potrzebuje poprawnegoAWS_PROFILEz uprawnieniami IAMce:Get*. Jeśli serwer startuje, ale każde zapytanie zwraca pustkę, prawie na pewno masz lukę w poświadczeniach lub uprawnieniach, a nie problem z kodem. - Opłaty i limity zapytań API Cost Explorera. Każde zapytanie kosztuje $0.01, a API dławi przy gwałtownym obciążeniu. Agent, który rozsiewa setki zapytań o dziennej granularności, może nabić koszt i zacząć się wykładać na błędach throttlingu. Najpierw zawężaj zapytania do granularności miesięcznej i drąż w dzienną tylko tam, gdzie to ma znaczenie.
- Nieaktualne lub brakujące tagi alokacji kosztów. Alokacja i chargeback są tak dokładne, jak twoje tagi. Duży koszyk “untagged” po cichu zniekształca każdą liczbę per-zespół — traktuj pokrycie tagami jako wymóg, a nie miły dodatek.
- Right-sizing, który powoduje throttling. Zmniejszenie instancji, która średnio wygląda na bezczynną, może ją zagłodzić podczas skoków ruchu. Zawsze sprawdzaj szczytowe (nie tylko średnie) wykorzystanie, zmieniaj po jednym poziomie naraz i obserwuj opóźnienia oraz wskaźniki błędów po każdej zmianie.
- Zmyślone nazwy serwerów. Jeśli prompt odwołuje się do serwera, którego nigdy nie skonfigurowałeś (zwykłe binarium
aws-cost-mcp, scope@kubernetes/mcp-server), wywołanie narzędzia po cichu nic nie robi, a AI może wymyślić wiarygodnie wyglądające liczby. Używaj dokładnych kluczy serwerów ze swojej konfiguracji, a dla Kubernetes prawdziwym pakietem jest pozbawiony scope’ukubernetes-mcp-server(npx -y kubernetes-mcp-server@latest).
Co dalej
Dział zatytułowany „Co dalej”- Infrastruktura jako kod z AI — zamień plan right-sizingu w przejrzane zmiany Terraform
- Monitoring i obserwowalność — skoreluj skoki kosztów z wdrożeniami i ruchem, które je wywołały
- Pipeline’y CI/CD — dodaj bramki z szacunkiem kosztów do pull requestów, żeby wydatki były przeglądane, zanim trafią na produkcję
Kluczowe wnioski
Dział zatytułowany „Kluczowe wnioski”- Podłącz prawdziwe serwery MCP. Vantage przez
npxi serwer AWS Labs Cost Explorer przezuvx— konfiguracja jest identyczna w Cursor, Claude Code i Codex. - Zadawaj skupione pytania, a nie “zoptymalizuj wszystko”. Powyższe prompty — top 5, fazowy right-sizing i wykrywanie anomalii — zwracają decyzje, na których da się działać.
- Zawsze weryfikuj, zanim zmienisz produkcję. AI szybko znajduje kandydatów; decyzja należy do ciebie. Sprawdź szczytowe wykorzystanie, potwierdź kwoty w konsoli i obserwuj system po każdej zmianie.
- Pilnuj licznika. Zapytania Cost Explorera kosztują po $0.01, a API ogranicza tempo — zawężaj zapytania i trzymaj serwer poza autonomicznymi pętlami.
- Tagi decydują o wszystkim. Alokacja i prognozowanie są tak wiarygodne, jak pokrycie tagami, więc najpierw to napraw.