Przejdź do głównej zawartości

Zarządzanie kosztami w chmurze i FinOps

Twój rachunek za chmurę skoczył w tym miesiącu o 40%. Dział finansowy chce wyjaśnienia do piątku, inżynieria przysięga, że nic się nie zmieniło, a jedyne, co masz, to dashboard Cost Explorera z 200 pozycjami i bez żadnej historii. Możesz spędzić dwa dni na eksportowaniu CSV-ek i tworzeniu tabel przestawnych w arkuszu — albo skierować asystenta AI na serwer MCP do kosztów i sprawić, by powiedział ci, które pięć usług się ruszyło, o ile i dlaczego.

Ten przewodnik pokazuje praktykom FinOps, inżynierom DevOps i zespołom platformowym, jak połączyć Cursor, Claude Code i Codex z prawdziwymi serwerami MCP do zarządzania kosztami i zamienić surowe dane billingowe w plany right-sizingu, alerty o anomaliach i prognozy, których naprawdę da się bronić podczas przeglądu budżetu.

  • Działającą konfigurację MCP dla Vantage (wielochmurowość) i serwera AWS Labs Cost Explorer, skonfigurowaną identycznie w Cursor, Claude Code i Codex
  • Gotowy do wklejenia prompt, który wydobywa pięć najważniejszych okazji do oszczędności na bieżący miesiąc
  • Prompt do right-sizingu, który zwraca fazowy plan oznaczony poziomami ryzyka, a nie płaską listę instancji
  • Prompt do wykrywania anomalii, który odróżnia spodziewany wzrost od prawdziwego szoku rachunkowego
  • Jasne wyczucie tego, kiedy ten przepływ pracy się psuje — opłaty API, limity zapytań, nieaktualne tagi — i jak się z tego pozbierać

Te serwery udostępniają API billingu i użycia jako narzędzia, które asystent AI może wywoływać bezpośrednio. Konfiguracja jest identyczna w Cursor, Claude Code i Codex — różni się tylko plik, który czyta każde narzędzie (.cursor/mcp.json lub Ustawienia Cursora, .mcp.json dla Claude Code, ~/.codex/config.toml dla Codex). Skonfiguruj te dwa, a pokryjesz większość przypadków wielochmurowych.

Vantage agreguje wydatki z AWS, Azure, GCP, Kubernetes i SaaS za jednym API. Oficjalny serwer MCP działa przez npx i uwierzytelnia się tokenem bearer w trybie tylko do odczytu.

{
"mcpServers": {
"vantage": {
"command": "npx",
"args": ["-y", "vantage-mcp-server"],
"env": {
"VANTAGE_TOKEN": "your-read-only-vantage-token"
}
}
}
}

Wygeneruj token z konta Vantage w sekcji API access i ogranicz go do odczytu — AI nigdy nie potrzebuje dostępu zapisu, by analizować wydatki.

Serwer AWS Labs Cost Explorer to pakiet Pythona dystrybuowany przez PyPI i uruchamiany przez uvx, a nie zwykłe binarium npm. Czyta twoje istniejące poświadczenia AWS przez nazwany profil.

{
"mcpServers": {
"aws-cost-explorer": {
"command": "uvx",
"args": ["awslabs.cost-explorer-mcp-server@latest"],
"env": {
"FASTMCP_LOG_LEVEL": "ERROR",
"AWS_REGION": "us-east-1",
"AWS_PROFILE": "default"
}
}
}
}

Dla Azure i GCP odpowiednikami są @azure/mcp (npx -y @azure/mcp@latest server start) oraz @google-cloud/gcloud-mcp (npx -y @google-cloud/gcloud-mcp), z których każdy czyta swój natywny łańcuch poświadczeń. Dodawaj je tylko wtedy, gdy faktycznie działasz w tych chmurach.

Codex przechowuje serwery MCP w ~/.codex/config.toml, a nie w JSON-ie. Te same dwa serwery wyglądają tak:

[mcp_servers.vantage]
command = "npx"
args = ["-y", "vantage-mcp-server"]
env = { VANTAGE_TOKEN = "your-read-only-vantage-token" }
[mcp_servers.aws-cost-explorer]
command = "uvx"
args = ["awslabs.cost-explorer-mcp-server@latest"]
env = { AWS_REGION = "us-east-1", AWS_PROFILE = "default" }

Przepływ pracy: od szoku rachunkowego do planu, którego da się bronić

Dział zatytułowany „Przepływ pracy: od szoku rachunkowego do planu, którego da się bronić”

Wzorzec jest taki sam niezależnie od narzędzia: podłącz serwer MCP do kosztów, zadaj skupione pytanie, a potem zweryfikuj rekomendację względem rzeczywistego zasobu, zanim zaczniesz działać. AI szybko znajduje kandydatów; to ty bierzesz na siebie decyzję o zmianie w produkcji.

Otwórz panel agenta i odwołaj się do serwerów po nazwie. Cursor trzyma analizę w twoim edytorze, więc możesz wrzucić ustalenia prosto do runbooka albo zmiany w Terraform.

@vantage @aws-cost-explorer Pull last month's spend grouped by
service and linked account. For the five services that grew the
most versus the prior month, tell me the dollar delta, the likely
driver (usage vs. price vs. new resources), and whether the growth
looks expected for a product scaling its user base. Output a table,
then a short prioritized list of what to investigate first.

Cursor zwraca tabelę, nad którą możesz iterować w miejscu — dopytuj o szczegóły, na przykład “drąż dalej w RDS”, bez powtarzania kontekstu.

Typowa odpowiedź grupuje wydatki, szereguje czynniki wzrostu i oznacza, który wzrost jest łagodny. Na przykład może zgłosić, że RDS urósł, bo dodano trzy repliki odczytu (spodziewane przy nabieraniu ruchu), podczas gdy 45-procentowy skok w transferze międzyregionalnym nie ma pasującego wdrożenia i wymaga zbadania. Traktuj kwoty w dolarach jako punkt wyjścia — potwierdź je w konsoli dostawcy, zanim zameldujesz finansom, bo pokrycie tagami i granice kont kształtują to, co zwraca API.

To wielokrotnego użytku przepisy. Nazywają prawdziwe usługi i proszą o opiniotwórcze wyniki, więc działają przy minimalnej edycji — podmień dostawcę albo próg i uruchom.

Dwa kolejne zadania dopełniają praktykę FinOps: sprawienie, by wydatki dało się przypisać do zespołów, oraz zamienienie historii w budżet na przyszłość.

  1. Zaprojektuj strategię tagowania i alokacji

    Poproś asystenta, by przełożył strukturę twojej organizacji na egzekwowalny schemat tagów oraz metodę dzielenia współdzielonych zasobów (bazy danych, load balancery, bramki NAT), których żaden pojedynczy zespół nie posiada.

    Using @vantage, design a cost-allocation strategy for an org with
    product teams, shared platform teams, and dev/staging/production
    environments. Define a required tag set, a fallback for untagged
    spend, and a defensible method to split shared-resource costs
    (by request volume, by CPU/memory share). Flag where allocation
    will be approximate so I can set expectations with finance.
  2. Przenieś historię do budżetu na przyszły rok

    Podaj cztery ostatnie kwartały i swoje założenia wzrostu; poproś o prognozę z jawnymi buforami, a nie pojedynczą liczbą.

    Using @vantage and @aws-cost-explorer, take our last four quarters
    of actual spend and build a next-year monthly forecast. Inputs:
    expected user growth, planned feature launches, and one new region.
    Output a baseline projection, a growth allowance per team, a buffer
    for unplanned cost, and the savings target needed to stay flat.
    Show the assumptions so I can challenge them.
  3. Zweryfikuj, zanim się zobowiążesz

    Sprawdź wyrywkowo alokację AI względem prawdziwej faktury jednego zespołu i potwierdź, że mnożnik wzrostu z prognozy pasuje do twojego planu produktowego. Oparcie się na względnej historii (“ostatnie cztery kwartały → przyszły rok”) utrzymuje analizę aktualną, zamiast przypinać ją do roku kalendarzowego, który się zdezaktualizuje.

Analiza kosztów zawodzi w przewidywalny sposób. Rozpoznawaj te sytuacje wcześnie:

  • Błędy uwierzytelniania lub uprawnień MCP. Najczęstszą awarią jest brakujący albo źle nadany token. Vantage potrzebuje VANTAGE_TOKEN (wystarczy tylko do odczytu); serwer AWS Labs potrzebuje poprawnego AWS_PROFILE z uprawnieniami IAM ce:Get*. Jeśli serwer startuje, ale każde zapytanie zwraca pustkę, prawie na pewno masz lukę w poświadczeniach lub uprawnieniach, a nie problem z kodem.
  • Opłaty i limity zapytań API Cost Explorera. Każde zapytanie kosztuje $0.01, a API dławi przy gwałtownym obciążeniu. Agent, który rozsiewa setki zapytań o dziennej granularności, może nabić koszt i zacząć się wykładać na błędach throttlingu. Najpierw zawężaj zapytania do granularności miesięcznej i drąż w dzienną tylko tam, gdzie to ma znaczenie.
  • Nieaktualne lub brakujące tagi alokacji kosztów. Alokacja i chargeback są tak dokładne, jak twoje tagi. Duży koszyk “untagged” po cichu zniekształca każdą liczbę per-zespół — traktuj pokrycie tagami jako wymóg, a nie miły dodatek.
  • Right-sizing, który powoduje throttling. Zmniejszenie instancji, która średnio wygląda na bezczynną, może ją zagłodzić podczas skoków ruchu. Zawsze sprawdzaj szczytowe (nie tylko średnie) wykorzystanie, zmieniaj po jednym poziomie naraz i obserwuj opóźnienia oraz wskaźniki błędów po każdej zmianie.
  • Zmyślone nazwy serwerów. Jeśli prompt odwołuje się do serwera, którego nigdy nie skonfigurowałeś (zwykłe binarium aws-cost-mcp, scope @kubernetes/mcp-server), wywołanie narzędzia po cichu nic nie robi, a AI może wymyślić wiarygodnie wyglądające liczby. Używaj dokładnych kluczy serwerów ze swojej konfiguracji, a dla Kubernetes prawdziwym pakietem jest pozbawiony scope’u kubernetes-mcp-server (npx -y kubernetes-mcp-server@latest).
  1. Podłącz prawdziwe serwery MCP. Vantage przez npx i serwer AWS Labs Cost Explorer przez uvx — konfiguracja jest identyczna w Cursor, Claude Code i Codex.
  2. Zadawaj skupione pytania, a nie “zoptymalizuj wszystko”. Powyższe prompty — top 5, fazowy right-sizing i wykrywanie anomalii — zwracają decyzje, na których da się działać.
  3. Zawsze weryfikuj, zanim zmienisz produkcję. AI szybko znajduje kandydatów; decyzja należy do ciebie. Sprawdź szczytowe wykorzystanie, potwierdź kwoty w konsoli i obserwuj system po każdej zmianie.
  4. Pilnuj licznika. Zapytania Cost Explorera kosztują po $0.01, a API ogranicza tempo — zawężaj zapytania i trzymaj serwer poza autonomicznymi pętlami.
  5. Tagi decydują o wszystkim. Alokacja i prognozowanie są tak wiarygodne, jak pokrycie tagami, więc najpierw to napraw.