
Dostat AI agenta z prototypu (kde si hrajeme s prompty) do ostrého provozu je disciplína sama o sobě. Zatímco u chatbota nás výpadek spojení mrzí, u dlouhoběžících agentů, kteří zpracovávají data několik týdnů, je jakékoli přerušení kritické.
Jak tedy postavit systém, který nespadne jen proto, že se restartoval server nebo vypršel časový limit API?
V cloudovém prostředí platí pravidlo: Počítejte s tím, že všechno dříve či později selže. U agentů to platí dvojnásob. Pokud má agent na starost proces, který trvá měsíc (například čekání na schválení faktury nebo doručení podkladů), nemůžeme ho držet aktivního celou dobu v paměti. To by bylo neudržitelné a drahé.
Moderní agentní platformy proto využívají princip orchestrace a persistence:
Dát agentovi přímý přístup k vašemu hlavnímu API klíči od OpenAI nebo Anthropicu je bezpečnostní noční můra. Pokud by došlo k úniku, útočník má otevřené dveře k vašemu rozpočtu i datům.
Řešením je LLM Gateway a koncept virtuálních klíčů:
Aby se vývoj agentů nezvrhl v chaos, využívá se koncept blueprintu (šablony). Agent je definován strukturovaně (např. v JSON), což zahrnuje jeho instrukce, dostupné nástroje a bezpečnostní limity. Tento přístup umožňuje agenty snadno verzovat (jako běžný kód) a nasazovat v různých prostředích (SaaS, on-prem, hybrid) s jistotou, že se budou chovat predikovatelně.
Tento článek čerpá z diskuse na našem nedávném webináři. Rozebírali jsme v něm nejen LLM Gateway a orchestraci, ale také konkrétní ukázky toho, jak vypadá blueprint agenta a jak se nastavují automatizované testy v sandboxovém prostředí.