Een agent lokaal laten werken is het leuke deel. Het lastige deel is alles wat daarna komt: het deployen zonder uw verstand te verliezen, sessies beheren, identiteit instellen, observabiliteit aansluiten. Dat betekent gewoonlijk veel aangepaste infrastructuurlijm.
Foundry Hosted Agents heeft het grootste deel van die lijm net verwijderd voor gebruikers van Microsoft Agent Framework (MAF).
Wat Foundry Hosted Agents Werkelijk Doet
Wanneer u een MAF-agent deployt naar Foundry Hosted Agents, verwerkt het platform een verrassend lange lijst van dingen die u anders zelf zou moeten bouwen:
- Schalen naar nul — uw agent kost niets in idle en start automatisch opnieuw op
- Per-sessie VM-geïsoleerde sandboxen — elke gebruikerssessie krijgt zijn eigen sandbox met bestandssysteempersistentie die scale-down-gebeurtenissen overleeft
- Ingebouwde Entra ID — elke agent krijgt zijn eigen identiteit om Foundry-modellen, Toolbox en Azure-services aan te roepen zonder geheimen in de image
- Versioned deployments — elke deployment is een onveranderlijke snapshot, met ondersteuning voor blue/green en canary-uitrol
- Observabiliteit zonder configuratie —
APPLICATIONINSIGHTS_CONNECTION_STRINGwordt bij runtime geïnjecteerd zodat MAF’s OpenTelemetry-traces automatisch naar App Insights vloeien
Die laatste is echt fijn. Geen extra bedrading, geen extra configuratie. Traces verschijnen gewoon.
Het Codeverschil Is Minimaal
Dit is wat ik het meest waardeer aan deze integratie. U herschrijft uw agent niet. U omhult hem gewoon:
In .NET:
using Microsoft.Agents.AI.Foundry.Hosting;
var builder = WebApplication.CreateBuilder(args);
builder.Services.AddFoundryResponses(agent);
var app = builder.Build();
app.MapFoundryResponses();
app.Run();
In Python:
server = ResponsesHostServer(agent)
server.run()
Dat is alles. Dezelfde logica die u lokaal testte, is wat in productie draait. Het platform omhult het met sessiebeheers-, identiteits- en schalinginfrastructuur.
Twee Protocollen, Één Agent
Hosted Agents ondersteunen twee endpoint-stijlen:
- Responses (
/responses) — OpenAI-compatibel, beheert gespreksgeschiedenis en streaming. Goed standaard voor chat-achtige agents. - Invocations (
/invocations) — u definieert het verzoek/antwoord-schema. Goed voor niet-conversationele workflows.
Als u iets bouwt dat eruit ziet als een gesprek, begin dan met Responses. Als u een API-achtige agent bouwt die gestructureerde invoer neemt en gestructureerde uitvoer retourneert, geeft Invocations u de flexibiliteit.
De Deployment-flow met azd
Wanneer u azd up uitvoert met een MAF-agent:
- Maakt optioneel een Foundry-project en deployt een model
- Pakt uw code en pusht een image naar Azure Container Registry
- Voorziet compute vanuit de ACR-image
- Wijst een toegewijd Entra ID toe aan de agent
- Stelt een stabiel endpoint bloot (
https://{project_endpoint}/agents/{agent_name}) - Verwerkt al het andere vanaf dat punt
Sessies blijven tot 30 dagen bestaan. Idle compute wordt na 15 minuten gede-provisioneerd en transparant hersteld bij het volgende verzoek. Vanuit het perspectief van de agent is er niets veranderd.
Afsluiting
De afstand tussen “lokaal werkend” en “in productie draaiend” was historisch lang en pijnlijk voor AI-agents. Foundry Hosted Agents + MAF verkleint die kloof aanzienlijk. Als u al een lokale agent heeft gebouwd met Agent Framework, is dit het proberen waard vandaag.
Het team zegt dat GA binnenkort komt — dit is momenteel in preview. Bekijk de MAF Hosted Agent integratie-documentatie en de .NET-voorbeelden om te beginnen.
Origineel artikel: From Local to Production: Deploy Your Microsoft Agent Framework Agent with Foundry Hosted Agents
