LangChain + Azure Cosmos DB voor agentische apps en RAG

Dit bericht is automatisch vertaald. Klik hier voor de originele versie.

langchain-azure-cosmosdb (pip install langchain-azure-cosmosdb) is een nieuw Python-pakket dat LangChain en LangGraph verbindt met Azure Cosmos DB for NoSQL, en de gebruikelijke 5+ afzonderlijke services voor vectoropslag, caching, geschiedenis en geheugen vervangt door één database.

Zes integraties in één pakket

Het pakket bevat zes integratieklassen (elk met synchrone en asynchrone varianten):

AzureCosmosDBNoSqlVectorSearch — vector-, volledige tekst (BM25)-, hybride (vector+tekst met RRF)- en gewogen hybride zoekopdrachten
AzureCosmosDBNoSqlSemanticCache — LLM-antwoorden cachen om latentie en kosten bij herhaalde zoekopdrachten te verlagen
CosmosDBChatMessageHistory — gespreksgeschiedenis bewaren met TTL-ondersteuning
CosmosDBSaverSync / CosmosDBSaver — LangGraph-checkpointer: bewaart grafieektoestand per thread_id tussen aanroepen
CosmosDBCacheSync / CosmosDBCache — LangGraph-resultaatcaching op knooppuntniveau
CosmosDBStore / AsyncCosmosDBStore — langetermijngeheugen met naamruimte-organisatie en semantisch zoeken

Authenticatie met toegangssleutel en Managed Identity (Entra ID) wordt ondersteund voor alle integraties.

Vector- en hybride zoekopdrachten

Azure Cosmos DB for NoSQL ondersteunt DiskANN- en Quantized Flat-vectorindexen, schaalbaar van duizenden tot miljarden vectoren — dezelfde database die ChatGPT-gespreksgeschiedenissen en -herinneringen bij OpenAI aandrijft. Hybride zoekopdracht instellen:

vectorstore = AzureCosmosDBNoSqlVectorSearch(
    cosmos_client=...,
    embedding=AzureOpenAIEmbeddings(...),
    ...
)
results = vectorstore.similarity_search(
    "distributed database",
    k=5,
    search_type="hybrid",
    full_text_rank_filter=[{"search_field": "text", "search_text": "distributed"}]
)

LangGraph multi-turn agenten met Cosmos checkpointing

De CosmosDBSaverSync-checkpointer bewaart de LangGraph-grafiekstoestand zodat agenten context onthouden tussen afzonderlijke aanroepen — geen in-memory staat vereist:

checkpointer = CosmosDBSaverSync(
    database_name="agents-db",
    container_name="checkpoints",
    endpoint="..."
)
app = graph.compile(checkpointer=checkpointer)

# Beurt 1
app.invoke(
    {"messages": [("user", "Hi, I'm Alice!")]},
    config={"configurable": {"thread_id": "user-123"}}
)

# Beurt 2 — toestand bewaard van beurt 1
app.invoke(
    {"messages": [("user", "What's my name?")]},
    config={"configurable": {"thread_id": "user-123"}}
)
# Geeft terug: "Your name is Alice!"

Één database in plaats van vijf

Alles consolideren in Cosmos DB for NoSQL betekent één verbinding, één set referenties, één schaaldraaiknop en één plek om te kijken als er iets misgaat. Het pakket is beschikbaar op PyPI en de broncode staat op langchain-ai/langchain-azure op GitHub.

Volledige details op devblogs.microsoft.com.