<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Local AI | The .NET Blog</title><link>https://thedotnetblog.com/de/tags/local-ai/</link><description>Articles, tutorials and insights from the .NET community.</description><generator>Hugo</generator><language>de</language><managingEditor>@thedotnetblog (The .NET Blog)</managingEditor><webMaster>@thedotnetblog</webMaster><lastBuildDate>Thu, 28 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://thedotnetblog.com/de/tags/local-ai/index.xml" rel="self" type="application/rss+xml"/><item><title>Foundry Local 1.1: Echtzeit-Transkription, Embeddings und die Responses API</title><link>https://thedotnetblog.com/de/news/emiliano-montesdeoca/foundry-local-11-transcription-embeddings-responses-api/</link><pubDate>Thu, 28 May 2026 00:00:00 +0000</pubDate><author>Emiliano Montesdeoca</author><guid>https://thedotnetblog.com/de/news/emiliano-montesdeoca/foundry-local-11-transcription-embeddings-responses-api/</guid><description>Foundry Local 1.1 fügt Live-Mikrofon-Transkription, Text-Embeddings und Unterstützung für die Responses API hinzu — alles lokal ausgeführt ohne Cloud-Abhängigkeit, ohne Netzwerklatenz, ohne Kosten pro Token.</description><content:encoded>&lt;p&gt;Foundry Local 1.0 hat das Konzept bewiesen: KI-Modelle lokal auf Windows, macOS (Apple Silicon) und Linux x64 mit einem entwicklerfreundlichen SDK ausführen. Version 1.1 fügt drei Fähigkeiten hinzu, die viele echte Produktionsanwendungsfälle abdecken.&lt;/p&gt;
&lt;h2 id="live-audio-transkription"&gt;Live-Audio-Transkription&lt;/h2&gt;
&lt;p&gt;Die bedeutendste neue Funktion: Echtzeit-Sprache-zu-Text-Streaming direkt vom Mikrofon. Untertitel, Sprach-UIs, Meeting-Transkription, Barrierefreiheitswerkzeuge — alles lokal ohne jede Cloud-Abhängigkeit.&lt;/p&gt;
&lt;p&gt;Die API ist sitzungsbasiert und überträgt Ergebnisse, sobald sie eintreffen, mit &lt;code&gt;is_final&lt;/code&gt;-Markierungen zur Unterscheidung von vorläufigem und finalisiertem Text. Verfügbar für alle Sprachbindungen: JavaScript, C#, Python und Rust.&lt;/p&gt;
&lt;p&gt;Laden Sie ein Streaming-Sprachmodell aus dem Katalog, erstellen Sie eine Sitzung mit Audio-Einstellungen (Abtastrate, Kanäle, Sprache), starten Sie sie, schieben Sie rohe PCM-Audio-Chunks und konsumieren Sie den asynchronen Stream von Ergebnissen. Der Post enthält vollständige Python- und C#-Beispiele.&lt;/p&gt;
&lt;h2 id="text-embeddings"&gt;Text-Embeddings&lt;/h2&gt;
&lt;p&gt;Semantische Suche, RAG-Pipelines, Clustering, Ähnlichkeitsvergleich — all das erfordert Embeddings. Foundry Local 1.1 fügt Unterstützung für Embedding-Modelle hinzu, sodass Sie Vektoren lokal aus demselben SDK generieren können, ohne Daten an einen Cloud-Endpoint zu senden.&lt;/p&gt;
&lt;p&gt;Für Anwendungen, bei denen die Datenresidenz wichtig ist oder bei denen Sie sensible Inhalte verarbeiten, ist die lokale Embedding-Generierung eine bedeutsame Fähigkeit.&lt;/p&gt;
&lt;h2 id="responses-api"&gt;Responses API&lt;/h2&gt;
&lt;p&gt;Foundry Local unterstützt jetzt die &lt;a href="https://platform.openai.com/docs/api-reference/responses"&gt;Responses API&lt;/a&gt; — die strukturierte Schnittstelle für agentische Interaktionen. Dies fügt hinzu:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;Tool-Aufruf&lt;/strong&gt; — lassen Sie lokal ausgeführte Modelle von Ihnen definierte Werkzeuge aufrufen&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Multimodale Vision-Sprach-Eingabe&lt;/strong&gt; — übergeben Sie Bild + Text an vision-fähige Modelle&lt;/li&gt;
&lt;li&gt;Kompatibel mit der Standard-API-Form, sodass vorhandene Agenten, die auf die Responses API von OpenAI abzielen, gegen lokale Modelle funktionieren&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="verbesserungen-der-paketgröße"&gt;Verbesserungen der Paketgröße&lt;/h2&gt;
&lt;p&gt;Zwei Änderungen reduzieren die JavaScript-Paketgröße:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Die &lt;code&gt;koffi&lt;/code&gt;-FFI-Schicht wurde durch ein benutzerdefiniertes Node-API-C-Addon ersetzt&lt;/li&gt;
&lt;li&gt;Der WebGPU-Ausführungsanbieter wird als separates Plugin geliefert, sodass Anwendungen ohne GPU-Beschleunigung keine Größenkosten tragen&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Das C#-SDK zielt jetzt auf niedrigere Framework-Versionen für breitere .NET-Kompatibilität ab.&lt;/p&gt;
&lt;h2 id="warum-das-wichtig-ist"&gt;Warum Das Wichtig Ist&lt;/h2&gt;
&lt;p&gt;Die drei Fähigkeiten zusammen — Transkription, Embeddings, Tool-Aufruf — decken die Kernbausteine vieler KI-Anwendungen ab. Sie lokal auszuführen bedeutet:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Kein Internet erforderlich&lt;/li&gt;
&lt;li&gt;Keine Kosten pro Token&lt;/li&gt;
&lt;li&gt;Keine Daten verlassen die Maschine&lt;/li&gt;
&lt;li&gt;Konsistente Latenz unabhängig von Netzwerkbedingungen&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Foundry Local ist die richtige Wahl für Edge-Szenarien, datenschutzsensible Workloads, Offline-Anwendungen oder alles, wo Sie Cloud-Abhängigkeit während der Entwicklung vermeiden möchten.&lt;/p&gt;
&lt;p&gt;Originalbeitrag: &lt;a href="https://devblogs.microsoft.com/foundry/foundry-local-v1-1/"&gt;Foundry Local 1.1: Live Transcription, Embeddings, and Responses API&lt;/a&gt;&lt;/p&gt;</content:encoded></item></channel></rss>