<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>On-Device AI | The .NET Blog</title><link>https://thedotnetblog.com/fr/tags/on-device-ai/</link><description>Articles, tutorials and insights from the .NET community.</description><generator>Hugo</generator><language>fr</language><managingEditor>@thedotnetblog (The .NET Blog)</managingEditor><webMaster>@thedotnetblog</webMaster><lastBuildDate>Thu, 28 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://thedotnetblog.com/fr/tags/on-device-ai/index.xml" rel="self" type="application/rss+xml"/><item><title>Foundry Local 1.1 : Transcription en Temps Réel, Embeddings et l'API de Réponses</title><link>https://thedotnetblog.com/fr/news/emiliano-montesdeoca/foundry-local-11-transcription-embeddings-responses-api/</link><pubDate>Thu, 28 May 2026 00:00:00 +0000</pubDate><author>Emiliano Montesdeoca</author><guid>https://thedotnetblog.com/fr/news/emiliano-montesdeoca/foundry-local-11-transcription-embeddings-responses-api/</guid><description>Foundry Local 1.1 ajoute la transcription en direct depuis le microphone, les embeddings de texte et le support de l'API de Réponses — tout s'exécutant localement sans dépendance cloud, sans latence réseau, sans coût par token.</description><content:encoded>&lt;p&gt;Foundry Local 1.0 a prouvé le concept : exécuter des modèles d&amp;rsquo;IA localement sur Windows, macOS (Apple Silicon) et Linux x64 avec un SDK adapté aux développeurs. La version 1.1 ajoute trois capacités qui couvrent de nombreux cas d&amp;rsquo;usage réels en production.&lt;/p&gt;
&lt;h2 id="transcription-audio-en-direct"&gt;Transcription Audio en Direct&lt;/h2&gt;
&lt;p&gt;La nouvelle fonctionnalité la plus significative : le streaming de parole en texte en temps réel directement depuis le microphone. Sous-titres, interfaces vocales, transcription de réunions, outils d&amp;rsquo;accessibilité — tout s&amp;rsquo;exécutant localement sans aucune dépendance cloud.&lt;/p&gt;
&lt;p&gt;L&amp;rsquo;API est basée sur des sessions et transmet les résultats au fur et à mesure qu&amp;rsquo;ils arrivent, avec des marqueurs &lt;code&gt;is_final&lt;/code&gt; pour distinguer le texte intermédiaire du texte finalisé. Disponible pour toutes les liaisons de langages : JavaScript, C#, Python et Rust.&lt;/p&gt;
&lt;p&gt;Chargez un modèle de parole en streaming depuis le catalogue, créez une session avec les paramètres audio (fréquence d&amp;rsquo;échantillonnage, canaux, langue), lancez-la, poussez des blocs audio PCM bruts et consommez le flux asynchrone de résultats. Le post contient des exemples complets en Python et C#.&lt;/p&gt;
&lt;h2 id="embeddings-de-texte"&gt;Embeddings de Texte&lt;/h2&gt;
&lt;p&gt;Recherche sémantique, pipelines RAG, clustering, correspondance de similarité — tout cela nécessite des embeddings. Foundry Local 1.1 ajoute le support des modèles d&amp;rsquo;embedding pour générer des vecteurs localement depuis le même SDK, sans envoyer de données vers un endpoint cloud.&lt;/p&gt;
&lt;p&gt;Pour les applications où la résidence des données est importante ou où vous traitez du contenu sensible, la génération locale d&amp;rsquo;embeddings est une capacité significative.&lt;/p&gt;
&lt;h2 id="api-de-réponses"&gt;API de Réponses&lt;/h2&gt;
&lt;p&gt;Foundry Local prend maintenant en charge l&amp;rsquo;&lt;a href="https://platform.openai.com/docs/api-reference/responses"&gt;API de Réponses&lt;/a&gt; — l&amp;rsquo;interface structurée conçue pour les interactions agentiques. Cela ajoute :&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;Appel d&amp;rsquo;outils&lt;/strong&gt; — laissez les modèles s&amp;rsquo;exécutant localement invoquer des outils que vous définissez&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Entrée multimodale vision-langage&lt;/strong&gt; — passez image + texte à des modèles capables de vision&lt;/li&gt;
&lt;li&gt;Compatible avec la forme d&amp;rsquo;API standard, donc les agents existants ciblant l&amp;rsquo;API de Réponses d&amp;rsquo;OpenAI fonctionnent contre des modèles locaux&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="améliorations-de-la-taille-du-paquet"&gt;Améliorations de la Taille du Paquet&lt;/h2&gt;
&lt;p&gt;Deux changements réduisent la taille du paquet JavaScript :&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;La couche FFI &lt;code&gt;koffi&lt;/code&gt; a été remplacée par un addon C Node-API personnalisé&lt;/li&gt;
&lt;li&gt;Le fournisseur d&amp;rsquo;exécution WebGPU est livré comme plugin séparé, donc les applications qui n&amp;rsquo;ont pas besoin d&amp;rsquo;accélération GPU ne paient pas le coût de taille&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Le SDK C# cible maintenant des versions de framework inférieures pour une compatibilité .NET plus large.&lt;/p&gt;
&lt;h2 id="pourquoi-cest-important"&gt;Pourquoi C&amp;rsquo;est Important&lt;/h2&gt;
&lt;p&gt;Les trois capacités ensemble — transcription, embeddings, appel d&amp;rsquo;outils — couvrent les blocs de construction essentiels de nombreuses applications d&amp;rsquo;IA. Les exécuter localement signifie :&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Pas d&amp;rsquo;internet requis&lt;/li&gt;
&lt;li&gt;Pas de coûts par token&lt;/li&gt;
&lt;li&gt;Aucune donnée ne quitte la machine&lt;/li&gt;
&lt;li&gt;Latence constante quelles que soient les conditions réseau&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Foundry Local est le bon choix pour les scénarios en périphérie, les charges de travail sensibles à la vie privée, les applications hors ligne, ou tout ce où vous voulez éviter la dépendance cloud pendant le développement.&lt;/p&gt;
&lt;p&gt;Post original : &lt;a href="https://devblogs.microsoft.com/foundry/foundry-local-v1-1/"&gt;Foundry Local 1.1: Live Transcription, Embeddings, and Responses API&lt;/a&gt;&lt;/p&gt;</content:encoded></item></channel></rss>