<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Local AI | The .NET Blog</title><link>https://thedotnetblog.com/it/tags/local-ai/</link><description>Articles, tutorials and insights from the .NET community.</description><generator>Hugo</generator><language>it</language><managingEditor>@thedotnetblog (The .NET Blog)</managingEditor><webMaster>@thedotnetblog</webMaster><lastBuildDate>Thu, 28 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://thedotnetblog.com/it/tags/local-ai/index.xml" rel="self" type="application/rss+xml"/><item><title>Foundry Local 1.1: Trascrizione in Tempo Reale, Embeddings e l'API di Risposta</title><link>https://thedotnetblog.com/it/news/emiliano-montesdeoca/foundry-local-11-transcription-embeddings-responses-api/</link><pubDate>Thu, 28 May 2026 00:00:00 +0000</pubDate><author>Emiliano Montesdeoca</author><guid>https://thedotnetblog.com/it/news/emiliano-montesdeoca/foundry-local-11-transcription-embeddings-responses-api/</guid><description>Foundry Local 1.1 aggiunge la trascrizione live dal microfono, gli embeddings di testo e il supporto per l'API di Risposta — tutto in esecuzione locale senza dipendenza dal cloud, senza latenza di rete, senza costi per token.</description><content:encoded>&lt;p&gt;Foundry Local 1.0 ha dimostrato il concetto: eseguire modelli di IA localmente su Windows, macOS (Apple Silicon) e Linux x64 con un SDK adatto agli sviluppatori. La versione 1.1 aggiunge tre funzionalità che coprono molti casi d&amp;rsquo;uso reali in produzione.&lt;/p&gt;
&lt;h2 id="trascrizione-audio-in-diretta"&gt;Trascrizione Audio in Diretta&lt;/h2&gt;
&lt;p&gt;La nuova funzionalità più significativa: streaming di riconoscimento vocale in tempo reale direttamente dal microfono. Sottotitoli, interfacce vocali, trascrizione di riunioni, strumenti di accessibilità — tutto eseguito localmente senza alcuna dipendenza dal cloud.&lt;/p&gt;
&lt;p&gt;L&amp;rsquo;API è basata su sessioni e trasmette i risultati man mano che arrivano, con marcatori &lt;code&gt;is_final&lt;/code&gt; per distinguere il testo intermedio da quello finalizzato. Disponibile per tutti i binding linguistici: JavaScript, C#, Python e Rust.&lt;/p&gt;
&lt;p&gt;Carica un modello vocale in streaming dal catalogo, crea una sessione con le impostazioni audio (frequenza di campionamento, canali, lingua), avviala, invia blocchi audio PCM grezzi e consuma lo stream asincrono di risultati. Il post contiene esempi completi in Python e C#.&lt;/p&gt;
&lt;h2 id="embeddings-di-testo"&gt;Embeddings di Testo&lt;/h2&gt;
&lt;p&gt;Ricerca semantica, pipeline RAG, clustering, corrispondenza di similarità — tutto questo richiede embeddings. Foundry Local 1.1 aggiunge il supporto per i modelli di embedding così da poter generare vettori localmente dallo stesso SDK, senza inviare dati a un endpoint cloud.&lt;/p&gt;
&lt;p&gt;Per le applicazioni in cui la residenza dei dati è importante o dove si elabora contenuto sensibile, la generazione locale di embeddings è una capacità significativa.&lt;/p&gt;
&lt;h2 id="api-di-risposta"&gt;API di Risposta&lt;/h2&gt;
&lt;p&gt;Foundry Local supporta ora la &lt;a href="https://platform.openai.com/docs/api-reference/responses"&gt;API di Risposta&lt;/a&gt; — l&amp;rsquo;interfaccia strutturata progettata per le interazioni agentiche. Questo aggiunge:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;Chiamata agli strumenti&lt;/strong&gt; — consente ai modelli in esecuzione locale di invocare strumenti che definisci tu&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Input multimodale visione-linguaggio&lt;/strong&gt; — passa immagine + testo a modelli capaci di visione&lt;/li&gt;
&lt;li&gt;Compatibile con la forma API standard, quindi gli agenti esistenti che puntano all&amp;rsquo;API di Risposta di OpenAI funzionano contro modelli locali&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="miglioramenti-alle-dimensioni-del-pacchetto"&gt;Miglioramenti alle Dimensioni del Pacchetto&lt;/h2&gt;
&lt;p&gt;Due modifiche riducono la dimensione del pacchetto JavaScript:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Il layer FFI &lt;code&gt;koffi&lt;/code&gt; è stato sostituito con un addon C Node-API personalizzato&lt;/li&gt;
&lt;li&gt;Il provider di esecuzione WebGPU viene distribuito come plugin separato, così le applicazioni che non necessitano di accelerazione GPU non ne pagano il costo in termini di dimensioni&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;L&amp;rsquo;SDK C# ora punta a versioni di framework inferiori per una compatibilità .NET più ampia.&lt;/p&gt;
&lt;h2 id="perché-è-importante"&gt;Perché È Importante&lt;/h2&gt;
&lt;p&gt;Le tre funzionalità insieme — trascrizione, embeddings, chiamata agli strumenti — coprono i blocchi di costruzione fondamentali di molte applicazioni di IA. Eseguirli localmente significa:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Nessun internet richiesto&lt;/li&gt;
&lt;li&gt;Nessun costo per token&lt;/li&gt;
&lt;li&gt;Nessun dato lascia la macchina&lt;/li&gt;
&lt;li&gt;Latenza costante indipendentemente dalle condizioni di rete&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Foundry Local è la scelta giusta per scenari edge, carichi di lavoro sensibili alla privacy, applicazioni offline, o qualsiasi cosa in cui si voglia evitare la dipendenza dal cloud durante lo sviluppo.&lt;/p&gt;
&lt;p&gt;Post originale: &lt;a href="https://devblogs.microsoft.com/foundry/foundry-local-v1-1/"&gt;Foundry Local 1.1: Live Transcription, Embeddings, and Responses API&lt;/a&gt;&lt;/p&gt;</content:encoded></item></channel></rss>