<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Local AI | The .NET Blog</title><link>https://thedotnetblog.com/es/tags/local-ai/</link><description>Articles, tutorials and insights from the .NET community.</description><generator>Hugo</generator><language>es</language><managingEditor>@thedotnetblog (The .NET Blog)</managingEditor><webMaster>@thedotnetblog</webMaster><lastBuildDate>Thu, 28 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://thedotnetblog.com/es/tags/local-ai/index.xml" rel="self" type="application/rss+xml"/><item><title>Foundry Local 1.1: Transcripción en Tiempo Real, Embeddings y la API de Respuestas</title><link>https://thedotnetblog.com/es/news/emiliano-montesdeoca/foundry-local-11-transcription-embeddings-responses-api/</link><pubDate>Thu, 28 May 2026 00:00:00 +0000</pubDate><author>Emiliano Montesdeoca</author><guid>https://thedotnetblog.com/es/news/emiliano-montesdeoca/foundry-local-11-transcription-embeddings-responses-api/</guid><description>Foundry Local 1.1 añade transcripción en vivo desde el micrófono, embeddings de texto y soporte para la API de Respuestas — todo ejecutándose localmente sin dependencia de la nube, sin latencia de red, sin coste por token.</description><content:encoded>&lt;p&gt;Foundry Local 1.0 demostró el concepto: ejecutar modelos de IA localmente en Windows, macOS (Apple Silicon) y Linux x64 con un SDK amigable para desarrolladores. La versión 1.1 añade tres capacidades que cubren muchos casos de uso reales en producción.&lt;/p&gt;
&lt;h2 id="transcripción-de-audio-en-vivo"&gt;Transcripción de Audio en Vivo&lt;/h2&gt;
&lt;p&gt;La nueva característica más significativa: streaming de voz a texto en tiempo real directamente desde el micrófono. Subtítulos, interfaces de voz, transcripción de reuniones, herramientas de accesibilidad — todo ejecutándose localmente sin ninguna dependencia de la nube.&lt;/p&gt;
&lt;p&gt;La API es basada en sesiones y transmite resultados a medida que llegan, con marcadores &lt;code&gt;is_final&lt;/code&gt; para distinguir texto intermedio del finalizado. Disponible en todos los bindings de lenguajes: JavaScript, C#, Python y Rust.&lt;/p&gt;
&lt;p&gt;Carga un modelo de voz en streaming del catálogo, crea una sesión con ajustes de audio (frecuencia de muestreo, canales, idioma), iníciala, envía fragmentos de audio PCM sin procesar y consume el stream asíncrono de resultados. El artículo tiene ejemplos completos en Python y C#.&lt;/p&gt;
&lt;h2 id="embeddings-de-texto"&gt;Embeddings de Texto&lt;/h2&gt;
&lt;p&gt;Búsqueda semántica, pipelines RAG, clustering, comparación de similitudes — todo esto requiere embeddings. Foundry Local 1.1 añade soporte para modelos de embeddings para que puedas generar vectores localmente desde el mismo SDK, sin enviar datos a un endpoint en la nube.&lt;/p&gt;
&lt;p&gt;Para aplicaciones donde la residencia de datos importa o donde procesas contenido sensible, la generación local de embeddings es una capacidad significativa.&lt;/p&gt;
&lt;h2 id="api-de-respuestas"&gt;API de Respuestas&lt;/h2&gt;
&lt;p&gt;Foundry Local ahora soporta la &lt;a href="https://platform.openai.com/docs/api-reference/responses"&gt;API de Respuestas&lt;/a&gt; — la interfaz estructurada diseñada para interacciones agénticas. Esto añade:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;Llamada a herramientas&lt;/strong&gt; — permite que los modelos que se ejecutan localmente invoquen herramientas que defines tú&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Entrada multimodal visión-lenguaje&lt;/strong&gt; — pasa imagen + texto a modelos capaces de visión&lt;/li&gt;
&lt;li&gt;Compatible con la forma estándar de la API, por lo que los agentes existentes que apuntan a la API de Respuestas de OpenAI funcionan contra modelos locales&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="mejoras-en-el-tamaño-del-paquete"&gt;Mejoras en el Tamaño del Paquete&lt;/h2&gt;
&lt;p&gt;Dos cambios reducen el tamaño del paquete de JavaScript:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;La capa FFI &lt;code&gt;koffi&lt;/code&gt; ha sido reemplazada por un addon C de Node-API personalizado&lt;/li&gt;
&lt;li&gt;El proveedor de ejecución WebGPU se distribuye como un plugin separado, para que las aplicaciones que no necesitan aceleración por GPU no paguen el coste de tamaño&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;El SDK de C# ahora apunta a versiones de framework inferiores para mayor compatibilidad con .NET.&lt;/p&gt;
&lt;h2 id="por-qué-esto-importa"&gt;Por Qué Esto Importa&lt;/h2&gt;
&lt;p&gt;Las tres capacidades juntas — transcripción, embeddings, llamada a herramientas — cubren los bloques de construcción fundamentales de muchas aplicaciones de IA. Ejecutarlos localmente significa:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Sin internet requerido&lt;/li&gt;
&lt;li&gt;Sin costes por token&lt;/li&gt;
&lt;li&gt;Sin datos que salgan de la máquina&lt;/li&gt;
&lt;li&gt;Latencia consistente independientemente de las condiciones de red&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Foundry Local es la elección correcta para escenarios en el borde, cargas de trabajo sensibles a la privacidad, aplicaciones sin conexión, o cualquier cosa donde quieras evitar la dependencia de la nube durante el desarrollo.&lt;/p&gt;
&lt;p&gt;Post original: &lt;a href="https://devblogs.microsoft.com/foundry/foundry-local-v1-1/"&gt;Foundry Local 1.1: Live Transcription, Embeddings, and Responses API&lt;/a&gt;&lt;/p&gt;</content:encoded></item></channel></rss>