<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>On-Device AI | The .NET Blog</title><link>https://thedotnetblog.com/pt/tags/on-device-ai/</link><description>Articles, tutorials and insights from the .NET community.</description><generator>Hugo</generator><language>pt</language><managingEditor>@thedotnetblog (The .NET Blog)</managingEditor><webMaster>@thedotnetblog</webMaster><lastBuildDate>Thu, 28 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://thedotnetblog.com/pt/tags/on-device-ai/index.xml" rel="self" type="application/rss+xml"/><item><title>Foundry Local 1.1: Transcrição em Tempo Real, Embeddings e a API de Respostas</title><link>https://thedotnetblog.com/pt/news/emiliano-montesdeoca/foundry-local-11-transcription-embeddings-responses-api/</link><pubDate>Thu, 28 May 2026 00:00:00 +0000</pubDate><author>Emiliano Montesdeoca</author><guid>https://thedotnetblog.com/pt/news/emiliano-montesdeoca/foundry-local-11-transcription-embeddings-responses-api/</guid><description>Foundry Local 1.1 adiciona transcrição ao vivo do microfone, embeddings de texto e suporte à API de Respostas — tudo a correr localmente sem dependência da cloud, sem latência de rede, sem custo por token.</description><content:encoded>&lt;p&gt;Foundry Local 1.0 provou o conceito: executar modelos de IA localmente no Windows, macOS (Apple Silicon) e Linux x64 com um SDK amigável para desenvolvedores. A versão 1.1 adiciona três capacidades que cobrem muitos casos de uso reais em produção.&lt;/p&gt;
&lt;h2 id="transcrição-de-áudio-em-directo"&gt;Transcrição de Áudio em Directo&lt;/h2&gt;
&lt;p&gt;A nova funcionalidade mais significativa: streaming de voz para texto em tempo real diretamente do microfone. Legendas, interfaces de voz, transcrição de reuniões, ferramentas de acessibilidade — tudo a correr localmente sem qualquer dependência da cloud.&lt;/p&gt;
&lt;p&gt;A API é baseada em sessões e transmite resultados à medida que chegam, com marcadores &lt;code&gt;is_final&lt;/code&gt; para distinguir texto intermédio do finalizado. Disponível para todos os bindings de linguagem: JavaScript, C#, Python e Rust.&lt;/p&gt;
&lt;p&gt;Carrega um modelo de voz em streaming do catálogo, cria uma sessão com definições de áudio (frequência de amostragem, canais, idioma), inicia-a, envia blocos de áudio PCM em bruto e consome o stream assíncrono de resultados. O post tem exemplos completos em Python e C#.&lt;/p&gt;
&lt;h2 id="embeddings-de-texto"&gt;Embeddings de Texto&lt;/h2&gt;
&lt;p&gt;Pesquisa semântica, pipelines RAG, clustering, correspondência de similaridade — tudo isto requer embeddings. Foundry Local 1.1 adiciona suporte para modelos de embedding para que possas gerar vetores localmente a partir do mesmo SDK, sem enviar dados para um endpoint na cloud.&lt;/p&gt;
&lt;p&gt;Para aplicações onde a residência de dados é importante ou onde processas conteúdo sensível, a geração local de embeddings é uma capacidade significativa.&lt;/p&gt;
&lt;h2 id="api-de-respostas"&gt;API de Respostas&lt;/h2&gt;
&lt;p&gt;O Foundry Local suporta agora a &lt;a href="https://platform.openai.com/docs/api-reference/responses"&gt;API de Respostas&lt;/a&gt; — a interface estruturada concebida para interações agênticas. Isto adiciona:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;Chamada de ferramentas&lt;/strong&gt; — permite que modelos a correr localmente invoquem ferramentas que defines&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Entrada multimodal visão-linguagem&lt;/strong&gt; — passa imagem + texto a modelos com capacidade de visão&lt;/li&gt;
&lt;li&gt;Compatível com a forma padrão de API, pelo que agentes existentes que apontam para a API de Respostas da OpenAI funcionam contra modelos locais&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="melhorias-no-tamanho-do-pacote"&gt;Melhorias no Tamanho do Pacote&lt;/h2&gt;
&lt;p&gt;Duas alterações reduzem o tamanho do pacote JavaScript:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;A camada FFI &lt;code&gt;koffi&lt;/code&gt; foi substituída por um addon C Node-API personalizado&lt;/li&gt;
&lt;li&gt;O fornecedor de execução WebGPU é distribuído como plugin separado, pelo que as aplicações que não precisam de aceleração GPU não pagam o custo de tamanho&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;O SDK C# agora aponta para versões de framework inferiores para compatibilidade .NET mais ampla.&lt;/p&gt;
&lt;h2 id="por-que-importa"&gt;Por Que Importa&lt;/h2&gt;
&lt;p&gt;As três capacidades juntas — transcrição, embeddings, chamada de ferramentas — cobrem os blocos de construção fundamentais de muitas aplicações de IA. Executá-los localmente significa:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Sem internet necessária&lt;/li&gt;
&lt;li&gt;Sem custos por token&lt;/li&gt;
&lt;li&gt;Sem dados a sair da máquina&lt;/li&gt;
&lt;li&gt;Latência consistente independentemente das condições de rede&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Foundry Local é a escolha certa para cenários de edge, cargas de trabalho sensíveis à privacidade, aplicações offline, ou qualquer coisa onde se queira evitar a dependência da cloud durante o desenvolvimento.&lt;/p&gt;
&lt;p&gt;Post original: &lt;a href="https://devblogs.microsoft.com/foundry/foundry-local-v1-1/"&gt;Foundry Local 1.1: Live Transcription, Embeddings, and Responses API&lt;/a&gt;&lt;/p&gt;</content:encoded></item></channel></rss>