<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>On-Device AI | The .NET Blog</title><link>https://thedotnetblog.com/ru/tags/on-device-ai/</link><description>Articles, tutorials and insights from the .NET community.</description><generator>Hugo</generator><language>ru</language><managingEditor>@thedotnetblog (The .NET Blog)</managingEditor><webMaster>@thedotnetblog</webMaster><lastBuildDate>Thu, 28 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://thedotnetblog.com/ru/tags/on-device-ai/index.xml" rel="self" type="application/rss+xml"/><item><title>Foundry Local 1.1: Транскрипция в реальном времени, Embeddings и Responses API</title><link>https://thedotnetblog.com/ru/news/emiliano-montesdeoca/foundry-local-11-transcription-embeddings-responses-api/</link><pubDate>Thu, 28 May 2026 00:00:00 +0000</pubDate><author>Emiliano Montesdeoca</author><guid>https://thedotnetblog.com/ru/news/emiliano-montesdeoca/foundry-local-11-transcription-embeddings-responses-api/</guid><description>Foundry Local 1.1 добавляет живую транскрипцию с микрофона, text embeddings и поддержку Responses API — всё работает локально без зависимости от облака, без сетевой задержки, без платы за токен.</description><content:encoded>&lt;p&gt;Foundry Local 1.0 доказал концепцию: запускать модели ИИ локально на Windows, macOS (Apple Silicon) и Linux x64 с дружественным для разработчиков SDK. Версия 1.1 добавляет три возможности, покрывающие множество реальных производственных сценариев.&lt;/p&gt;
&lt;h2 id="живая-транскрипция-аудио"&gt;Живая транскрипция аудио&lt;/h2&gt;
&lt;p&gt;Наиболее значимая новая функция: потоковое преобразование речи в текст в реальном времени непосредственно с микрофона. Субтитры, голосовые интерфейсы, транскрипция встреч, инструменты доступности — всё работает локально без каких-либо облачных зависимостей.&lt;/p&gt;
&lt;p&gt;API является сессионным и передаёт результаты по мере их поступления с маркерами &lt;code&gt;is_final&lt;/code&gt; для разграничения промежуточного и финализированного текста. Доступно для всех языковых привязок: JavaScript, C#, Python и Rust.&lt;/p&gt;
&lt;p&gt;Загрузите потоковую речевую модель из каталога, создайте сессию с настройками аудио (частота дискретизации, каналы, язык), запустите её, отправляйте необработанные PCM-аудиочанки и потребляйте асинхронный поток результатов. В статье есть полные примеры на Python и C#.&lt;/p&gt;
&lt;h2 id="text-embeddings"&gt;Text Embeddings&lt;/h2&gt;
&lt;p&gt;Семантический поиск, RAG-пайплайны, кластеризация, сопоставление по схожести — всё это требует embeddings. Foundry Local 1.1 добавляет поддержку embedding-моделей, чтобы генерировать векторы локально из того же SDK без отправки данных на облачный эндпоинт.&lt;/p&gt;
&lt;p&gt;Для приложений, где важна резидентность данных или где обрабатывается чувствительный контент, локальная генерация embeddings является значимой возможностью.&lt;/p&gt;
&lt;h2 id="responses-api"&gt;Responses API&lt;/h2&gt;
&lt;p&gt;Foundry Local теперь поддерживает &lt;a href="https://platform.openai.com/docs/api-reference/responses"&gt;Responses API&lt;/a&gt; — структурированный интерфейс для агентных взаимодействий. Это добавляет:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;Вызов инструментов&lt;/strong&gt; — позволяет локально работающим моделям вызывать инструменты, которые вы определяете&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Мультимодальный ввод vision-language&lt;/strong&gt; — передавайте изображение + текст моделям с поддержкой зрения&lt;/li&gt;
&lt;li&gt;Совместимость со стандартной формой API, поэтому существующие агенты, нацеленные на Responses API OpenAI, работают с локальными моделями&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="улучшения-размера-пакета"&gt;Улучшения размера пакета&lt;/h2&gt;
&lt;p&gt;Два изменения уменьшают размер пакета JavaScript:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Слой FFI &lt;code&gt;koffi&lt;/code&gt; был заменён на пользовательский Node-API C аддон&lt;/li&gt;
&lt;li&gt;Провайдер выполнения WebGPU поставляется как отдельный плагин, так что приложениям без GPU-ускорения не нужно платить за его размер&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;SDK для C# теперь нацелен на более низкие версии фреймворка для более широкой совместимости с .NET.&lt;/p&gt;
&lt;h2 id="почему-это-важно"&gt;Почему это важно&lt;/h2&gt;
&lt;p&gt;Три возможности вместе — транскрипция, embeddings, вызов инструментов — покрывают основные строительные блоки многих приложений ИИ. Запуск их локально означает:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Интернет не требуется&lt;/li&gt;
&lt;li&gt;Нет платы за токены&lt;/li&gt;
&lt;li&gt;Данные не покидают машину&lt;/li&gt;
&lt;li&gt;Стабильная задержка независимо от сетевых условий&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Foundry Local — правильный выбор для edge-сценариев, чувствительных к конфиденциальности рабочих нагрузок, офлайн-приложений или всего, где нужно избежать облачной зависимости во время разработки.&lt;/p&gt;
&lt;p&gt;Оригинальный пост: &lt;a href="https://devblogs.microsoft.com/foundry/foundry-local-v1-1/"&gt;Foundry Local 1.1: Live Transcription, Embeddings, and Responses API&lt;/a&gt;&lt;/p&gt;</content:encoded></item></channel></rss>