<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Local AI | The .NET Blog</title><link>https://thedotnetblog.com/hi/tags/local-ai/</link><description>Articles, tutorials and insights from the .NET community.</description><generator>Hugo</generator><language>hi</language><managingEditor>@thedotnetblog (The .NET Blog)</managingEditor><webMaster>@thedotnetblog</webMaster><lastBuildDate>Thu, 28 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://thedotnetblog.com/hi/tags/local-ai/index.xml" rel="self" type="application/rss+xml"/><item><title>Foundry Local 1.1: रीयल-टाइम ट्रांसक्रिप्शन, Embeddings और Responses API</title><link>https://thedotnetblog.com/hi/news/emiliano-montesdeoca/foundry-local-11-transcription-embeddings-responses-api/</link><pubDate>Thu, 28 May 2026 00:00:00 +0000</pubDate><author>Emiliano Montesdeoca</author><guid>https://thedotnetblog.com/hi/news/emiliano-montesdeoca/foundry-local-11-transcription-embeddings-responses-api/</guid><description>Foundry Local 1.1 लाइव माइक्रोफोन ट्रांसक्रिप्शन, टेक्स्ट embeddings और Responses API सपोर्ट जोड़ता है — सब कुछ बिना क्लाउड डिपेंडेंसी, नेटवर्क लेटेंसी, प्रति-टोकन लागत के लोकल में चलता है।</description><content:encoded>&lt;p&gt;Foundry Local 1.0 ने कॉन्सेप्ट साबित किया: एक डेवलपर-फ्रेंडली SDK के साथ Windows, macOS (Apple Silicon) और Linux x64 पर AI मॉडल लोकल में चलाना। वर्शन 1.1 तीन क्षमताएं जोड़ता है जो कई वास्तविक प्रोडक्शन यूज़ केस को कवर करती हैं।&lt;/p&gt;
&lt;h2 id="लइव-ऑडय-टरसकरपशन"&gt;लाइव ऑडियो ट्रांसक्रिप्शन&lt;/h2&gt;
&lt;p&gt;सबसे महत्वपूर्ण नई फीचर: माइक्रोफोन से सीधे रीयल-टाइम स्पीच-टू-टेक्स्ट स्ट्रीमिंग। कैप्शन, वॉइस UI, मीटिंग ट्रांसक्रिप्शन, एक्सेसिबिलिटी टूल — सब कुछ बिना किसी क्लाउड डिपेंडेंसी के लोकल में चलता है।&lt;/p&gt;
&lt;p&gt;API सेशन-बेस्ड है और रिज़ल्ट आते ही स्ट्रीम करती है, &lt;code&gt;is_final&lt;/code&gt; मार्कर के साथ अंतिम और अस्थायी टेक्स्ट में अंतर करने के लिए। JavaScript, C#, Python और Rust सहित सभी लैंग्वेज बाइंडिंग में उपलब्ध है।&lt;/p&gt;
&lt;p&gt;कैटलॉग से एक स्ट्रीमिंग स्पीच मॉडल लोड करें, ऑडियो सेटिंग्स (सैंपल रेट, चैनल, भाषा) के साथ सेशन बनाएं, इसे शुरू करें, रॉ PCM ऑडियो चंक्स पुश करें, और रिज़ल्ट का async स्ट्रीम उपभोग करें। पोस्ट में Python और C# के पूरे उदाहरण हैं।&lt;/p&gt;
&lt;h2 id="टकसट-embeddings"&gt;टेक्स्ट Embeddings&lt;/h2&gt;
&lt;p&gt;सिमेंटिक सर्च, RAG पाइपलाइन, क्लस्टरिंग, सिमिलरिटी मैचिंग — इन सभी को embeddings की जरूरत है। Foundry Local 1.1 embedding मॉडल सपोर्ट जोड़ता है ताकि आप उसी SDK से लोकल में वेक्टर जेनरेट कर सकें, बिना क्लाउड एंडपॉइंट को डेटा भेजे।&lt;/p&gt;
&lt;p&gt;उन एप्लिकेशन के लिए जहां डेटा रेसिडेंसी मायने रखती है या जहां आप संवेदनशील कंटेंट प्रोसेस करते हैं, लोकल embedding जेनरेशन एक महत्वपूर्ण क्षमता है।&lt;/p&gt;
&lt;h2 id="responses-api"&gt;Responses API&lt;/h2&gt;
&lt;p&gt;Foundry Local अब &lt;a href="https://platform.openai.com/docs/api-reference/responses"&gt;Responses API&lt;/a&gt; — एजेंटिक इंटरैक्शन के लिए डिज़ाइन किया गया स्ट्रक्चर्ड इंटरफेस — को सपोर्ट करता है। इससे जुड़ता है:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;Tool calling&lt;/strong&gt; — लोकल में चल रहे मॉडल को आपके परिभाषित टूल्स इनवोक करने दें&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;मल्टीमोडल विज़न-लैंग्वेज इनपुट&lt;/strong&gt; — विज़न-सक्षम मॉडल को इमेज + टेक्स्ट पास करें&lt;/li&gt;
&lt;li&gt;स्टैंडर्ड API शेप के साथ कंपैटिबल, इसलिए OpenAI के Responses API को टार्गेट करने वाले मौजूदा agents लोकल मॉडल के साथ काम करते हैं&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id="पकज-सइज-म-सधर"&gt;पैकेज साइज़ में सुधार&lt;/h2&gt;
&lt;p&gt;दो बदलाव JavaScript पैकेज साइज़ को कम करते हैं:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;koffi&lt;/code&gt; FFI लेयर को कस्टम Node-API C addon से बदला गया है&lt;/li&gt;
&lt;li&gt;WebGPU execution provider एक अलग प्लगइन के रूप में शिप होता है, इसलिए GPU acceleration की जरूरत नहीं रखने वाले एप्लिकेशन साइज़ कोस्ट नहीं चुकाते&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;C# SDK अब अधिक .NET कंपैटिबिलिटी के लिए लोअर फ्रेमवर्क वर्शन को टार्गेट करता है।&lt;/p&gt;
&lt;h2 id="यह-कय-मयन-रखत-ह"&gt;यह क्यों मायने रखता है&lt;/h2&gt;
&lt;p&gt;तीनों क्षमताएं — ट्रांसक्रिप्शन, embeddings, tool calling — मिलकर कई AI एप्लिकेशन के कोर बिल्डिंग ब्लॉक को कवर करती हैं। उन्हें लोकल में चलाने का मतलब है:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;कोई इंटरनेट जरूरी नहीं&lt;/li&gt;
&lt;li&gt;कोई प्रति-टोकन लागत नहीं&lt;/li&gt;
&lt;li&gt;कोई डेटा मशीन नहीं छोड़ता&lt;/li&gt;
&lt;li&gt;नेटवर्क स्थितियों की परवाह किए बिना लगातार लेटेंसी&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Foundry Local एज परिदृश्यों, प्राइवेसी-संवेदनशील वर्कलोड, ऑफलाइन एप्लिकेशन, या डेवलपमेंट के दौरान क्लाउड डिपेंडेंसी से बचने के लिए सही विकल्प है।&lt;/p&gt;
&lt;p&gt;ओरिजिनल पोस्ट: &lt;a href="https://devblogs.microsoft.com/foundry/foundry-local-v1-1/"&gt;Foundry Local 1.1: Live Transcription, Embeddings, and Responses API&lt;/a&gt;&lt;/p&gt;</content:encoded></item></channel></rss>