أثبت Foundry Local 1.0 المفهوم: تشغيل نماذج الذكاء الاصطناعي محلياً على Windows وmacOS (Apple Silicon) وLinux x64 مع SDK ودي للمطورين. الإصدار 1.1 يضيف ثلاث قدرات تغطي الكثير من حالات الاستخدام الإنتاجية الحقيقية.
النسخ الصوتي المباشر
أهم ميزة جديدة: بث تحويل الكلام إلى نص في الوقت الفعلي مباشرة من الميكروفون. التعليقات التوضيحية، وواجهات الصوت، ونسخ الاجتماعات، وأدوات إمكانية الوصول — كلها تعمل محلياً دون أي اعتماد على السحابة.
واجهة API مبنية على الجلسات وتبث النتائج فور وصولها، مع علامات is_final للتمييز بين النص المؤقت والنص النهائي. متاحة لجميع روابط اللغات: JavaScript وC# وPython وRust.
قم بتحميل نموذج صوتي للبث من الكتالوج، وأنشئ جلسة بإعدادات الصوت (معدل العينة، القنوات، اللغة)، وابدأها، وادفع أجزاء صوت PCM الخام، واستهلك البث غير المتزامن من النتائج. يحتوي المنشور على أمثلة كاملة بـ Python وC#.
Embeddings النصية
البحث الدلالي، وخطوط أنابيب RAG، والتجميع، ومطابقة التشابه — كل هذه تتطلب embeddings. يضيف Foundry Local 1.1 دعم نماذج embedding حتى تتمكن من إنشاء المتجهات محلياً من نفس SDK دون إرسال البيانات إلى endpoint سحابي.
بالنسبة للتطبيقات التي تهمها إقامة البيانات أو التي تعالج محتوى حساساً، يُعد إنشاء embedding محلياً قدرة ذات معنى.
Responses API
يدعم Foundry Local الآن Responses API — الواجهة المنظمة المصممة للتفاعلات العميلة. هذا يضيف:
- استدعاء الأدوات — اسمح للنماذج التي تعمل محلياً باستدعاء الأدوات التي تحددها
- الإدخال متعدد الوسائط للرؤية واللغة — مرر الصورة + النص إلى النماذج القادرة على الرؤية
- متوافقة مع شكل API القياسي، لذا تعمل الوكلاء الموجودون الذين يستهدفون Responses API الخاصة بـ OpenAI مقابل النماذج المحلية
تحسينات حجم الحزمة
تغييران يقللان من حجم حزمة JavaScript:
- تم استبدال طبقة FFI
koffiبـ addon C مخصص لـ Node-API - يُشحن موفر تنفيذ WebGPU كمكوّن إضافي منفصل، لذا التطبيقات التي لا تحتاج إلى تسريع GPU لا تتحمل تكلفة الحجم
يستهدف C# SDK الآن إصدارات framework أدنى لتحقيق توافق .NET أوسع.
لماذا هذا مهم
القدرات الثلاث معاً — النسخ، وembeddings، واستدعاء الأدوات — تغطي المكونات الأساسية لكثير من تطبيقات الذكاء الاصطناعي. تشغيلها محلياً يعني:
- لا يلزم إنترنت
- لا تكاليف لكل رمز
- لا تغادر البيانات الجهاز
- تأخر ثابت بغض النظر عن ظروف الشبكة
Foundry Local هو الاختيار الصحيح لسيناريوهات الحافة، وأحمال العمل الحساسة للخصوصية، والتطبيقات غير المتصلة بالإنترنت، أو أي شيء تريد فيه تجنب الاعتماد على السحابة أثناء التطوير.
المنشور الأصلي: Foundry Local 1.1: Live Transcription, Embeddings, and Responses API
