أعلنت شركة ميسترال الفرنسية الناشئة عن إطلاق Voxtral، أول نموذج صوتي مفتوح المصدر مصمم لتقديم "ذكاء كلامي عملي" للاستخدامات التجارية.
يمثل Voxtral خيارًا جديدًا للمطورين، حيث يجمع بين كفاءة النماذج المغلقة المصدر وتكلفة النماذج المفتوحة، من دون التنازل عن الجودة، بحسب تقرير نشره موقع "تك كرانش" واطلعت عليه "العربية Business".
وتقول "ميسترال" إن النموذج الجديد يتيح للشركات نسخ وفهم الصوت بكفاءة، وبتكلفة تقل عن نصف سعر النماذج المنافسة مثل "ويسبر" من "OpenAI".
يستطيع Voxtral التعامل مع ما يصل إلى 30 دقيقة من الصوت، بينما يتيح هيكله المعتمد على نموذج "ميسترال سمول 3.1" إمكانية فهم 40 دقيقة، ما يسمح بتحليل المحتوى، تلخيصه، أو حتى تحويل الأوامر الصوتية إلى مهام مباشرة مثل تشغيل واجهات برمجة التطبيقات.
متعدد اللغات ومناسب للجميع
يدعم Voxtral مجموعة واسعة من اللغات، تشمل الإنجليزية، الفرنسية، الإسبانية، الألمانية، البرتغالية، الهولندية، الإيطالية، والهندية، ما يجعله خيارًا مرنًا للشركات متعددة الجنسيات أو التطبيقات العالمية.
تقدم "ميسترال" النموذج الرئيسي Voxtral Small، بقدرة تبلغ 24 مليار معلمة، ليكون منافسًا مباشرًا لـ ElevenLabs Scribe وGemini 2.5 Flash وGPT-4o Mini.
كما توفر نسخة أخف Voxtral Mini، تضم 3 مليارات معلمة، مخصصة للتشغيل المحلي وعلى أطراف الشبكة، إضافة إلى إصدار Voxtral Mini Transcribe المصمم لعمليات النسخ فقط، بكفاءة تفوق "ويسبر" وبسعر منخفض للغاية يبدأ من 0.001 دولار للدقيقة.
التجربة متاحة الآن مجانًا
يمكن للمستخدمين تجربة Voxtral مجانًا عبر منصة Hugging Face أو من خلال روبوت الدردشة الخاص بشركة ميسترال "Le Chat".
كما أعلنت الشركة عن توفر واجهة برمجة التطبيقات الخاصة بها للتكامل في التطبيقات التجارية.
يأتي إطلاق Voxtral بعد شهر واحد فقط من كشف الشركة عن Magistral، سلسلة من النماذج التي تعتمد على الاستدلال لحل المشكلات بدقة متزايدة.
وتؤكد "ميسترال" بذلك موقعها كإحدى الشركات الأوروبية الرائدة في تطوير نماذج الذكاء الاصطناعي مفتوحة المصدر.
يُذكر أن تقارير صحفية حديثة كشفت عن محادثات تجريها "ميسترال" لجمع ما يصل إلى مليار دولار من التمويل، بدعم من مستثمرين بارزين، مثل صندوق "MGX" التابع لأبوظبي.