Mistral ने ओपन सोर्स में वापसी की: लैपटॉप के लिए उच्च प्रदर्शन AI मॉडल Devstral का अनावरण किया
Mistral ने अत्यधिक कुशल AI मॉडल Devstral के लॉन्च के साथ ओपन-सोर्स समुदाय में वापसी की
एक महत्वपूर्ण कदम में, फ्रांसीसी AI मॉडल निर्माता Mistral ने अपने नवीनतम बंद-स्रोत मॉडल, Medium3, के संबंध में समुदाय के कुछ हिस्सों से आलोचना के बाद ओपन-सोर्स क्षेत्र में वापसी की है। कंपनी ने ओपन-सोर्स स्टार्टअप All Hands AI के साथ साझेदारी की है, जो OpenDevin के निर्माता हैं, एक नया ओपन-सोर्स भाषा मॉडल Devstral पेश करने के लिए। यह हल्का मॉडल, जिसमें 24 मिलियन पैरामीटर हैं, विशेष रूप से AI सॉफ़्टवेयर विकास के लिए डिज़ाइन किया गया है और कुछ बेंचमार्क परीक्षणों में कई प्रतिस्पर्धियों को पार करने का प्रदर्शन किया है जिनमें अरबों पैरामीटर हैं।
पारंपरिक बड़े भाषा मॉडल (LLMs) के विपरीत जो मुख्य रूप से कोड पूर्णता या स्वतंत्र कार्यों को उत्पन्न करने पर ध्यान केंद्रित करते हैं, Devstral को एक समग्र सॉफ़्टवेयर इंजीनियरिंग एजेंट के रूप में कार्य करने के लिए अनुकूलित किया गया है। यह क्षमता इसे फ़ाइलों के बीच संदर्भ को समझने, बड़े कोडबेस को नेविगेट करने और वास्तविक दुनिया की सॉफ़्टवेयर विकास चुनौतियों का समाधान करने की अनुमति देती है। विशेष रूप से, Devstral को अनुमति देने वाले Apache 2.0 लाइसेंस के तहत जारी किया गया है, जो डेवलपर्स और संगठनों को मॉडल को तैनात, संशोधित और व्यावसायिक बनाने की स्वतंत्रता देता है।
Mistral के AI शोध वैज्ञानिक बैपटिस्ट रोज़िएरे ने डेवलपर समुदाय को एक ऐसा उपकरण प्रदान करने के लक्ष्य पर जोर दिया जिसे स्थानीय रूप से चलाया जा सके और विशिष्ट आवश्यकताओं के अनुसार संशोधित किया जा सके, जिसमें Apache 2.0 लाइसेंस उपयोगकर्ताओं को महत्वपूर्ण लचीलापन प्रदान करता है।
Codestral की सफलता पर निर्माण
Devstral Mistral की कोड-केंद्रित मॉडल श्रृंखला, Codestral, में नवीनतम प्रगति का प्रतिनिधित्व करता है। मई 2024 में लॉन्च किया गया, Codestral में 22 अरब पैरामीटर हैं और यह 80 से अधिक प्रोग्रामिंग भाषाओं का समर्थन करता है, कोड उत्पन्न करने और पूर्णता कार्यों में उत्कृष्टता प्राप्त करता है। Codestral की तेजी से पुनरावृत्ति ने Codestral-Mamba और नवीनतम Codestral 25.01 सहित उन्नत संस्करणों को जन्म दिया है, जो IDE प्लगइन डेवलपर्स और उद्यम उपयोगकर्ताओं के बीच लोकप्रिय हो गए हैं। Codestral श्रृंखला की सफलता ने Devstral के विकास के लिए एक ठोस आधार तैयार किया है, जिससे यह सरल कोड पूर्णता से पूर्ण प्रॉक्सी कार्यों को निष्पादित करने में सक्षम हो गया है।
SWE बेंचमार्क परीक्षण में प्रभावशाली प्रदर्शन
SWE-Bench Verified बेंचमार्क परीक्षणों में, Devstral ने 46.8% का उत्कृष्ट स्कोर प्राप्त किया। SWE-Bench Verified एक डेटासेट है जिसमें 500 वास्तविक GitHub मुद्दे शामिल हैं, जिन्हें सटीकता के लिए मैन्युअल रूप से सत्यापित किया गया है। यह स्कोर न केवल सभी पूर्व में जारी ओपन-सोर्स मॉडलों को पार करता है, बल्कि कई बंद-स्रोत मॉडलों, जिसमें GPT-4.1-mini भी शामिल है, को 20 प्रतिशत अंकों से भी अधिक पीछे छोड़ देता है। रोज़िएरे ने गर्व से कहा कि Devstral अब तक SWE-बेंच सत्यापन और कोड प्रॉक्सी कार्यों में सबसे अच्छा प्रदर्शन करने वाला ओपन-सोर्स मॉडल है, और आश्चर्यजनक रूप से, यह केवल 24 मिलियन पैरामीटर के साथ एक MacBook पर स्थानीय रूप से चल सकता है।
Mistral AI की डेवलपर संबंध प्रमुख, डॉ. सोफिया यांग, ने सोशल मीडिया पर यह भी उल्लेख किया कि Devstral ने विभिन्न ढांचों में कई बंद-स्रोत विकल्पों को पार किया। मॉडल के असाधारण प्रदर्शन का श्रेय Mistral Small3.1 बेस मॉडल पर लागू किए गए सुदृढीकरण शिक्षण और सुरक्षा ट्यूनिंग तकनीकों को दिया गया है।
कोड उत्पन्न करने से परे: AI सॉफ़्टवेयर विकास के लिए एक आधार
Devstral का उद्देश्य केवल कोड उत्पन्न करने से परे है; इसे OpenHands, SWE-Agent, और OpenDevin जैसे प्रॉक्सी ढांचों के साथ निर्बाध रूप से एकीकृत करने के लिए डिज़ाइन किया गया है। ये ढांचे Devstral को परीक्षण मामलों के साथ बातचीत करने, स्रोत कोड फ़ाइलों को नेविगेट करने, और परियोजनाओं में बहु-चरण कार्यों को निष्पादित करने में सक्षम बनाते हैं। रोज़िएरे ने खुलासा किया कि Devstral OpenDevin के साथ जारी किया जाएगा, जो कोड प्रॉक्सियों के लिए एक ढांचा प्रदान करता है, जो डेवलपर मॉडलों के लिए बैकएंड के रूप में कार्य करता है।
मॉडल की विश्वसनीयता सुनिश्चित करने के लिए, Mistral ने Devstral का विभिन्न कोडबेस और आंतरिक कार्यप्रवाहों में कठोर परीक्षण किया ताकि SWE-बेंच बेंचमार्क के लिए ओवरफिटिंग को रोका जा सके। उन्होंने प्रशिक्षण के लिए केवल गैर-SWE-बेंच डेटासेट से डेटा का उपयोग किया और विभिन्न ढांचों में मॉडल के प्रदर्शन को मान्य किया।
व्यवसाय-हितैषी ओपन-सोर्स लाइसेंसिंग के साथ कुशल तैनाती
Devstral की 24 मिलियन पैरामीटर की संक्षिप्त संरचना डेवलपर्स को इसे स्थानीय रूप से आसानी से चलाने की अनुमति देती है, चाहे वह एकल RTX 4090 GPU से लैस मशीनों पर हो या 32GB मेमोरी वाले Mac कंप्यूटरों पर। यह सुविधा उन अनुप्रयोगों के लिए विशेष रूप से आकर्षक है जो गोपनीयता को प्राथमिकता देते हैं और जिन्हें एज उपकरणों पर तैनाती की आवश्यकता होती है। रोज़िएरे ने संकेत दिया कि इस मॉडल के लक्षित उपयोगकर्ता वे डेवलपर्स और उत्साही लोग हैं जो स्थानीय और निजी संचालन में रुचि रखते हैं, यहां तक कि ऑफ़लाइन वातावरण में भी।
इसके प्रदर्शन और पोर्टेबिलिटी के अलावा, Devstral का Apache 2.0 लाइसेंस व्यावसायिक अनुप्रयोगों के लिए महत्वपूर्ण लाभ प्रदान करता है। यह लाइसेंस बिना किसी प्रतिबंध के उपयोग, अनुकूलन, और वितरण की अनुमति देता है, जिसमें स्वामित्व वाले उत्पादों में भी शामिल है, जो उद्यम अपनाने के लिए बाधाओं को काफी कम करता है।
Devstral में 128,000 टोकनों की संदर्भ विंडो है और यह 131,000 शब्दों की शब्दावली के साथ एक टोकनाइज़र का उपयोग करता है। यह Hugging Face, Ollama, Kaggle, LM Studio, और Unsloth जैसे लोकप्रिय ओपन-सोर्स प्लेटफार्मों के माध्यम से तैनाती का समर्थन करता है, और vLLM, Transformers, और Mistral Inference जैसी लाइब्रेरी के साथ संगत है।
API और स्थानीय तैनाती विकल्प
डेवलपर्स Mistral के Le Platforme API के माध्यम से Devstral तक पहुंच सकते हैं, जिसमें मॉडल का नाम devstral-small-2505 है, जिसकी कीमत $0.10 प्रति मिलियन इनपुट टोकन और $0.30 प्रति मिलियन आउटपुट टोकन है। स्थानीय तैनाती में रुचि रखने वाले उपयोगकर्ताओं के लिए, OpenHands जैसे ढांचों के लिए समर्थन कोडबेस और प्रॉक्सी कार्यप्रवाहों के साथ तात्कालिक एकीकरण की अनुमति देता है। रोज़िएरे ने Devstral का उपयोग करके छोटे विकास कार्यों, जैसे पैकेज संस्करणों को अपडेट करने या टोकनयुक्त स्क्रिप्टों को संशोधित करने के अपने अनुभव साझा किए, इसकी क्षमता की प्रशंसा करते हुए कि यह कोड को सटीक रूप से ढूंढने और संशोधित करने में सक्षम है।
हालांकि Devstral वर्तमान में एक अनुसंधान पूर्वावलोकन में उपलब्ध है, Mistral और All Hands AI पहले से ही अधिक शक्तिशाली और बड़े फॉलो-अप मॉडलों के विकास पर काम कर रहे हैं। रोज़िएरे का मानना है कि छोटे और बड़े मॉडलों के बीच का अंतर तेजी से बंद हो रहा है, और Devstral जैसे मॉडलों का प्रभावशाली प्रदर्शन अब कुछ बड़े प्रतिस्पर्धियों के समान है।
अपने उत्कृष्ट बेंचमार्क प्रदर्शन, अनुमति देने वाले ओपन-सोर्स लाइसेंसिंग, और प्रॉक्सी डिज़ाइन के लिए अनुकूलित सुविधाओं के साथ, Devstral केवल एक शक्तिशाली कोड उत्पन्न करने वाला उपकरण नहीं है, बल्कि स्वायत्त सॉफ़्टवेयर इंजीनियरिंग सिस्टम बनाने के लिए एक प्रमुख मौलिक मॉडल बनने के लिए तैयार है।
AI की दुनिया में अधिक अंतर्दृष्टि के लिए, हमारे दैनिक अपडेट के लिए बने रहें और AI उत्पादों और अनुप्रयोगों में नवीनतम रुझानों और नवाचारों का अन्वेषण करें।
अपनी आवश्यकताओं के लिए अनुकूलित नवोन्मेषी समाधानों की एक विस्तृत श्रृंखला की खोज करें। अधिक जानें और हमारे AI Tool Directory पर उपयोगकर्ताओं के लिए निर्मित AI उपकरणों का अन्वेषण करें, जहां आप स्मार्ट खोज और AI सहायक जैसी सुविधाओं का उपयोग करके अपने लिए सही उपकरण खोज सकते हैं।







