Hindi Newsगैजेट्स न्यूज़microsoft brings phi 3 vision small language model for image analysis on mobile device

स्मार्टफोन्स के लिए माइक्रोसॉफ्ट लाया Phi-3-Vision एआई मॉडल, बहुत कुछ है खास

माइक्रोसॉफ्ट ने अपने लेटेस्ट स्मॉल लैंग्वेज मॉडल Phi-3 को नए फीचर्स के साथ लॉन्च किया है। नए एआई मॉडल स्मार्टफोन पर शानदार कन्वर्सेशनल एआई एक्सपीरियंस देंगे। Phi-3 Vision इन्हीं में से एक है। यह एक मल्टीमोडल मॉडल है, जो इमेज और टेक्स्ट इनपुट का जवाब टेक्स्ट में देता है।

Prashant Singh लाइव हिन्दुस्तानWed, 22 May 2024 07:34 AM
हमें फॉलो करें

माइक्रोसॉफ्ट ने अपने लेटेस्ट स्मॉल लैंग्वेज मॉडल Phi-3 को नए फीचर्स के साथ लॉन्च किया है। कंपनी के सीईओ सत्या नडेला ने माइक्रोसॉफ्ट बिल्ड 2024 इवेंट में Phi-3 फैमिली के तीन नए एआई मॉडल्स को लॉन्च किया। नए एआई मॉडल स्मार्टफोन पर शानदार कन्वर्सेशनल एआई एक्सपीरियंस देंगे। Phi-3 Vision इन्हीं में से एक है। यह एक मल्टीमोडल मॉडल है, जो इमेज, चार्ट और डायग्राम इनपुट का जवाब टेक्स्ट में देता है। यह 4.2 बिलियन पैरामीटर मॉडल मोबाइल डिवाइसेज के लिए डिजाइन किया गया है। जेनरल विजुअल रीजनिंग टास्क में इसका रिस्पॉन्स जबरदस्त है।

इमेज ऐनालिसिस और समझ में काफी तेज
यूजर फोटोज या चार्ट के बारे में Phi-3-Vision से सवाल पूछ सकते हैं। यह पूछे गए सवाल का सही जवाब देगा। हालांकि, यह DALL-E या स्टेबल डिफ्यूजन जैसा इमेज जेनरेशन टूल नहीं है, लेकिन यह इमेज ऐनालिसिस और समझ में काफी तेज है। Phi-3-Vision की एंट्री Phi-3-Mini के ठीक बाद हुई है, जो 3.8 बिलियन पैरामीटर्स के साथ Phi-3 फैमिली का सबसे छोटा मेंबर है। पूरे परिवार में अब Phi-3-Mini, Phi-3-Vision, Phi-3-Small (7 बिलियन पैरामीटर), और Phi-3-Medium (14 बिलियन पैरामीटर) शामिल हैं।

6 हजार रुपये से कम में 12GB रैम वाला फोन, अमेजन की धाकड़ डील ने मचाई लूट

ऐंड्रॉयड, वेब, iOS, विंडोज ऐप बनाने में करेगा मदद
नडेला ने कहा कि Phi मॉडल्स के जरिए यूजर ऐंड्रॉयड, वेब, iOS, विंडोज और एज के लिए ऐप बना सकते हैं। छोटे मॉडलों पर यह फोकस एआई डेवेलपमेंट के ट्रेंड को दिखाता है। छोटे मॉडलों को कम प्रोसेसिंग पावर और मेमरी की जरूरत होती है, जो उन्हें मोबाइल डिवाइस बेस्ट बनाते हैं। माइक्रोसॉफ्ट को इस अप्रोच से पहले ही सफलता मिल चुकी है, कथित तौर पर कंपनी का Orca-Math मॉडल मैथ के प्रॉबल्म्स को सॉल्व करने में बड़े कॉम्पिटिटर्स से आगे निकल गया है।

गजब डिजाइन का मुड़ने वाला फोन भारत में लॉन्च को तैयार, माधव सेठ ने दी खुशखबरी

Phi-3-Vision अभी प्रीव्यू में उपलब्ध है, जबकि बाकी Phi-3 फैमिली (मिनी, छोटा और मध्यम) को Azure की मॉडल लाइब्रेरी के जरिए से एक्सेस किया जा सकता है। बताते चलें कि माइक्रोसॉफ्ट के सीईओ सत्या नडेला ने कन्फर्म कर दिया है कि ओपन एआई का लेटेस्ट मल्टी-मोडल लार्ज लैंग्वेज मॉडल (LLM) GPT-4o अब Azure OpenAI में उपलब्ध हो गया है।

(Photo: techeconomy)

ऐप पर पढ़ें