तेज काम और कम दाम! Microsoft लाया आपके काम को आसान बनाने वाले 3 नए AI टूल्स
तेज काम और कम दाम! Microsoft लाया आपके काम को आसान बनाने वाले 3 नए AI टूल्स
Microsoft ने बीते दिनों तीन नए AI मॉडल पेश किए हैं। ये इमेज क्रिएट करने, वॉयस जनरेट करने और स्पीच-टू-टेक्स्ट ट्रांसक्रिप्शन पर फोकस करेंगे। कंपनी का द ...और पढ़ें

Microsoft ने तीन नए AI मॉडल पेश किए हैं।
टेक्नोलॉजी डेस्क, नई दिल्ली। Microsoft ने बीते गुरुवार को तीन खास आर्टिफिशियल इंटेलिजेंस (AI) मॉडल लॉन्च किए, जिनका फोकस इमेज बनाने, वॉयस जनरेट करने और स्पीच-टू-टेक्स्ट ट्रांसक्रिप्शन पर है। Redmond बेस्ड टेक कंपनी का दावा है कि ये मॉडल Google, OpenAI और दूसरी कंपनियों के खास मॉडलों से बेहतर काम करते हैं। इन मॉडल्स MAI-Transcribe-1, MAI-Voice-1 और MAI-Image के बारे में ये भी कहा जा रहा है कि इनका फोकस तेजी से कंटेंट बनाने और किफायती कीमतों पर उपलब्ध होने पर है। ये मॉडल अभी Microsoft Foundry के जरिए उपलब्ध हैं और इन्हें अलग-अलग कंज्यूमर प्रोडक्ट्स में भी शामिल किया जा रहा है।
Microsoft ने तीन नए AI मॉडल पेश किए
एक न्यूजपोस्ट में, इस टेक कंपनी ने तीन नए बड़े लैंग्वेज मॉडल (LLMs) पेश किए। ये सभी अभी Microsoft Foundry और MAI Playground के जरिए उपलब्ध हैं। इनमें सबसे खास है MAI-Transcribe-1, जिसके बारे में कंपनी का दावा है कि ये सबसे ज्यादा इस्तेमाल होने वाली 25 भाषाओं में बेहतरीन (SOTA) स्पीच-टू-टेक्स्ट ट्रांसक्रिप्शन की सुविधा देता है।
ये दावे Microsoft के FLEURS बेंचमार्क पर किए गए अंदरूनी टेस्ट पर बेस्ड हैं। कहा जा रहा है कि ये एरर रेट के मामले में Gemini 3.1 Flash और GPT-Transcribe से बेहतर परफॉर्म करता है। इसके अलावा, कंपनी का कहना है कि Foundry यूजर्स के लिए ये 'किसी भी बड़े क्लाउड प्रोवाइडर के मुकाबले बेस्ट-प्राइस परफॉर्मेंस' वाला मॉडल लगेगा।

AI से बनाया गया इमेज सैंपल।
MAI-Voice-1 की बात करें तो, इस LLM के बारे में कहा जा रहा है कि ये 'नैचुरल, असली जैसी आवाज क्रिएट करता है, जिसमें बारीकियां, भावनाओं की पूरी रेंज और हाव-भाव साफ झलकते हैं।' ये मॉडल लंबे कंटेंट को बनाते समय भी आवाज और बोलने के अंदाज में कंसीसटेंसी बनाए रखने में सक्षम है। Foundry के अंदर, ये मॉडल इस्तेमाल करने वालों को कुछ ही सेकंड की ऑडियो क्लिप की मदद से अपनी खुद की आवाज बनाने की सुविधा भी देगा।
Microsoft का दावा है कि ये प्रोसेस पूरी तरह से सुरक्षित और महफूज है। मिली जानकारी के मुताबिक ये सिर्फ एक सेकंड में 60 सेकंड की ऑडियो क्लिप तैयार कर सकता है। खास बात ये है कि ये AI मॉडल Copilot Audio Expressions और Copilot Podcasts को भी पावर देगा।
आखिर में, MAI-Image-2 मॉडल अपने पिछले मॉडल की खूबियों को और बेहतर बनाता है और इसके बारे में कहा जा रहा है कि ये पहले से कहीं ज्यादा तेजी से बेहतर क्वालिटी वाला आउटपुट देता है। Microsoft ने बताया कि इस मॉडल को फोटोग्राफर्स, डिजाइनर्स और विज़ुअल स्टोरीटेलर्स के साथ मिलकर तैयार किया गया है, और इसका मेन फोकस नैचुरल लाइटिंग, एक्यूरेट टेक्सचर और क्लियर इन-इमेज टेक्स्ट पर है।
खास बात ये है कि WPP उन शुरुआती एंटरप्राइज पार्टनर्स में से एक है, जिन्होंने इस AI मॉडल को अपनाया है। ये मॉडल, बाकी दो मॉडलों की तरह ही, Microsoft Foundry और MAI Playground के जरिए उपलब्ध होगा। इसके अलावा, इसे Copilot, Bing और PowerPoint पर भी रोल आउट किया जा रहा है।
Microsoft ने बीते दिनों तीन नए AI मॉडल पेश किए हैं। ये इमेज क्रिएट करने, वॉयस जनरेट करने और स्पीच-टू-टेक्स्ट ट्रांसक्रिप्शन पर फोकस करेंगे। कंपनी का द ...और पढ़ें

Microsoft ने तीन नए AI मॉडल पेश किए हैं।
टेक्नोलॉजी डेस्क, नई दिल्ली। Microsoft ने बीते गुरुवार को तीन खास आर्टिफिशियल इंटेलिजेंस (AI) मॉडल लॉन्च किए, जिनका फोकस इमेज बनाने, वॉयस जनरेट करने और स्पीच-टू-टेक्स्ट ट्रांसक्रिप्शन पर है। Redmond बेस्ड टेक कंपनी का दावा है कि ये मॉडल Google, OpenAI और दूसरी कंपनियों के खास मॉडलों से बेहतर काम करते हैं। इन मॉडल्स MAI-Transcribe-1, MAI-Voice-1 और MAI-Image के बारे में ये भी कहा जा रहा है कि इनका फोकस तेजी से कंटेंट बनाने और किफायती कीमतों पर उपलब्ध होने पर है। ये मॉडल अभी Microsoft Foundry के जरिए उपलब्ध हैं और इन्हें अलग-अलग कंज्यूमर प्रोडक्ट्स में भी शामिल किया जा रहा है।
Microsoft ने तीन नए AI मॉडल पेश किए
एक न्यूजपोस्ट में, इस टेक कंपनी ने तीन नए बड़े लैंग्वेज मॉडल (LLMs) पेश किए। ये सभी अभी Microsoft Foundry और MAI Playground के जरिए उपलब्ध हैं। इनमें सबसे खास है MAI-Transcribe-1, जिसके बारे में कंपनी का दावा है कि ये सबसे ज्यादा इस्तेमाल होने वाली 25 भाषाओं में बेहतरीन (SOTA) स्पीच-टू-टेक्स्ट ट्रांसक्रिप्शन की सुविधा देता है।
ये दावे Microsoft के FLEURS बेंचमार्क पर किए गए अंदरूनी टेस्ट पर बेस्ड हैं। कहा जा रहा है कि ये एरर रेट के मामले में Gemini 3.1 Flash और GPT-Transcribe से बेहतर परफॉर्म करता है। इसके अलावा, कंपनी का कहना है कि Foundry यूजर्स के लिए ये 'किसी भी बड़े क्लाउड प्रोवाइडर के मुकाबले बेस्ट-प्राइस परफॉर्मेंस' वाला मॉडल लगेगा।

AI से बनाया गया इमेज सैंपल।
MAI-Voice-1 की बात करें तो, इस LLM के बारे में कहा जा रहा है कि ये 'नैचुरल, असली जैसी आवाज क्रिएट करता है, जिसमें बारीकियां, भावनाओं की पूरी रेंज और हाव-भाव साफ झलकते हैं।' ये मॉडल लंबे कंटेंट को बनाते समय भी आवाज और बोलने के अंदाज में कंसीसटेंसी बनाए रखने में सक्षम है। Foundry के अंदर, ये मॉडल इस्तेमाल करने वालों को कुछ ही सेकंड की ऑडियो क्लिप की मदद से अपनी खुद की आवाज बनाने की सुविधा भी देगा।
Microsoft का दावा है कि ये प्रोसेस पूरी तरह से सुरक्षित और महफूज है। मिली जानकारी के मुताबिक ये सिर्फ एक सेकंड में 60 सेकंड की ऑडियो क्लिप तैयार कर सकता है। खास बात ये है कि ये AI मॉडल Copilot Audio Expressions और Copilot Podcasts को भी पावर देगा।
आखिर में, MAI-Image-2 मॉडल अपने पिछले मॉडल की खूबियों को और बेहतर बनाता है और इसके बारे में कहा जा रहा है कि ये पहले से कहीं ज्यादा तेजी से बेहतर क्वालिटी वाला आउटपुट देता है। Microsoft ने बताया कि इस मॉडल को फोटोग्राफर्स, डिजाइनर्स और विज़ुअल स्टोरीटेलर्स के साथ मिलकर तैयार किया गया है, और इसका मेन फोकस नैचुरल लाइटिंग, एक्यूरेट टेक्सचर और क्लियर इन-इमेज टेक्स्ट पर है।
खास बात ये है कि WPP उन शुरुआती एंटरप्राइज पार्टनर्स में से एक है, जिन्होंने इस AI मॉडल को अपनाया है। ये मॉडल, बाकी दो मॉडलों की तरह ही, Microsoft Foundry और MAI Playground के जरिए उपलब्ध होगा। इसके अलावा, इसे Copilot, Bing और PowerPoint पर भी रोल आउट किया जा रहा है।
Labels
Business
Post A Comment
No comments :