Home » ज्ञान – जानकारी = information » Gemini Omni Launch: अब आवाज़ से बनेंगे वीडियो, Google का नया AI टूल करेगा एडिटिंग भी

Gemini Omni Launch: अब आवाज़ से बनेंगे वीडियो, Google का नया AI टूल करेगा एडिटिंग भी

कैलिफोर्निया/नई दिल्ली: टेक्नोलॉजी दिग्गज Google ने अपने AI इकोसिस्टम को और मजबूत करते हुए नया वीडियो जनरेशन टूल “Gemini Omni” लॉन्च कर दिया है। कंपनी का दावा है कि यह अत्याधुनिक AI मॉडल केवल वीडियो बनाने तक सीमित नहीं रहेगा, बल्कि यूजर की भाषा, इरादों और क्रिएटिव जरूरतों को समझते हुए स्मार्ट तरीके से वीडियो तैयार और एडिट भी करेगा। इस नए टूल के आने से वीडियो कंटेंट क्रिएशन की दुनिया में बड़ा बदलाव देखने को मिल सकता है।

Google के अनुसार, Gemini Omni को Gemini AI परिवार के सबसे एडवांस्ड मल्टीमॉडल टूल्स में शामिल किया गया है। इसकी खासियत यह है कि यह टेक्स्ट, इमेज, ऑडियो और वीडियो जैसे कई प्रकार के इनपुट को समझकर काम कर सकता है। कंपनी ने फिलहाल इसका पहला मॉडल “Gemini Omni Flash” पेश किया है, जिसकी शुरुआत वीडियो जनरेशन फीचर के साथ की गई है।

सबसे दिलचस्प बात यह है कि अब यूजर सिर्फ बोलकर वीडियो बना और एडिट कर सकेंगे। यानी किसी जटिल एडिटिंग सॉफ्टवेयर या प्रोफेशनल स्किल की जरूरत नहीं होगी। सामान्य भाषा में दिए गए निर्देशों के जरिए वीडियो में बदलाव किए जा सकेंगे। उदाहरण के तौर पर यूजर बैकग्राउंड बदलने, नए कैरेक्टर जोड़ने, ऑब्जेक्ट हटाने, कैमरा एंगल बदलने या किसी खास स्टाइल और इफेक्ट को जोड़ने जैसी कमांड दे सकेंगे।

कंपनी का कहना है कि Gemini Omni Flash में “कन्वर्सेशनल वीडियो एडिटिंग” फीचर दिया गया है। इसका मतलब है कि AI हर नए निर्देश को पिछले निर्देशों से जोड़कर समझेगा, जिससे वीडियो की कहानी, किरदार और सीन की निरंतरता बनी रहेगी। इससे कंटेंट क्रिएटर्स को ज्यादा नेचुरल और सिनेमैटिक वीडियो तैयार करने में मदद मिलेगी।

Google ने यह भी बताया कि Gemini Omni सिर्फ आकर्षक वीडियो ही नहीं बनाएगा, बल्कि यह वास्तविक दुनिया की जानकारी और लॉजिक का भी इस्तेमाल करेगा। इसमें इतिहास, विज्ञान, संस्कृति और फिजिक्स जैसे विषयों की समझ जोड़ी गई है, ताकि वीडियो ज्यादा यथार्थवादी और तार्किक बन सकें। यानी AI अब केवल विजुअल इफेक्ट्स तक सीमित नहीं रहेगा, बल्कि सीन के संदर्भ और व्यवहार को भी समझेगा।

यह नया टूल फिलहाल Gemini ऐप, Google Flow और YouTube Shorts पर उपलब्ध कराया गया है। शुरुआती चरण में इसमें वॉयस इनपुट सपोर्ट दिया गया है, लेकिन कंपनी ने संकेत दिया है कि आने वाले समय में अन्य ऑडियो इनपुट फीचर्स भी जोड़े जाएंगे।

Gemini Omni की एक और बड़ी ताकत इसकी मल्टीमॉडल क्षमता है। यूजर किसी पुरानी फोटो, छोटे वीडियो क्लिप, ऑडियो रिकॉर्डिंग या सिर्फ टेक्स्ट से भी नया वीडियो तैयार कर सकेंगे। AI इन सभी इनपुट्स को मिलाकर एक क्रिएटिव और प्रोफेशनल आउटपुट तैयार करेगा।

विशेषज्ञों का मानना है कि Google का यह नया AI टूल वीडियो कंटेंट इंडस्ट्री, सोशल मीडिया क्रिएटर्स और डिजिटल मार्केटिंग सेक्टर में बड़ा बदलाव ला सकता है। खासकर उन लोगों के लिए यह तकनीक बेहद उपयोगी साबित हो सकती है, जो बिना तकनीकी जानकारी के भी प्रोफेशनल क्वालिटी का वीडियो कंटेंट बनाना चाहते हैं।

AI की दुनिया में बढ़ती प्रतिस्पर्धा के बीच Gemini Omni को Google की बड़ी रणनीतिक पहल माना जा रहा है। आने वाले महीनों में यह देखना दिलचस्प होगा कि यह टूल कंटेंट क्रिएशन इंडस्ट्री में कितना बड़ा प्रभाव डालता है।

मनोरंजन
संबंधित समाचार
E-Paper image 2