Technology

Google’s New AI-Based Tech Can Transform Poor Quality Photos Into High-Res Images

WhatsApp Group Join Now
Telegram Group Join Now

Google ने कम-रिज़ॉल्यूशन वाली छवियों की गुणवत्ता में सुधार के लिए नए AI- आधारित प्रसार मॉडल पेश किए हैं। दो नए डिफ्यूजन मॉडल – इमेज सुपर-रिज़ॉल्यूशन (SR3) और कैस्केड डिफ्यूजन मॉडल (CDM) – उच्च फ़िडेलिटी इमेज बनाने के लिए AI का उपयोग कर सकते हैं। इन मॉडलों में कई अनुप्रयोग हैं जो पुराने पारिवारिक चित्रों को पुनर्स्थापित करने और चिकित्सा इमेजिंग सिस्टम में सुधार करने से लेकर छवि वर्गीकरण, विभाजन, और बहुत कुछ के लिए डाउनस्ट्रीम मॉडल के प्रदर्शन को बढ़ाने तक हो सकते हैं। उदाहरण के लिए, SR3 मॉडल को एक कम-रिज़ॉल्यूशन वाली छवि को एक विस्तृत उच्च-रिज़ॉल्यूशन छवि परिणाम में बदलने के लिए प्रशिक्षित किया जाता है, जो मानव मूल्यांकन में जनरेटिव एडवरसैरियल नेटवर्क (GAN) जैसे वर्तमान डीप जनरेटिव मॉडल से आगे निकल जाता है।

के शोधकर्ता गूगल अनुसंधान की मस्तिष्क टीम ने प्रकाशित किया है पद Google के AI ब्लॉग पर, SR3 और CDM प्रसार मॉडल दोनों का विवरण देते हुए। SR3 को एक सुपर-रिज़ॉल्यूशन डिफ्यूजन मॉडल कहा जाता है जो इनपुट के रूप में कम-रिज़ॉल्यूशन छवि लेता है और शुद्ध शोर से संबंधित उच्च-रिज़ॉल्यूशन छवि बनाता है। मॉडल को एक छवि भ्रष्टाचार प्रक्रिया पर प्रशिक्षित किया जाता है जो एक उच्च-रिज़ॉल्यूशन छवि में शोर जोड़ता है जब तक कि केवल शुद्ध शोर न रह जाए। SR3 मॉडल तब प्रक्रिया को उलट देता है “शुद्ध शोर से शुरू होकर और इनपुट कम-रिज़ॉल्यूशन छवि के मार्गदर्शन के माध्यम से लक्ष्य वितरण तक पहुंचने के लिए शोर को उत्तरोत्तर हटा देता है।”

Google ने कुछ प्रभावशाली उदाहरण साझा किए हैं कि कैसे SR3 का उपयोग करके 64×64 पिक्सेल रिज़ॉल्यूशन वाली छवि को 1,024×1,024 पिक्सेल रिज़ॉल्यूशन वाली फ़ोटो में बढ़ाया जाता है। 1,024×1,024 पिक्सेल रिज़ॉल्यूशन आउटपुट का अंतिम परिणाम, विशेष रूप से चेहरे और प्राकृतिक छवियों का, बहुत प्रभावशाली है। टेक दिग्गज का कहना है कि SR3 चेहरे और प्राकृतिक छवियों के लिए सुपर-रिज़ॉल्यूशन टास्क पर मजबूत बेंचमार्क परिणाम प्राप्त करने में सक्षम है, जब इसे 4x से 8x उच्च रिज़ॉल्यूशन तक बढ़ाया जाता है।

उच्च-रिज़ॉल्यूशन वाली प्राकृतिक छवियां उत्पन्न करने के लिए सीडीएम प्रसार मॉडल को इमेजनेट डेटा पर प्रशिक्षित किया जाता है। चूंकि इमेजनेट एक कठिन, उच्च-एन्ट्रॉपी डेटासेट है, इसलिए Google ने सीडीएम को कई प्रसार मॉडल के कैस्केड के रूप में बनाया। इस कैस्केड दृष्टिकोण में कई स्थानिक संकल्पों पर कई जनरेटिव मॉडल को एक साथ जोड़ना शामिल है। श्रृंखला में एक प्रसार मॉडल शामिल है जो कम रिज़ॉल्यूशन पर डेटा उत्पन्न करता है जिसके बाद SR3 सुपर-रिज़ॉल्यूशन डिफ्यूजन मॉडल का एक क्रम होता है जो धीरे-धीरे उत्पन्न छवि के रिज़ॉल्यूशन को उच्चतम रिज़ॉल्यूशन तक बढ़ाता है। Google का कहना है कि यह कैस्केडिंग पाइपलाइन में प्रत्येक सुपर-रिज़ॉल्यूशन मॉडल की कम-रिज़ॉल्यूशन इनपुट छवि पर गॉसियन शोर और गॉसियन ब्लर लागू करता है। यह इस प्रक्रिया को कंडीशनिंग वृद्धि कहता है और यह सीडीएम के लिए बेहतर और उच्च रिज़ॉल्यूशन नमूना गुणवत्ता को सक्षम बनाता है।

SR3 और CDM के साथ, Google का कहना है कि उसने “प्रसार मॉडल के प्रदर्शन को सुपर-रिज़ॉल्यूशन और क्लास-कंडीशनल इमेजनेट जनरेशन बेंचमार्क पर अत्याधुनिक बना दिया है।”


इस सप्ताह Google I/O का समय है कक्षा का, गैजेट्स 360 पॉडकास्ट, जैसा कि हम Android 12, Wear OS, और बहुत कुछ पर चर्चा करते हैं। बाद में (27:29 से शुरू होकर), हम आर्मी ऑफ़ द डेड, ज़ैक स्नाइडर की नेटफ्लिक्स ज़ॉम्बी हीस्ट मूवी के लिए कूद पड़े। कक्षीय उपलब्ध है एप्पल पॉडकास्ट, गूगल पॉडकास्ट, Spotify, अमेज़न संगीत और जहां भी आपको अपने पॉडकास्ट मिलते हैं।

नवीनतम के लिए तकनीक सम्बन्धी समाचार तथा समीक्षा, गैजेट्स 360 को फॉलो करें ट्विटर, फेसबुक, तथा गूगल समाचार. गैजेट्स और तकनीक पर नवीनतम वीडियो के लिए, हमारे को सब्सक्राइब करें यूट्यूब चैनल.

तसनीम अकोलावाला गैजेट्स 360 के लिए एक वरिष्ठ रिपोर्टर हैं। उनकी रिपोर्टिंग विशेषज्ञता में स्मार्टफोन, वियरेबल्स, ऐप्स, सोशल मीडिया और समग्र तकनीकी उद्योग शामिल हैं। वह मुंबई से बाहर रिपोर्ट करती हैं, और भारतीय दूरसंचार क्षेत्र में उतार-चढ़ाव के बारे में भी लिखती हैं। तस्नीम को ट्विटर पर @MuteRiot पर पहुँचा जा सकता है, और लीड, टिप्स और रिलीज़ [email protected] पर भेजे जा सकते हैं।
अधिक

अमेज़ॅन के सीईओ एंडी जेसी ने 55,000 कॉर्पोरेट, प्रौद्योगिकी नौकरियों का खुलासा किया, उनकी निगरानी में पहली बार काम पर रखा गया

संबंधित कहानियां

.

Rate this post
HomepageClick Hear

Related Articles

Back to top button