Google’s New AI-Based Tech Can Transform Poor Quality Photos Into High-Res Images
Google ने कम-रिज़ॉल्यूशन वाली छवियों की गुणवत्ता में सुधार के लिए नए AI- आधारित प्रसार मॉडल पेश किए हैं। दो नए डिफ्यूजन मॉडल – इमेज सुपर-रिज़ॉल्यूशन (SR3) और कैस्केड डिफ्यूजन मॉडल (CDM) – उच्च फ़िडेलिटी इमेज बनाने के लिए AI का उपयोग कर सकते हैं। इन मॉडलों में कई अनुप्रयोग हैं जो पुराने पारिवारिक चित्रों को पुनर्स्थापित करने और चिकित्सा इमेजिंग सिस्टम में सुधार करने से लेकर छवि वर्गीकरण, विभाजन, और बहुत कुछ के लिए डाउनस्ट्रीम मॉडल के प्रदर्शन को बढ़ाने तक हो सकते हैं। उदाहरण के लिए, SR3 मॉडल को एक कम-रिज़ॉल्यूशन वाली छवि को एक विस्तृत उच्च-रिज़ॉल्यूशन छवि परिणाम में बदलने के लिए प्रशिक्षित किया जाता है, जो मानव मूल्यांकन में जनरेटिव एडवरसैरियल नेटवर्क (GAN) जैसे वर्तमान डीप जनरेटिव मॉडल से आगे निकल जाता है।
के शोधकर्ता गूगल अनुसंधान की मस्तिष्क टीम ने प्रकाशित किया है पद Google के AI ब्लॉग पर, SR3 और CDM प्रसार मॉडल दोनों का विवरण देते हुए। SR3 को एक सुपर-रिज़ॉल्यूशन डिफ्यूजन मॉडल कहा जाता है जो इनपुट के रूप में कम-रिज़ॉल्यूशन छवि लेता है और शुद्ध शोर से संबंधित उच्च-रिज़ॉल्यूशन छवि बनाता है। मॉडल को एक छवि भ्रष्टाचार प्रक्रिया पर प्रशिक्षित किया जाता है जो एक उच्च-रिज़ॉल्यूशन छवि में शोर जोड़ता है जब तक कि केवल शुद्ध शोर न रह जाए। SR3 मॉडल तब प्रक्रिया को उलट देता है “शुद्ध शोर से शुरू होकर और इनपुट कम-रिज़ॉल्यूशन छवि के मार्गदर्शन के माध्यम से लक्ष्य वितरण तक पहुंचने के लिए शोर को उत्तरोत्तर हटा देता है।”
Google ने कुछ प्रभावशाली उदाहरण साझा किए हैं कि कैसे SR3 का उपयोग करके 64×64 पिक्सेल रिज़ॉल्यूशन वाली छवि को 1,024×1,024 पिक्सेल रिज़ॉल्यूशन वाली फ़ोटो में बढ़ाया जाता है। 1,024×1,024 पिक्सेल रिज़ॉल्यूशन आउटपुट का अंतिम परिणाम, विशेष रूप से चेहरे और प्राकृतिक छवियों का, बहुत प्रभावशाली है। टेक दिग्गज का कहना है कि SR3 चेहरे और प्राकृतिक छवियों के लिए सुपर-रिज़ॉल्यूशन टास्क पर मजबूत बेंचमार्क परिणाम प्राप्त करने में सक्षम है, जब इसे 4x से 8x उच्च रिज़ॉल्यूशन तक बढ़ाया जाता है।
उच्च-रिज़ॉल्यूशन वाली प्राकृतिक छवियां उत्पन्न करने के लिए सीडीएम प्रसार मॉडल को इमेजनेट डेटा पर प्रशिक्षित किया जाता है। चूंकि इमेजनेट एक कठिन, उच्च-एन्ट्रॉपी डेटासेट है, इसलिए Google ने सीडीएम को कई प्रसार मॉडल के कैस्केड के रूप में बनाया। इस कैस्केड दृष्टिकोण में कई स्थानिक संकल्पों पर कई जनरेटिव मॉडल को एक साथ जोड़ना शामिल है। श्रृंखला में एक प्रसार मॉडल शामिल है जो कम रिज़ॉल्यूशन पर डेटा उत्पन्न करता है जिसके बाद SR3 सुपर-रिज़ॉल्यूशन डिफ्यूजन मॉडल का एक क्रम होता है जो धीरे-धीरे उत्पन्न छवि के रिज़ॉल्यूशन को उच्चतम रिज़ॉल्यूशन तक बढ़ाता है। Google का कहना है कि यह कैस्केडिंग पाइपलाइन में प्रत्येक सुपर-रिज़ॉल्यूशन मॉडल की कम-रिज़ॉल्यूशन इनपुट छवि पर गॉसियन शोर और गॉसियन ब्लर लागू करता है। यह इस प्रक्रिया को कंडीशनिंग वृद्धि कहता है और यह सीडीएम के लिए बेहतर और उच्च रिज़ॉल्यूशन नमूना गुणवत्ता को सक्षम बनाता है।
SR3 और CDM के साथ, Google का कहना है कि उसने “प्रसार मॉडल के प्रदर्शन को सुपर-रिज़ॉल्यूशन और क्लास-कंडीशनल इमेजनेट जनरेशन बेंचमार्क पर अत्याधुनिक बना दिया है।”
नवीनतम के लिए तकनीक सम्बन्धी समाचार तथा समीक्षा, गैजेट्स 360 को फॉलो करें ट्विटर, फेसबुक, तथा गूगल समाचार. गैजेट्स और तकनीक पर नवीनतम वीडियो के लिए, हमारे को सब्सक्राइब करें यूट्यूब चैनल.
संबंधित कहानियां
.
Homepage | Click Hear |