विषयसूची:

15 आश्चर्यजनक चीजें जो तंत्रिका नेटवर्क ने करना सीखा है
15 आश्चर्यजनक चीजें जो तंत्रिका नेटवर्क ने करना सीखा है
Anonim

कार चलाने से लेकर मास्टरपीस बनाने तक।

15 आश्चर्यजनक चीजें जो तंत्रिका नेटवर्क ने करना सीखा है
15 आश्चर्यजनक चीजें जो तंत्रिका नेटवर्क ने करना सीखा है

एक तंत्रिका नेटवर्क एक कृत्रिम बुद्धि है जो स्व-सीखने में सक्षम है। किसी न किसी रूप में, इसी तरह के कार्यक्रम न्यूरोकंप्यूटर तकनीक मौजूद थे: अस्सी के दशक में सिद्धांत और व्यवहार, लेकिन इस क्षेत्र को विशेष रूप से 2015 के आसपास तेजी से विकास प्राप्त हुआ। मैसाचुसेट्स और ऑक्सफोर्ड जैसे प्रमुख विश्वविद्यालयों के साथ-साथ Google जैसे बड़े निगमों ने सक्रिय रूप से तंत्रिका नेटवर्क की संभावनाओं का पता लगाना शुरू कर दिया।

अब ये प्रौद्योगिकियां किसी के लिए भी उपलब्ध हैं। और मानवता पहले से ही ऐसे कार्यक्रमों के लिए दर्जनों सबसे पागल और अजीब अनुप्रयोगों के साथ आ चुकी है। यहां उनमें से कुछ हैं।

1. अस्तित्वहीन लोगों के चेहरों के साथ आना

तंत्रिका नेटवर्क गैर-मौजूद लोगों के चेहरों का आविष्कार करने में सक्षम हैं
तंत्रिका नेटवर्क गैर-मौजूद लोगों के चेहरों का आविष्कार करने में सक्षम हैं

ऊपर की तस्वीर में आप जिन लोगों को देख रहे हैं वे यथार्थवादी दिखते हैं, लेकिन वे मौजूद नहीं हैं। उनकी छवियों ने सुधार के लिए GAN का प्रगतिशील विकास किया

NVIDIA से गुणवत्ता, स्थिरता और भिन्नता तंत्रिका नेटवर्क। कार्यक्रम को मशहूर हस्तियों की वास्तविक तस्वीरों पर प्रशिक्षित किया गया था, और इसके परिणामस्वरूप, यह सीखा कि चेहरों की विश्वसनीय छवियां कैसे बनाई जाती हैं। आप खुद जांच सकते हैं कि वह इसे कितनी अच्छी तरह करती है।

2. जोर से पढ़ें

तंत्रिका नेटवर्क का उपयोग करके भाषण को संश्लेषित करने के लिए कई प्रौद्योगिकियां हैं। इस उद्देश्य के लिए, इसके लिए कार्यक्रम हैं, उदाहरण के लिए, और ""। इस तरह से बनाया गया भाषण तरल और यथार्थवादी है, और इस पद्धति के कई उपयोग हैं, दृष्टिहीनों के लिए डबिंग एप्लिकेशन से लेकर कम लागत पर ऑडियोबुक बनाने तक।

3. ड्राइव कार

कई कंपनियां सेल्फ-ड्राइविंग कारों को परिवहन के भविष्य के रूप में देखती हैं। इस क्षेत्र में ऑडी, उबेर, गूगल, टेस्ला, यांडेक्स और कई अन्य निगमों के अपने विकास हैं। वस्तुतः इनमें से कोई भी तकनीक तंत्रिका नेटवर्क के बिना पूर्ण नहीं है। वे वाहनों को यह निर्धारित करने में मदद करते हैं कि सड़क पर चिह्न, संकेत, अन्य वाहन और पैदल यात्री कहाँ हैं और इस डेटा के आधार पर निर्णय लेते हैं।

4. फ़ोटो और वीडियो का रंग पुनर्प्राप्त करें

टोक्यो में वासेडा विश्वविद्यालय के वैज्ञानिकों ने विकसित किया है रंग होने दो! एक प्रोग्राम जो रंगीन तस्वीरों और वीडियो को ब्लैक एंड व्हाइट बनाता है। तंत्रिका नेटवर्क ने छवियों में सामान्य उद्देश्यों की पहचान करना सीख लिया है (आकाश आमतौर पर नीला होता है, पेड़ हरे होते हैं, और इसी तरह) और वस्तुओं को उपयुक्त रंगों में चित्रित करना सीख लिया है।

5. हर जगह कुत्ते के चेहरे देखें

व्यापक दर्शकों के लिए उपलब्ध होने वाली पहली तंत्रिका नेटवर्क प्रौद्योगिकियों में से एक 2015 में Google की शुरुआतवाद शुरुआत थी। उसने छवियों को संसाधित किया, उनमें कुत्ते के चेहरे, पैगोडा और मेहराब के सिल्हूट जोड़ दिए। कार्यक्रम के माध्यम से नेटिज़न्स ने अपनी तस्वीरें, प्रसिद्ध पेंटिंग, वीडियो और फिल्मों को प्रसारित करना शुरू किया - यह असामान्य और डरावना निकला।

6. संगीत लिखें

संगीत सहित किसी भी प्रकार की डिजिटल जानकारी को तंत्रिका नेटवर्क में लोड किया जा सकता है। कुछ शोधकर्ता अपने कार्यक्रमों को प्रसिद्ध संगीतकारों की धुन पर प्रशिक्षित करते हैं। कंप्यूटर ने अभी तक सार्थक रचनाएँ नहीं बनाई हैं, लेकिन वे संगीतकारों की शैलियों की अच्छी तरह से नकल करते हैं।

7. राजनेताओं को कुछ भी कहें

तंत्रिका नेटवर्क के सबसे भयावह उपयोगों में से एक वीडियो संश्लेषण है, विशेष रूप से सार्वजनिक आंकड़ों के साथ। उदाहरण के लिए, वाशिंगटन विश्वविद्यालय के वैज्ञानिकों ने सिंथेसाइजिंग ओबामा: लर्निंग लिप सिंक फ्रॉम ऑडियो, एक प्रोग्राम विकसित किया है जो ऑडियो रिकॉर्डिंग के आधार पर बराक ओबामा के होंठों की गति को उत्पन्न करता है और उन्हें वीडियो में प्रतिस्थापित करता है। यह बहुत मज़बूती से निकलता है।

8. वॉक

Google की सहायक कंपनी डीपमाइंड ने एक प्रयोग किया। तीन अलग-अलग आभासी आकृतियों - एक ह्यूमनॉइड, दो पैरों वाली एक छड़ी और चार पैरों वाली एक गेंद - को चलना सीखना था। उन्हें इस बारे में कोई जानकारी नहीं थी कि यह कैसे किया जाता है - केवल एक बिंदु से दूसरे बिंदु तक जाने का कार्य और अंतरिक्ष में उनकी स्थिति निर्धारित करने में मदद करने वाले सेंसर। सैकड़ों घंटों के अभ्यास के बाद, तीनों आकृतियों ने असमान सतहों पर चलना, दौड़ना, कूदना और चलना सीखा।

9. नियंत्रण रोबोट

रोबोटिक्स में तंत्रिका नेटवर्क पर आधारित तकनीकों का व्यापक रूप से उपयोग किया जाता है।उदाहरण के लिए, डिज़्नी रिसर्च इंस्टीट्यूट द्वारा बनाया गया रोबोट एक, दो और तीन पैरों के साथ आगे बढ़ सकता है। और स्टारशिप टेक्नोलॉजीज से डिलीवरी रोबोट बाधाओं और पैदल चलने वालों से बचने के लिए सड़कों पर नेविगेट करना है।

10. धोखाधड़ी और भ्रष्टाचार को पहचानें

तंत्रिका नेटवर्क के मुख्य कार्यों में से एक पैटर्न पहचान है, जिसमें घटनाओं के बीच संबंध शामिल हैं। यह वित्तीय क्षेत्र में बहुत उपयोगी है: ऐसा होने से पहले आप अवैध गतिविधि की भविष्यवाणी कर सकते हैं। उदाहरण के लिए, स्पेन में, वैज्ञानिकों ने प्रेडिक्टिंग पब्लिक करप्शन विद न्यूरल नेटवर्क्स: एन एनालिसिस ऑफ़ स्पैनिश प्रोविंस, एक प्रोग्राम बनाया है जो देश के प्रांतों में भ्रष्टाचार का पता लगाने में मदद करता है। और कुछ बैंक सिटी वेंचर्स डिप्लॉयज मशीन लर्निंग एंड आर्टिफिशियल इंटेलिजेंस विद पीपल विकसित कर रहे हैं और ऐसे सिस्टम का उपयोग कर रहे हैं जो क्रेडिट कार्ड धोखाधड़ी को पहचानते हैं।

11. वास्तविक समय में एक छवि पर पाठ का अनुवाद करें

तंत्रिका नेटवर्क वास्तविक समय में एक छवि पर पाठ का अनुवाद करने में सक्षम हैं
तंत्रिका नेटवर्क वास्तविक समय में एक छवि पर पाठ का अनुवाद करने में सक्षम हैं

रीयल-टाइम टेक्स्ट ट्रांसलेशन फीचर Google अनुवाद में लंबे समय तक दिखाई दिया, लेकिन कम ही लोग जानते हैं कि यह Google अनुवाद का उपयोग करता है कि कैसे Google अनुवाद एक फोन तंत्रिका नेटवर्क पर गहरी शिक्षा को निचोड़ता है। उनकी मदद से, प्रोग्राम छवियों में अक्षरों और अन्य प्रतीकों को पहचानता है, भले ही वे धुंधले हों, अपनी धुरी के चारों ओर घुमाए गए हों, शैलीबद्ध या विकृत हों। फिर एप्लिकेशन उन्हें शब्दों और वाक्यों में डालता है, अनुवाद करता है और उन्हें चित्र पर प्रोजेक्ट करता है। और यह सब एक पल के सेकंड में।

12. कला शैली को एक छवि से दूसरी छवि में स्थानांतरित करें

तंत्रिका नेटवर्क कलात्मक शैली को एक छवि से दूसरी छवि में स्थानांतरित करने में सक्षम हैं
तंत्रिका नेटवर्क कलात्मक शैली को एक छवि से दूसरी छवि में स्थानांतरित करने में सक्षम हैं

2016 में, कई कंपनियों ने विभिन्न कलात्मक शैलियों में छवि प्रसंस्करण के लिए प्रौद्योगिकियां प्रस्तुत कीं। प्रिज्मा, डीपआर्ट और ओस्टाग्राम जैसे ऐप सामने आए हैं। प्रिज्मा आपको कई सौ पूर्व-निर्मित फिल्टरों में से चुनने की अनुमति देता है, और ओस्टाग्राम और डीपआर्ट - आप स्वयं एक तस्वीर या फोटो अपलोड कर सकते हैं, जो शैली के स्रोत के रूप में काम करेगा।

13. रफ रेखाचित्रों को यथार्थवादी चित्रों में बदलें

2019 की शुरुआत में, NVIDIA ने स्ट्रोक ऑफ जीनियस दिखाया: गौगन ने डूडल को तेजस्वी में बदल दिया, एक फोटोरिअलिस्टिक लैंडस्केप प्रोग्राम जो कुछ साधारण आकृतियों से चित्रों को सुंदर विस्तृत चित्रों में बदल देता है। उपयोगकर्ता कुछ स्ट्रोक बनाता है, और तंत्रिका नेटवर्क इससे एक छवि बनाता है, जिसे दूर से किसी लैंडस्केप चित्रकार के वास्तविक कैनवास से अलग नहीं किया जा सकता है। समुद्र, चट्टानें, शहर, जंगल, बादल - दर्जनों विभिन्न वस्तुओं को चित्र में जोड़ा जा सकता है। तंत्रिका नेटवर्क स्वयं भी निर्धारित करता है कि छाया या प्रतिबिंब की आवश्यकता कहाँ है।

14. होंठ पढ़ें

गूगल और ऑक्सफोर्ड यूनिवर्सिटी के वैज्ञानिकों ने लिपनेट तकनीक लिपनेट बनाई है, जो होठों को पढ़ने के लिए तंत्रिका नेटवर्क का उपयोग करती है। और वह इसे एक व्यक्ति की तुलना में बहुत अधिक सटीक रूप से करती है। औसतन, श्रवण दोष वाले लोग 52% सटीकता के साथ होंठ पढ़ते हैं, और लिपनेट 88% सटीकता के साथ।

15. ग्रंथ लिखें

लोगों ने तंत्रिका नेटवर्क और पाठ के साथ काम करने का तरीका सिखाया। कार्यक्रम डीप-स्पीयर द्वारा लिखे गए हैं: काव्य भाषा का एक संयुक्त तंत्रिका मॉडल, मीटर और कविता कविताएँ, लघु कथाएँ, विकिपीडिया के लिए नकली पाठ, धारावाहिकों के लिए स्क्रिप्ट (उदाहरण के लिए, दोस्तों के लिए)।

और 2016 में दुनिया की पहली शॉर्ट फिल्म सनस्प्रिंग रिलीज हुई, जिसकी स्क्रिप्ट आर्टिफिशियल इंटेलिजेंस ने लिखी थी। सिनेमा बिल्कुल अर्थहीन है: कंप्यूटर अभी भी बनाने के लिए संघर्ष कर रहे हैं। लेकिन कौन जानता है, शायद कुछ वर्षों के बाद एक पटकथा लेखक का पेशा मशीन द्वारा बनाए गए संपादन कार्यों तक सिमट कर रह जाएगा।

सिफारिश की: