क्वांटम तंत्रिका नेटवर्क प्रशिक्षण परिदृश्य में बंजर पठार


9

यहाँ लेखक का तर्क है कि बड़े पैमाने पर बटेरों के लिए एक स्केलेबल क्वांटम न्यूरल नेटवर्क बनाने का प्रयास किया जाता है, जो कि बड़े आकार के गेटों का उपयोग करते हैं। यह इस तथ्य के कारण है कि, लेवी के लेम्मा के कारण , उच्च आयामी स्थानों में एक फ़ंक्शन का ग्रेडिएंट हर जगह लगभग शून्य है।

मुझे आश्चर्य हो रहा था कि क्या इस तर्क को अन्य हाइब्रिड क्वांटम-क्लासिकल ऑप्टिमाइज़ेशन मेथड्स जैसे VQE (वैरिएंट क्वांटम ईगेंसोल्वर) या QAOA (क्वांटम अनुमानित अनुकूलन एल्गोरिथम) पर भी लागू किया जा सकता है ।

तुम क्या सोचते हो?


"पैरामीट्रोज़ गेट्स के सेट का उपयोग करना" क्या सेट है? क्या यह किसी भी संयोग से यादृच्छिक है?
रर्तुकी

लेख जारोद मैक्लेन द्वारा लिखा गया था, जो VQE के अग्रणी भी हैं। मैं कल्पना करता हूं कि जारोड को विश्वास नहीं है कि VQE को बड़ी संख्या में क्वैब के लिए विफल माना जाता है। मुझे लगता है कि लेवी के लेम्मा के बारे में आपका वर्णन कागज के सुझाव से थोड़ा अलग है। आप कहते हैं, "उच्च आयामी स्थानों में एक फ़ंक्शन का ग्रेडिएंट हर जगह लगभग शून्य है," लेकिन कागज केवल यही कहता है कि यह पेपर में वर्णित क्यूएनएन के विशेष संदर्भ में मामला है ।
user1271772

मेरी अंतिम टिप्पणी पर थोड़ा विस्तार करने के लिए: एक बस एक उच्च-आयामी फ़ंक्शन का निर्माण कर सकता है जो हर जगह बहुत तेज़ी से बदलता है, इसमें हर जगह "लगभग शून्य" का ढाल नहीं होगा। पेपर में लेवी के लेम्मा पर आधारित निष्कर्ष, विशिष्ट फ़ंक्शन के लिए है जो वे उच्च-आयामी स्थान में "किसी भी" फ़ंक्शन के लिए अनुकूलित कर रहे हैं।
user1271772

1
@asdf: दिन का अधिकांश समय कागज पर आगे-पीछे देखने के बाद, मैं आखिरकार आपके लिए एक जवाब लेकर आया हूं। जरा देखो तो।
user1271772

जवाबों:


4

पहला : पेपर लेवी के लेम्मा के लिए [ 37 ] संदर्भित करता है , लेकिन आपको "लेवी का लेम्मा" [37] में कोई उल्लेख नहीं मिलेगा। आपको यह "लेवी की असमानता" कहा जाएगा , जिसे इस में लेवी का लेम्मा कहा जाता है , जिसे आपके द्वारा उल्लिखित कागज में उद्धृत नहीं किया गया है।

दूसरा : एक आसान प्रमाण है कि यह दावा VQE के लिए गलत है। क्वांटम केमिस्ट्री में हम एक वेवफंक्शन ansatz के मापदंडों का अनुकूलन करते हैं|Ψ(पी)सबसे कम (यानी सबसे सटीक) ऊर्जा प्राप्त करने के लिए। निम्न द्वारा ऊर्जा का मूल्यांकन किया जाता है:

पी=Ψ(पी)|एच|Ψ(पी)Ψ(पी)|Ψ(पी)

VQE का अर्थ है कि हम इस ऊर्जा का मूल्यांकन करने के लिए एक क्वांटम कंप्यूटर का उपयोग करते हैं, और एक क्लासिक कंप्यूटर का चयन करते हैं कि कैसे मापदंडों में सुधार किया जाए पी ताकि अगले क्वांटम पुनरावृत्ति में ऊर्जा कम हो।

तो "ग्रेडिएंट में पैरामीटर की संख्या होने पर" ग्रेडिएंट लगभग हर जगह 0 होगा या नहीं पीबड़ी है "इस बात पर बिल्कुल भी निर्भर नहीं करता है कि हम VQE (एक क्वांटम कंप्यूटर पर) का उपयोग कर रहे हैं या सिर्फ शास्त्रीय कंप्यूटर पर एक मानक क्वांटम केमिस्ट्री प्रोग्राम (जैसे गॉसियन ) चला रहे हैं। क्वांटम केमिस्ट आम तौर पर ऊपर दिए गए डेटा के साथ परिवर्तनीय रूप से अनुकूलन करते हैं।1010 में पैरामीटर पी, और एकमात्र कारण है कि हम उससे आगे नहीं जाते हैं क्योंकि हम रैम से बाहर निकलते हैं, इसलिए नहीं कि ऊर्जा परिदृश्य समतल होने लगता है। इस पत्र में आप अमूर्त के अंत में देख सकते हैं कि उन्होंने एक तरंग के लिए ऊर्जा की गणना किसके साथ की थी1012पैरामीटर , जहां पैरामीटर स्लेटर निर्धारक के गुणांक हैं। यह आमतौर पर ज्ञात है कि ऊर्जा का परिदृश्य इतना सपाट नहीं है (जैसे कि यह होगा कि अगर ढाल 0 लगभग हर जगह थे) तब भी जब एक ट्रिलियन पैरामीटर या इससे भी अधिक हो।

निष्कर्ष : लेवी के लेम्मा का अनुप्रयोग आपके पास मौजूद विशेष ऊर्जा परिदृश्य पर निर्भर करेगा, जो दोनों पर निर्भर करेगा एच और आपका ansatz |Ψ(पी)। क्यूएनएन के अपने विशेष कार्यान्वयन के मामले में, उन्होंने लेवी के लेम्मा के एक आवेदन को उचित पाया है। VQE के मामले में, हमारे पास इस दावे का एक प्रति-उदाहरण है कि लेवी का लेम्मा "हमेशा" लागू होता है। काउंटर उदाहरण जहां लेवी का लेम्मा लागू नहीं होता है वह कब होता हैएचएक आणविक हैमिल्टन और है|Ψएक सीआई तरंग है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.