इस सवाल का जवाब देने के लिए अराजकता के सिद्धांत पर पढ़ते समय मैंने जो सबसे अजीब बात उजागर की, वह प्रकाशित शोध की एक आश्चर्यजनक कमी थी जिसमें डेटा खनन और इसके रिश्तेदार अराजकता सिद्धांत का लाभ उठाते हैं। ए बी'sम्बेल के एप्लाइड कैओस थ्योरी: ए पैराडिग्म फॉर कॉम्प्लेक्सिटी एंड एलीगूड, एट अल। कैओस: ए इंट्रोडक्शन टू डायनामिक सिस्टम (उत्तरार्द्ध अविश्वसनीय रूप से उपयोगी है जो स्रोत बुकबुक के लिए एक स्रोत के रूप में है) इस विषय) और उनकी ग्रंथ सूची छापे। आखिरकार, मुझे केवल एक ही अध्ययन के साथ आना था जो कि योग्य हो सकता है और मुझे इस किनारे के मामले को शामिल करने के लिए "डेटा माइनिंग" की सीमा को लंबा करना पड़ा: टेक्सास विश्वविद्यालय की एक टीम ने बेलौसोव-ज़बोटिंस्की (बीजेड) प्रतिक्रियाओं पर शोध किया है (जो पहले से ही एपेरियोडिज्म के लिए जाना जाता था) गलती से अराजक पैटर्न के कारण उनके प्रयोगों में इस्तेमाल किए गए मैलिक एसिड में विसंगतियों की खोज की गई थी, जिससे उन्हें एक नई खोज करने के लिए प्रेरित किया गया था। सप्लायर। [1] संभवतः अन्य लोग भी हैं - मैं अराजकता के सिद्धांत का विशेषज्ञ नहीं हूं और शायद ही साहित्य का संपूर्ण मूल्यांकन दे सकता हूं - लेकिन भौतिक विज्ञान से थ्री-बॉडी प्रॉब्लम जैसे साधारण वैज्ञानिक उपयोगों के साथ असंतुष्टता बहुत ज्यादा नहीं बदलेगी यदि हम सभी की गणना करें। वास्तव में, अंतरिम में जब यह सवाल बंद हो गया था, मैंने इसे शीर्षक के तहत पुनर्लेखन माना "डेटा खनन और संबंधित क्षेत्रों में अराजकता सिद्धांत के कुछ कार्यान्वयन क्यों हैं?" यह बीमार परिभाषित अभी तक व्यापक भावना के साथ असंगत है कि वहाँ डेटा खनन और संबंधित क्षेत्रों में आवेदनों की एक भीड़ होना चाहिए, जैसे तंत्रिका जाल, पैटर्न मान्यता, अनिश्चितता प्रबंधन, फ़ज़ी सेट, आदि; आखिरकार, अराजकता सिद्धांत कई उपयोगी अनुप्रयोगों के साथ एक अत्याधुनिक विषय भी है। मुझे लंबे और कठिन के बारे में सोचना था, जहां इन क्षेत्रों के बीच की सीमाएं यह समझने के लिए थीं कि मेरी खोज क्यों बेकार थी और मेरी धारणा गलत थी।
; Tldr उत्तर
अध्ययनों की संख्या और अपेक्षाओं से विचलन में इस निरा असंतुलन के लिए संक्षिप्त स्पष्टीकरण इस तथ्य पर निर्भर किया जा सकता है कि अराजकता सिद्धांत और डेटा माइनिंग आदि सवालों के दो अलग-अलग वर्गों का जवाब देते हैं; उनके बीच का तेज द्वंद्व स्पष्ट है एक बार इंगित किया गया है, फिर भी इतना मौलिक है कि किसी का ध्यान नहीं जाना चाहिए। इस धारणा के लिए कुछ औचित्य हो सकता है कि अराजकता सिद्धांत और खेतों में डेटा माइनिंग जैसे रिश्तेदार नएपन को लागू करने में कुछ कमी बताते हैं, लेकिन हम सापेक्ष असंतुलन की उम्मीद कर सकते हैं क्योंकि ये क्षेत्र भी परिपक्व होते हैं क्योंकि वे अलग-अलग पक्षों को संबोधित करते हैं एक ही सिक्का। लगभग सभी कार्यान्वयन आज तक अच्छी तरह से परिभाषित आउटपुट के साथ ज्ञात कार्यों के अध्ययन में हुए हैं, जो कि कुछ हैरान कर देने वाली अव्यवस्थाओं का प्रदर्शन करने के लिए हुआ है, जबकि डेटा माइनिंग और व्यक्तिगत तकनीक जैसे तंत्रिका जाल और निर्णय पेड़ सभी में एक अज्ञात या खराब परिभाषित फ़ंक्शन का निर्धारण शामिल है। इसी तरह के पैटर्न मान्यता और फजी सेट जैसे संबंधित क्षेत्रों को उन कार्यों के परिणामों के संगठन के रूप में देखा जा सकता है जो अक्सर अज्ञात या खराब परिभाषित होते हैं, जब उस संगठन के साधन आसानी से स्पष्ट नहीं होते हैं। यह एक व्यावहारिक रूप से दुर्गम चेस बनाता है जिसे केवल कुछ दुर्लभ परिस्थितियों में ही पार किया जा सकता है - लेकिन यहां तक कि इन्हें एकल उपयोग के मामले के तहत एक साथ समूहीकृत किया जा सकता है: डेटा खनन एल्गोरिदम के साथ एपेरियोडिक हस्तक्षेप को रोकना। संबंधित क्षेत्रों जैसे पैटर्न की पहचान और फजी सेट को उसी तरह के कार्यों के संगठन के रूप में देखा जा सकता है जो अक्सर अज्ञात या खराब परिभाषित होते हैं, जब उस संगठन के साधन या तो स्पष्ट रूप से स्पष्ट नहीं होते हैं। यह एक व्यावहारिक रूप से दुर्गम चेस बनाता है जिसे केवल कुछ दुर्लभ परिस्थितियों में ही पार किया जा सकता है - लेकिन यहां तक कि इन्हें एकल उपयोग के मामले के तहत एक साथ समूहीकृत किया जा सकता है: डेटा खनन एल्गोरिदम के साथ एपेरियोडिक हस्तक्षेप को रोकना। संबंधित क्षेत्रों जैसे पैटर्न की पहचान और फजी सेट को उसी तरह के कार्यों के संगठन के रूप में देखा जा सकता है जो अक्सर अज्ञात या खराब परिभाषित होते हैं, जब उस संगठन के साधन या तो स्पष्ट रूप से स्पष्ट नहीं होते हैं। यह एक व्यावहारिक रूप से दुर्गम चेस बनाता है जिसे केवल कुछ दुर्लभ परिस्थितियों में ही पार किया जा सकता है - लेकिन यहां तक कि इन्हें एकल उपयोग के मामले के तहत एक साथ समूहीकृत किया जा सकता है: डेटा खनन एल्गोरिदम के साथ एपेरियोडिक हस्तक्षेप को रोकना।
अराजकता विज्ञान वर्कफ़्लो के साथ असंगति
"अराजकता विज्ञान" में विशिष्ट वर्कफ़्लो एक ज्ञात फ़ंक्शन के आउटपुट का एक कम्प्यूटेशनल विश्लेषण करने के लिए होता है, अक्सर चरण अंतरिक्ष के दृश्य एड्स के साथ, जैसे द्विभाजित आरेख, हेने मैप्स, पॉइंकेरे अनुभाग, चरण आरेख और चरण प्रक्षेपवक्र। यह तथ्य कि शोधकर्ता कम्प्यूटेशनल प्रयोग पर भरोसा करते हैं, यह बताता है कि कैसे अराजक प्रभाव खोजने के लिए कठिन हैं; यह कुछ ऐसा नहीं है जिसे आप आमतौर पर कलम और कागज के साथ निर्धारित कर सकते हैं। वे भी विशेष रूप से nonlinear कार्यों में होते हैं। जब तक हमारे पास काम करने के लिए एक ज्ञात कार्य नहीं होगा तब तक यह वर्कफ़्लो संभव नहीं है। डेटा माइनिंग में प्रतिगमन समीकरण, फ़ज़ी फ़ंक्शंस और पसंद की उपज हो सकती है, लेकिन वे सभी एक ही सीमा साझा करते हैं: वे बस सामान्य सन्निकटन हैं, त्रुटि के लिए बहुत व्यापक विंडो के साथ। इसके विपरीत, अराजकता के अधीन ज्ञात कार्य अपेक्षाकृत दुर्लभ हैं, जैसे कि अराजक पैटर्न उत्पन्न करने वाले इनपुट्स की सीमाएं हैं, इसलिए अराजक प्रभावों के परीक्षण के लिए भी उच्च स्तर की विशिष्टता की आवश्यकता होती है। अज्ञात कार्यों के चरण स्थान में मौजूद कोई भी अजीब आकर्षित करने वाले निश्चित रूप से शिफ्ट या गायब हो जाएंगे क्योंकि उनकी परिभाषाएं और इनपुट बदल गए हैं, एलीगूड, एट अल जैसे लेखकों द्वारा उल्लिखित पहचान प्रक्रियाओं को बहुत जटिल करते हैं।
डाटा माइनिंग रिजल्ट में एक कंटेस्टेंट के रूप में कैओस
वास्तव में, अराजकता सिद्धांत के डेटा खनन और इसके रिश्तेदारों के संबंध व्यावहारिक रूप से प्रतिकूल हैं। यह शाब्दिक रूप से सच है अगर हम क्रिप्टोनैलिसिस को मोटे तौर पर डेटा माइनिंग के एक विशिष्ट रूप के रूप में देखते हैं, यह देखते हुए कि मैंने एन्क्रिप्शन स्कीमों में अराजकता का लाभ उठाने के लिए कम से कम एक शोध पत्र चलाया है (मैं फिलहाल उद्धरण नहीं पा सकता, लेकिन शिकार कर सकता हूं यह अनुरोध पर नीचे)। एक डेटा खनिक के लिए, अराजकता की उपस्थिति आम तौर पर एक बुरी बात है, क्योंकि प्रतीत होता है कि निरर्थक मूल्य पर्वतमाला यह बहुत ही अज्ञात फ़ंक्शन को अंजाम देने की पहले से ही कठिन प्रक्रिया को जटिल कर सकती है। डेटा माइनिंग और संबंधित क्षेत्रों में अराजकता के लिए सबसे आम उपयोग इसे बाहर करना है, जिसका कोई मतलब नहीं है। यदि अव्यवस्थित प्रभाव मौजूद हैं, लेकिन undetected हैं, तो डेटा माइनिंग वेंचर पर उनके प्रभाव को कम करना मुश्किल हो सकता है। जरा सोचिए कि एक साधारण तंत्रिका जाल या निर्णय वृक्ष कितनी आसानी से अराजक आकर्षित करने वाले के निरर्थक आउटपुट से अधिक हो सकता है, या इनपुट मूल्यों में अचानक स्पाइक्स निश्चित रूप से प्रतिगमन विश्लेषण को कैसे भ्रमित कर सकता है और खराब नमूनों या त्रुटि के अन्य स्रोतों पर चढ़ा सकता है। सभी फ़ंक्शंस और इनपुट रेंज के बीच अराजक प्रभावों की दुर्लभता का मतलब है कि प्रयोगकर्ताओं द्वारा जांच को गंभीर रूप से चित्रित किया जाएगा।
डेटा खनन परिणामों में अराजकता का पता लगाने के तरीके
अराजकता सिद्धांत से जुड़े कुछ उपाय एपेरियोडिक प्रभावों की पहचान करने में उपयोगी होते हैं, जैसे कि कोलमोगोरोव एन्ट्रॉपी और आवश्यकता जो कि चरण स्थान एक सकारात्मक ल्यपुनोव एक्सपोनेंट को प्रदर्शित करता है। ये दोनों अराजकता का पता लगाने के लिए चेकलिस्ट पर हैं [2] AB'sambel के एप्लाइड कैओस थ्योरी में प्रदान किए गए हैं, लेकिन सबसे अधिक अनुमानित कार्यों के लिए उपयोगी नहीं हैं, जैसे कि Lyapunov घातांक, जिसे ज्ञात सीमाओं के साथ निश्चित कार्यों की आवश्यकता होती है। सामान्य प्रक्रिया वह बताती है कि डेटा खनन स्थितियों में फिर भी उपयोगी हो सकती है; ओम्बेल का उद्देश्य अंततः "अराजकता नियंत्रण" का एक कार्यक्रम है, यानी हस्तक्षेप करने वाले एपेरियोडिक प्रभाव को समाप्त करना। [३] भिन्नात्मक आयामों का पता लगाने के लिए बॉक्स-काउंटिंग और सहसंबंध आयामों की गणना करने जैसी अन्य विधियाँ, लियपुनोव और उनकी सूची के अन्य की तुलना में डेटा माइनिंग अनुप्रयोगों में अधिक व्यावहारिक हो सकती हैं। अराजक प्रभावों का एक अन्य गप्पी संकेत फ़ंक्शन आउटपुट में अवधि दोहरीकरण (या ट्रिपलिंग और परे) पैटर्न की उपस्थिति है, जो अक्सर चरण आरेखों में एपेरियोडिक (यानी "अराजक") व्यवहार से पहले होता है।
स्पर्शरेखा अनुप्रयोगों को विभेदित करना
इस प्राथमिक उपयोग के मामले को अनुप्रयोगों के एक अलग वर्ग से अलग किया जाना चाहिए जो केवल अराजक सिद्धांत से संबंधित हैं। करीब से निरीक्षण करने पर, मेरे प्रश्न में प्रदान की गई "संभावित अनुप्रयोगों" की सूची में वास्तव में उन अवधारणाओं का लाभ उठाने के लिए लगभग पूरी तरह से विचार शामिल थे जो अराजकता के सिद्धांत पर निर्भर करते हैं, लेकिन जिसे स्वतंत्र रूप से एपेरियोडिक व्यवहार की अनुपस्थिति में लागू किया जा सकता है (अवधि को छोड़कर दोहरीकरण)। मैंने हाल ही में एक उपन्यास पोटेनिअल आला उपयोग के बारे में सोचा था, जो स्थानीय मिनिमा से बाहर तंत्रिका जाल को एपेरियोडिक व्यवहार पैदा करता है, लेकिन यह भी स्पर्शरेखा अनुप्रयोगों की सूची में होगा। अराजकता विज्ञान में शोध के परिणामस्वरूप उनमें से कई की खोज की गई या उन्हें निकाल दिया गया, लेकिन अन्य क्षेत्रों में लागू किया जा सकता है। इन "स्पर्शनीय अनुप्रयोगों" में केवल एक दूसरे से फ़ज़ी कनेक्शन होते हैं, फिर भी एक अलग वर्ग बनाते हैं, डेटा माइनिंग में अराजकता सिद्धांत के मुख्य उपयोग के मामले से एक कठिन सीमा से अलग; पहला एपेरियोडिक पैटर्न के बिना अराजकता सिद्धांत के कुछ पहलुओं का लाभ उठाता है, जबकि बाद वाला पूरी तरह से डेटा खनन के परिणामों में एक जटिल कारक के रूप में अराजकता का शासन करने के लिए समर्पित है, शायद ल्यपुनोव के घटक की सकारात्मकता और अवधि का पता लगाने जैसे पूर्वापेक्षाओं के उपयोग के साथ दोहरीकरण। । यदि हम अराजकता सिद्धांत और अन्य अवधारणाओं के बीच अंतर करते हैं, तो यह सही तरीके से उपयोग करता है, यह देखना आसान है कि पूर्व के अनुप्रयोग स्वाभाविक वैज्ञानिक अध्ययन में ज्ञात कार्यों के लिए स्वाभाविक रूप से प्रतिबंधित हैं। अराजकता के अभाव में इन माध्यमिक अवधारणाओं के संभावित अनुप्रयोगों के बारे में उत्साहित होने का वास्तव में अच्छा कारण है, लेकिन यह भी मौजूद है जब डेटा खनन प्रयासों पर अप्रत्याशित aperiodic व्यवहार के दूषित प्रभाव के बारे में चिंता करने का कारण। इस तरह के अवसर दुर्लभ होंगे, लेकिन यह दुर्लभता का मतलब यह भी है कि वे अनिर्धारित हो जाएंगे। हालांकि इस तरह की समस्याओं को दूर करने में avambel की विधि का उपयोग किया जा सकता है।
[१] पीपी १४३-१४,, एलीगूड, कैथलीन टी।; सॉयर, टिम डी और यॉर्क, जेम्स ए।, 2010, कैओस: एन इंट्रोडक्शन टू डायनामिकल सिस्टम्स, स्प्रिंगर: न्यूयॉर्क। [२] पीपी २० 2-२१३, ]म्बेल, एबी, १ ९९ ३, एप्लाइड कैओस थ्योरी: ए पैराडिग फॉर कॉम्पलेक्सिटी, एकेडमिक प्रेस, इंक .: बोस्टन। [३] पी। 215, elम्बेल।