मुझे हल करने के लिए एक काफी अनोखी समस्या है और मैं उम्मीद कर रहा हूं कि यहां कोई मुझे कुछ जानकारी दे सकता है कि कैसे इसे सबसे अच्छा तरीके से निपटाया जाए।
समस्या: मान लीजिए कि N नंबर की एक सूची प्रतिभागियों के एक सेट के बीच इस तरह से साझा की जाती है कि कोई भी प्रतिभागी वास्तव में किसी भी नंबर को साझा नहीं करता है। सभी प्रतिभागियों को एन (संख्याओं की सूची का आकार) और सूची पर सभी संख्याओं का योग पता है, लेकिन एक प्राथमिकता के अलावा और कुछ नहीं।
एक साथ काम करके, दो साझा संख्याओं की तुलना करना संभव है ए और बी इस तरह से कि प्रतिभागियों को पता चलता है कि क्या कथन "ए <बी" सच है, लेकिन इससे ज्यादा कुछ नहीं। हालांकि, यह करने के लिए एक बेहद महंगी चीज है (पढ़ें: एक एकल तुलना को पूरा करने में कई सेकंड, शायद मिनट भी लग सकते हैं)। इस तरह की चीज़ कैसे संभव है, इस बारे में थोड़ी और जानकारी के लिए इस पोस्ट का अंत देखें।
दिन के अंत में, पार्टियां यह जानना चाहती हैं कि सूची में कौन से सूचकांक "शीर्ष के प्रतिशत" (के% जो सबसे बड़ा है) सूची में साझा संख्याओं के अनुरूप हैं। यह निश्चित रूप से "टॉप के" चयन एल्गोरिथ्म का उपयोग करके सॉर्ट किया जा सकता है। हालांकि, ये तुलनात्मक रूप से बहुत अधिक प्रयोग करते हैं, जिससे बचा जाना है। (ये या तो ओ (एन लॉग एन) या ओ (एन) हैं, काफी बड़े छिपे हुए स्थिरांक के साथ।)
एक अन्य विकल्प एक संख्या X पर "अनुमान" है जिसके लिए (1-K)% X से छोटा है और K% बड़ा है। फिर आप एक्स के साथ प्रत्येक तत्व की तुलना कर सकते हैं और देख सकते हैं कि कितने बड़े हैं और कितने छोटे हैं। यदि आपका अनुमान गलत था, तो बाइनरी खोज जैसी किसी चीज़ का उपयोग करके इसे तब तक संशोधित करें जब तक आप एक सही समाधान पर नहीं जुट जाते। यदि आपका अनुमान अच्छा है तो यह तुलनात्मक रूप से बहुत कम है।
तो, मेरा सवाल है,
केवल N और योग को देखते हुए, X की "भविष्यवाणी" करने का सबसे अच्छा तरीका क्या है?
बेशक यह अंतर्निहित वितरण पर निर्भर करेगा। अलग-अलग उपयोग-मामलों के लिए अंतर्निहित वितरण अलग-अलग होगा, लेकिन ज्ञात होगा, इसलिए मैं सभी सामान्य लोगों (सामान्य, वर्दी, घातीय, शायद कुछ अन्य) के लिए अच्छे समाधानों में दिलचस्पी रखता हूं। अंतर्निहित बंटवारे के बारे में एक धारणा दी गई चरणों की संख्या को कम करने के लिए "बाइनरी-जैसी" खोज करने के लिए सबसे अच्छा कैसे करना है, इसके बारे में सुझाव सुनना भी मुझे अच्छा लगेगा।
APPENDIX: सूची के प्रत्येक मूल्य को शमीर की गुप्त साझा योजना का उपयोग करते हुए प्रतिभागियों के बीच साझा किया जाता है। मान लीजिए एम प्रतिभागियों देखते हैं और सूची, तब लंबाई एन की है i-वें सूची पर नंबर एक बहुपद का प्रतिनिधित्व करती है डिग्री एम -1 के कुछ परिमित क्षेत्र एफ के निरंतर अवधि में च मैं नंबर है यह साझा किया गया है, सभी अन्य गुणांक एफ से यादृच्छिक रूप से समान रूप से चुने गए हैं। जे-वें प्रतिभागी के शेयर फिर एफ आई ( जे ) , 1 ≤ आई other एन।। इस हिस्से को देखते हुए, प्रतिभागी को संख्या के बारे में कोई जानकारी (सूचना-सिद्धांत संबंधी अर्थ में) नहीं है; वास्तव में, प्रतिभागियों का कोई भी उचित सबसेट साझा संख्याओं के बारे में किसी भी जानकारी को जानने के लिए ज्ञान को संयोजित नहीं कर सकता है। हालांकि, एक परिष्कृत सुरक्षित बहु-पक्षीय संगणना तकनीक का उपयोग करते हुए, यह निर्धारित करना संभव है कि क्या एक साझा मूल्य किसी अन्य जानकारी को प्रकट किए बिना एक से कम है। इस तकनीक में सभी प्रतिभागियों को सहयोग करना शामिल है, यही कारण है कि ऐसा करना बहुत महंगा है और इसे सबसे कम संभव समय में किया जाना चाहिए।