अतिप्रवाह सॉर्ट चरण बफ़र डेटा उपयोग आंतरिक सीमा से अधिक है

Question 1

कोड का उपयोग करना:

all_reviews = db_handle.find().sort('reviewDate', pymongo.ASCENDING)
print all_reviews.count()

print all_reviews[0]
print all_reviews[2000000]

गिनती प्रिंट करता है 2043484, और यह प्रिंट करता है all_reviews[0]।

हालाँकि जब मुद्रण all_reviews[2000000], मुझे त्रुटि मिलती है:

pymongo.errors.OperationFailure: डेटाबेस त्रुटि: धावक त्रुटि: 33554495 बाइट्स का ओवरफ़्लो सॉर्ट चरण बफ़र डेटा उपयोग 33554432 बाइट्स की आंतरिक सीमा से अधिक है

इससे मैं कैसे निपटूं?

Question 2

आप इन-मेमोरी सॉर्ट पर 32 एमबी की सीमा में चल रहे हैं:

https://docs.mongodb.com/manual/reference/limits/#Sort-Operations

सॉर्ट फ़ील्ड में कोई अनुक्रमणिका जोड़ें। यह MongoDB को क्रमबद्ध क्रम में दस्तावेज़ों को स्ट्रीम करने की अनुमति देता है, बजाय उन सभी को सर्वर पर मेमोरी में लोड करने के और क्लाइंट को भेजने से पहले उन्हें मेमोरी में सॉर्ट करने की अनुमति देता है।

Question 3

जैसा कि kumar_harshटिप्पणी अनुभाग में कहा गया है, मैं एक और बिंदु जोड़ना चाहूंगा।

आप adminडेटाबेस पर नीचे दिए गए कमांड का उपयोग करके वर्तमान बफर उपयोग देख सकते हैं :

> use admin
switched to db admin
> db.runCommand( { getParameter : 1, "internalQueryExecMaxBlockingSortBytes" : 1 } )
{ "internalQueryExecMaxBlockingSortBytes" : 33554432, "ok" : 1 }

इसका डिफ़ॉल्ट मान 32 MB (33554432 बाइट्स) है । इस मामले में आप बफर डेटा की कमी से भाग रहे हैं ताकि आप अपने स्वयं के परिभाषित इष्टतम मूल्य के साथ बफर सीमा बढ़ा सकें, उदाहरण के लिए नीचे दिए गए 50 एमबी:

>  db.adminCommand({setParameter: 1, internalQueryExecMaxBlockingSortBytes:50151432})
{ "was" : 33554432, "ok" : 1 }

हम इस सीमा को मोंगोडब कॉन्फिग फ़ाइल में नीचे के पैरामीटर द्वारा स्थायी रूप से सेट कर सकते हैं:

setParameter=internalQueryExecMaxBlockingSortBytes=309715200

उम्मीद है की यह मदद करेगा !!!

Note: यह कमांड केवल 3.0 संस्करण + के बाद समर्थन करता है

Question 4

अनुक्रमण के साथ हल किया गया

db_handle.ensure_index([("reviewDate", pymongo.ASCENDING)])

Question 5

यदि आप एक इंडेक्स बनाने से बचना चाहते हैं (जैसे आप डेटा का पता लगाने के लिए एक त्वरित और गंदा चेक चाहते हैं), तो आप डिस्क उपयोग के साथ एकत्रीकरण का उपयोग कर सकते हैं:

all_reviews = db_handle.aggregate([{$sort: {'reviewDate': 1}}], {allowDiskUse: true})

(यह पाइमोंगो में कैसे करना है, यह सुनिश्चित नहीं है, हालांकि)।

Question 6

इंडेक्स के लिए जावास्क्रिप्ट एपीआई सिंटैक्स:

db_handle.ensureIndex({executedDate: 1})

Question 7

मेरे मामले में, कोड में नेसरी इंडेक्स को ठीक करना और उन्हें फिर से बनाना आवश्यक था:

rake db:mongoid:create_indexes RAILS_ENV=production

जब मैमोरी ओवरफ्लो होता है, तब फील्ड का एक आवश्यक सूचकांक नहीं होता है।

PS इससे पहले मुझे लंबे इंडेक्स बनाते समय त्रुटियों को अक्षम करना पड़ा था:

# mongo
MongoDB shell version: 2.6.12
connecting to: test
> db.getSiblingDB('admin').runCommand( { setParameter: 1, failIndexKeyTooLong: false } )

इसके अलावा जरूरत हो सकती है reIndex:

# mongo
MongoDB shell version: 2.6.12
connecting to: test
> use your_db
switched to db your_db
> db.getCollectionNames().forEach( function(collection){ db[collection].reIndex() } )