आज मैंने RAID फाइल को इंडेक्स करने के लिए फाइलसिस्टम इंडेक्सिंग के लिए अपनी स्क्रिप्ट चलाई और 4h के बाद यह निम्न त्रुटि के साथ क्रैश हो गया:
[md5:] 241613/241627 97.5%
[md5:] 241614/241627 97.5%
[md5:] 241625/241627 98.1%
Creating missing list... (79570 files missing)
Creating new files list... (241627 new files)
<--- Last few GCs --->
11629672 ms: Mark-sweep 1174.6 (1426.5) -> 1172.4 (1418.3) MB, 659.9 / 0 ms [allocation failure] [GC in old space requested].
11630371 ms: Mark-sweep 1172.4 (1418.3) -> 1172.4 (1411.3) MB, 698.9 / 0 ms [allocation failure] [GC in old space requested].
11631105 ms: Mark-sweep 1172.4 (1411.3) -> 1172.4 (1389.3) MB, 733.5 / 0 ms [last resort gc].
11631778 ms: Mark-sweep 1172.4 (1389.3) -> 1172.4 (1368.3) MB, 673.6 / 0 ms [last resort gc].
<--- JS stacktrace --->
==== JS stack trace =========================================
Security context: 0x3d1d329c9e59 <JS Object>
1: SparseJoinWithSeparatorJS(aka SparseJoinWithSeparatorJS) [native array.js:~84] [pc=0x3629ef689ad0] (this=0x3d1d32904189 <undefined>,w=0x2b690ce91071 <JS Array[241627]>,L=241627,M=0x3d1d329b4a11 <JS Function ConvertToString (SharedFunctionInfo 0x3d1d3294ef79)>,N=0x7c953bf4d49 <String[4]\: ,\n >)
2: Join(aka Join) [native array.js:143] [pc=0x3629ef616696] (this=0x3d1d32904189 <undefin...
FATAL ERROR: CALL_AND_RETRY_LAST Allocation failed - JavaScript heap out of memory
1: node::Abort() [/usr/bin/node]
2: 0xe2c5fc [/usr/bin/node]
3: v8::Utils::ReportApiFailure(char const*, char const*) [/usr/bin/node]
4: v8::internal::V8::FatalProcessOutOfMemory(char const*, bool) [/usr/bin/node]
5: v8::internal::Factory::NewRawTwoByteString(int, v8::internal::PretenureFlag) [/usr/bin/node]
6: v8::internal::Runtime_SparseJoinWithSeparator(int, v8::internal::Object**, v8::internal::Isolate*) [/usr/bin/node]
7: 0x3629ef50961b
सर्वर 16 जीबी रैम और 24 जीबी एसएसडी स्वैप से लैस है। मुझे बहुत संदेह है कि मेरी स्क्रिप्ट 36gb मेमोरी से अधिक थी। कम से कम यह नहीं होना चाहिए
स्क्रिप्ट फ़ाइल मेटाडाटा (संशोधन तिथियां, अनुमति, आदि, कोई बड़ा डेटा नहीं) के साथ वस्तुओं के सरणी के रूप में संग्रहीत फ़ाइलों का सूचकांक बनाता है
यहां पूरी स्क्रिप्ट कोड: http://pastebin.com/mjaD76c3 है
मैंने पहले से ही इस स्क्रिप्ट के साथ अजीब नोड मुद्दों का अनुभव किया है जो मुझे मजबूर करता है जैसे। स्ट्रिंग के रूप में बड़ी फ़ाइलों पर काम करते समय नोड के रूप में कई फाइलों में विभाजित सूचकांक को विभाजित किया गया था। क्या विशाल डेटासेट के साथ नोडज स्मृति प्रबंधन में सुधार करने का कोई तरीका है?