Sysbench के साथ बहुत सारे बेंचमार्किंग के बाद, मैं इस नतीजे पर आता हूं:
जीवित रहने के लिए (प्रदर्शन वार) ऐसी स्थिति जहां
- एक दुष्ट प्रतिलिपि प्रक्रिया गंदे पृष्ठों को बाढ़ देती है
- और हार्डवेयर राइट-कैश मौजूद है (संभवतः इसके बिना भी)
- और तुल्यकालिक पढ़ता है या प्रति सेकंड (IOPS) लिखता है महत्वपूर्ण हैं
बस सभी लिफ्ट, कतारों और गंदे पृष्ठ कैश को डंप करें। गंदे पन्नों के लिए सही जगह उस हार्डवेयर राइट-कैश की रैम में है।
जितना संभव हो उतना गंदे_रोटो (या नए गंदे_बाइट्स) को समायोजित करें, लेकिन क्रमिक थ्रूपुट पर नज़र रखें। मेरे विशेष मामले में, 15 एमबी इष्टतम थे ( echo 15000000 > dirty_bytes
)।
यह एक समाधान से अधिक हैक है क्योंकि गीगाबाइट रैम का उपयोग अब गंदे कैश के बजाय केवल कैशिंग पढ़ने के लिए किया जाता है। इस स्थिति में अच्छी तरह से काम करने के लिए गंदे कैश के लिए, लिनक्स कर्नेल बैकग्राउंड फ्लशर को औसत गति की आवश्यकता होती है, जब अंतर्निहित डिवाइस अनुरोधों को स्वीकार करता है और तदनुसार बैकग्राउंड फ्लशिंग को समायोजित करता है। आसान नहीं है।
तुलना के लिए विनिर्देशों और बेंचमार्क:
परीक्षण किया गया जबकि dd
'डिस्क के लिए शून्य, sysbench ने भारी सफलता दिखाई , 10 थ्रेड्स fsync को बढ़ाकर 16 kB पर 33 से 700 IOPS (निष्क्रिय सीमा: 1500 IOPS) और 8 से 400 OOPS तक एकल थ्रेड लिखते हैं।
लोड के बिना, IOPS अप्रभावित थे (~ 1500) और थ्रूपुट थोड़ा कम (251 एमबी / एस से 216 एमबी / एस तक)।
dd
फोन:
dd if=/dev/zero of=dumpfile bs=1024 count=20485672
sysbench के लिए, test_file.0 के साथ असुरक्षित होने के लिए तैयार किया गया था:
dd if=/dev/zero of=test_file.0 bs=1024 count=10485672
10 धागे के लिए sysbench कॉल:
sysbench --test=fileio --file-num=1 --num-threads=10 --file-total-size=10G --file-fsync-all=on --file-test-mode=rndwr --max-time=30 --file-block-size=16384 --max-requests=0 run
एक धागे के लिए sysbench कॉल:
sysbench --test=fileio --file-num=1 --num-threads=1 --file-total-size=10G --file-fsync-all=on --file-test-mode=rndwr --max-time=30 --file-block-size=16384 --max-requests=0 run
छोटे ब्लॉक आकार ने और भी अधिक कठोर संख्याएँ दिखाईं।
-फाइल-ब्लॉक-आकार = 1 जीबी गंदे_बीट्स के साथ 4096:
sysbench 0.4.12: multi-threaded system evaluation benchmark
Running the test with following options:
Number of threads: 1
Extra file open flags: 0
1 files, 10Gb each
10Gb total file size
Block size 4Kb
Number of random requests for random IO: 0
Read/Write ratio for combined random IO test: 1.50
Calling fsync() after each write operation.
Using synchronous I/O mode
Doing random write test
Threads started!
Time limit exceeded, exiting...
Done.
Operations performed: 0 Read, 30 Write, 30 Other = 60 Total
Read 0b Written 120Kb Total transferred 120Kb (3.939Kb/sec)
0.98 Requests/sec executed
Test execution summary:
total time: 30.4642s
total number of events: 30
total time taken by event execution: 30.4639
per-request statistics:
min: 94.36ms
avg: 1015.46ms
max: 1591.95ms
approx. 95 percentile: 1591.30ms
Threads fairness:
events (avg/stddev): 30.0000/0.00
execution time (avg/stddev): 30.4639/0.00
-फाइल-ब्लॉक-साइज = 4096 15 एमबी गंदे_बाइट्स के साथ:
sysbench 0.4.12: multi-threaded system evaluation benchmark
Running the test with following options:
Number of threads: 1
Extra file open flags: 0
1 files, 10Gb each
10Gb total file size
Block size 4Kb
Number of random requests for random IO: 0
Read/Write ratio for combined random IO test: 1.50
Calling fsync() after each write operation.
Using synchronous I/O mode
Doing random write test
Threads started!
Time limit exceeded, exiting...
Done.
Operations performed: 0 Read, 13524 Write, 13524 Other = 27048 Total
Read 0b Written 52.828Mb Total transferred 52.828Mb (1.7608Mb/sec)
450.75 Requests/sec executed
Test execution summary:
total time: 30.0032s
total number of events: 13524
total time taken by event execution: 29.9921
per-request statistics:
min: 0.10ms
avg: 2.22ms
max: 145.75ms
approx. 95 percentile: 12.35ms
Threads fairness:
events (avg/stddev): 13524.0000/0.00
execution time (avg/stddev): 29.9921/0.00
-फाइल-ब्लॉक-साइज = 4096 के साथ 15 एमबी गंदे_बाइट बेकार सिस्टम पर:
sysbench 0.4.12: मल्टी-थ्रेडेड सिस्टम मूल्यांकन बेंचमार्क
Running the test with following options:
Number of threads: 1
Extra file open flags: 0
1 files, 10Gb each
10Gb total file size
Block size 4Kb
Number of random requests for random IO: 0
Read/Write ratio for combined random IO test: 1.50
Calling fsync() after each write operation.
Using synchronous I/O mode
Doing random write test
Threads started!
Time limit exceeded, exiting...
Done.
Operations performed: 0 Read, 43801 Write, 43801 Other = 87602 Total
Read 0b Written 171.1Mb Total transferred 171.1Mb (5.7032Mb/sec)
1460.02 Requests/sec executed
Test execution summary:
total time: 30.0004s
total number of events: 43801
total time taken by event execution: 29.9662
per-request statistics:
min: 0.10ms
avg: 0.68ms
max: 275.50ms
approx. 95 percentile: 3.28ms
Threads fairness:
events (avg/stddev): 43801.0000/0.00
execution time (avg/stddev): 29.9662/0.00
टेस्ट सिस्टम:
- एडेप्टेक 5405Z (जो कि सुरक्षा के साथ 512 एमबी राइट-कैश है)
- इंटेल Xeon L5520
- 6 GiB RAM @ 1066 MHz
- मदरबोर्ड सुपरमाइक्रो X8DTN (5520 चिपसेट)
- 12 सीगेट बाराकुडा 1 टीबी डिस्क
- लिनक्स सॉफ्टवेयर RAID 10 में 10
- कर्नेल 2.6.32
- फ़ाइल सिस्टम xfs
- डेबियन अस्थिर
सारांश में, मुझे अब यकीन है कि यह कॉन्फ़िगरेशन डेटाबेस ट्रैफ़िक के लिए निष्क्रिय, उच्च लोड और यहां तक कि पूर्ण लोड स्थितियों में अच्छा प्रदर्शन करेगा, अन्यथा क्रमिक ट्रैफ़िक द्वारा भूखा हो जाता। अनुक्रमिक थ्रूपुट दो गीगाबिट लिंक से अधिक है, वैसे भी वितरित कर सकते हैं, इसलिए कोई भी समस्या इसे कम करने में नहीं।