एक दोहरे सीपीयू सर्वर पर, एक सीपीयू को दूसरे की तुलना में हॉट्टर चलाना सामान्य है?


51

मेरे पास एक डुअल ओपेरॉन सर्वर है जो कई वीएम को होस्ट करने के लिए libvirt के साथ लिनक्स चला रहा है। VMs ठीक काम करते हैं और सर्वर ठीक काम करता है, लेकिन मुझे लगता है कि एक सीपीयू हमेशा लगभग 69C (70C पर थ्रोटल्स) चलता है और दूसरा लगभग 15C चलता है।

यह मुझे सामान्य नहीं लगता है? क्या वे दोनों तापमान में थोड़े करीब नहीं होने चाहिए?

मुझे यकीन नहीं है कि किसी और को आगे कैसे बढ़ाया जाए। शायद सीपीयू में से एक पर पर्याप्त थर्मल पेस्ट नहीं है?

संपादित करें: मदरबोर्ड ASUS KGPE-D16 है और दोहरे Noctua NH-U9DO प्रशंसकों द्वारा ठंडा किया गया है ।

ध्यान दें कि मुझे लगता है कि तापमान निरपेक्ष मूल्यों के बजाय परिवेश से ऊपर हो सकता है? जब सर्वर निष्क्रिय हो जाता है, तो CPU तापमान 2C और 13C तक गिर जाता है। मैं यहाँ से lmsensors विन्यास का उपयोग कर रहा हूँ


1
सर्वर मेक / मॉडल क्या है?
इविविट

2
सीपीयू लोड का वितरण कैसे होता है? mpstat -P ALL 1लाइनक्स में मदद मिलेगी
क्रिस्टोफर पेरिन

3
टूटे हुए तापमान संवेदक की तरह लगता है
Matcheek

14
15C बहुत टूटे हुए सेंसर की संभावना है ....
प्रतिक्रिया

यदि आप सर्वर को रिबूट कर सकते हैं, तो टूटे हुए या खराब कैलिब्रेटेड सेंसर की तरह लगता है, BIOS पर एक नज़र डालें, जिसे सही मान प्रदर्शित करना चाहिए।

जवाबों:


106

यह समस्या एक खराब फिट हीट के रूप में समाप्त हो गई। शायद खराब फिट सही वर्णन नहीं है। पता चला, आपको हीट पेस्ट पर थर्मल पेस्ट लगाना है, न कि प्लास्टिक कवर जो हीट सिंक पर चला जाता है।

यहाँ छवि विवरण दर्ज करें

प्लास्टिक कवर को हटाने के बाद, सीपीयू अच्छा और शांत है, सभी को धन्यवाद!


51
+1 सिर्फ इसलिए कि यह मज़ेदार है
HBruijn

9
आपका मतलब है कि किसी ने प्लास्टिक कवर को जगह पर छोड़ दिया और फिर उस पर पेस्ट लगा दिया और फिर उस पर हीटसिंक लगा दिया? महाकाव्य।
टॉमटॉम

4
Baaaaaahaaahaaahahahaa !!
क्रेग

8
मुझे पसंद है कि आप पृष्ठभूमि में नियमों और शर्तों, सीमित वारंटी और रिटर्न नीति को कैसे देख सकते हैं। :)
लाइटनेस रेस मोनिका

6
यदि यह आपको किसी भी कम बेवकूफ महसूस करता है, (और यह नहीं होगा), मैंने अपने नए कार्यालय कॉफी निर्माता के साथ एक समान काम किया। कॉफी पीने के लिए बहुत ठंडा था और मैं इसे वापस करने के लिए दुकान पर वापस पैक कर रहा था, इससे पहले कि सुरक्षात्मक कार्डबोर्ड का एक तार हीटिंग तत्व से दूर चला गया :)
मार्टिन जेम्स

25

मेरे अनुभव में, अलग-अलग तापमान पर चलने के मामले में युग्मित घटकों के लिए यह सामान्य है, क्योंकि हर जगह एयरफ्लो समान नहीं है। यहाँ मेरे colo बॉक्स से HDD तापमान का एक ग्राफ है। ड्राइव मिरर किए गए हैं, इसलिए उन पर काम का बोझ समान के पास है।

पिछले वर्ष के मुकाबले HDD टेम्पों का मौन ग्राफ

जैसा कि आप देख सकते हैं, वे एक दूसरे को ट्रैक करते हैं, लेकिन वे समान नहीं हैं; वे भी, औसतन केवल 6C अलग हैं। चाहे आपके सेंसर निरपेक्ष तापमान या अतिवृद्धि की रिपोर्ट करते हैं, लोड के तहत 55C का अंतर बहुत बुरी तरह से गलत लगता है। यदि आपको विश्वास है कि डेटा सही है, तो 10 सी में अर्ध-भिन्न अंतर की बूंदों को देखते हुए, जो कि एयरफ्लो के कारण मेरे द्वारा देखे जाने वाले अंतर की तरह है, मुझे खराब-फिटेड हीटसिंक पर संदेह होगा।


1
एमपीस्टैट (क्रिस्टोफर पेरिन से, धन्यवाद!) का उपयोग करते हुए मैंने पुष्टि की कि लोड काफी समान रूप से वितरित किया गया है। चीजें अभी + 3C और + 20C पर निष्क्रिय हैं। मैं यह देखने के लिए कि क्या यह ढीली है, हाइटिंक के साथ फ़िडलिंग का प्रयास करने जा रहा हूं। क्या आपको लगता है कि यह एक थर्मल पेस्ट मुद्दा हो सकता है?
समोझ

यह बहुत संभव है (और इतना कि आप इसे शुरू करने के बाद)।
MadHatter

8

यह नहीं। जब तक आपके पास एयरफ्लो के साथ कुछ गंभीर मुद्दे नहीं हैं। या कूलर में से एक खराब है। तापमान अलग-अलग होगा - लेकिन इतना अधिक नहीं (70 बनाम 15 डिग्री सेल्सियस)।

यह देखते हुए कि मैं कितना कम 15 डिग्री है, मैं मान सकता हूं (क) आपका सेंसर बंद है (आप वास्तव में उस शांत कमरे में सर्वर को स्टोर करते हैं)।

मैं यह भी मानूंगा कि सीपीयू में से कोई भी काम नहीं करता है, जो भी कारण हो।

छोटे अंतर सामान्य हैं। कुछ छोटे बड़े हो सकते हैं (मेरे दिमाग में आने वाली एयरफ्लो)। लेकिन यहाँ हम एक COLD होने की बात करते हैं।


2

यह या तो ठंडा या असमान लोड हो सकता है (अस्थायी अंतर को देखते हुए आपकी स्थिति शायद असमान लोड हो रही है)। आपको सभी कोर को समान रूप से लोड करने के लिए प्राइम 95 जैसी किसी चीज़ का उपयोग करना चाहिए और देखना चाहिए कि क्या टेम्पर्स अभी भी अलग-अलग हैं। यदि वे नहीं करते हैं तो आपको वीएम को संतुलित करने की आवश्यकता है, जांचें कि आपके एप्लिकेशन मल्टीथ्रेडेड और व्यस्त हैं। ऐसा कैसे करें जो आपके सॉफ़्टवेयर और व्यक्तिगत कार्यभार पर निर्भर करता है इसलिए वास्तव में प्रश्न के दायरे से परे है। यह ध्यान रखें कि ऐसा करने का कोई वास्तविक लाभ नहीं है यदि आपके पास एक एकल सीपीयू / कोर बाहर निकालने के लिए पर्याप्त भार नहीं है, वास्तव में आपका वीएम जानबूझकर एक दूसरे सीपीयू का उपयोग करने से बच सकता है ताकि यह मल्टी पर पावर सेविंग मोड में जा सके -सीपीयू सिस्टम।

यदि आपने इसे ठंडा करने के लिए संकुचित कर दिया है। 10C तक का एक छोटा सा अंतर बहुत कम (या बहुत अधिक!) थर्मल पेस्ट हो सकता है। एक बड़ा अंतर सीपीयू कूलर के बीच एक महत्वपूर्ण समस्या या अंतर को इंगित करता है। यह हो सकता है कि किसी ने एयरफ्लो को अवरुद्ध कर दिया हो, एक हीटसिंक को ढीला कर दिया गया हो, आदि।


0

मैं साथ, दोषपूर्ण अस्थायी होगा। सेंसर, 15C के रूप में केवल 59F है !!! जब तक कंप्यूटर के एक अत्यंत उन्मत्त डाटासेंटर में, मैं कल्पना नहीं करूंगा कि वायु का तापमान 59F से अधिक होगा! आप वीएम को कम तापमान वाले कोर को सौंपने की कोशिश करते हैं और देखते हैं कि क्या कोई बदलाव है; यदि नहीं, तो मैं सेंसर को दोषपूर्ण होने पर अत्यधिक संदेह करूंगा।

आप dmesg(बूट संदेश) के आउटपुट को देखना चाहते हैं और देख सकते हैं कि क्या वहां कुछ भी सामान्य है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.