बेहतर संग्रहण में अपग्रेड करने के बाद चेकपॉइंट के दौरान बढ़ी हुई प्रतीक्षा


9

जब हम एक पुराने सभी फ्लैश सरणी से चले गए, एक नए सभी फ्लैश सरणी (अलग, लेकिन अच्छी तरह से स्थापित विक्रेता) के लिए, हमने चौकियों के दौरान SQL संतरी में बढ़े हुए इंतजार को देखना शुरू कर दिया।

संस्करण: SQL सर्वर 2012 Sp4

हमारे पुराने स्टोरेज पर हमारा इंतजार 2k के आसपास "स्पाइक्स" से 2500 तक एक चेकपॉइंट के दौरान था, नए स्टोरेज के साथ स्पाइक्स आमतौर पर 50k के पास चोटियों के साथ 10k हैं। संतरी हमें PAGEIOLATCHविटनेस की ओर अधिक इशारा करते हैं। हमारा खुद का विश्लेषण करना, यह PAGEIOLATCH and PAGELATCHप्रतीक्षा का एक संयोजन प्रतीत होता है । परफ्यूम का उपयोग करते हुए, हम आम तौर पर हम जितने अधिक पेजों की जांच करते हैं, उतने अधिक प्रतीक्षा कर सकते हैं, लेकिन हम केवल चौकी के दौरान ~ 125 एमबी तक ही फ्लश कर रहे हैं। हमारा काम का बोझ ज्यादातर लिखता है (मुख्य रूप से सम्मिलित करता है / अपडेट करता है)।

स्टोरेज वेंडर ने हमें यह साबित कर दिया है कि इन चेकपॉइंट इवेंट्स के दौरान फाइबर चैनल डायरेक्ट अटैच्ड सरणी उप 1 ms का जवाब दे रहा है। HBA भी सरणी की संख्या की पुष्टि करता है। हम यह भी नहीं मानते हैं कि यह एचबीए कतार का मुद्दा है क्योंकि कतार की गहराई कभी भी 8 से ऊपर नहीं थी। हमने एक नया एचबीए भी आजमाया है, जिसमें ZIO, निष्पादन थ्रॉटल और कतार गहराई सेटिंग्स को कोई लाभ नहीं हुआ है। हमने बिना किसी बदलाव के साथ सर्वर की मेमोरी को 500 जीबी से बढ़ाकर 1 टीबी कर दिया है। चेकपॉइंट प्रक्रिया के दौरान हम 2 - 4 व्यक्तिगत कोर (16 में से) को 100% तक देखते हैं, लेकिन समग्र सीपीयू लगभग 20% है। BIOS उच्च प्रदर्शन के लिए भी सेट है। दिलचस्प बात यह है कि, हम देखते हैं कि सीपीयू आमतौर पर C2 स्लीप अवस्था में होते हैं, भले ही हमने उसे निष्क्रिय कर दिया हो, इसलिए हम अभी भी इस बात पर शोध कर रहे हैं कि स्लीप अवस्था पिछले C1 में क्यों जाती है।

हम देख सकते हैं कि लगभग सभी वेट डीसीएम पृष्ठ प्रकार के सामयिक पीएफएस के साथ डेटा पृष्ठों पर हैं। प्रतीक्षा उपयोगकर्ता DBs में हैं, tempdb नहीं। हम यह भी देखते हैं कि प्रतीक्षा कई डेटा पृष्ठों पर होती है, कुछ SPID उसी पृष्ठ पर प्रतीक्षा कर रहे हैं। डेटाबेस डिजाइन में गर्म स्थान डालने के एक जोड़े होते हैं, लेकिन पुराने भंडारण के साथ एक ही डिजाइन था।

इस क्वेरी के 100 बार लूप चलाने पर, हम डिस्क बनाम मेमोरी पर कितने SPID का इंतजार कर रहे थे

SELECT
    [owt].[wait_type], count(*) as waitcount
FROM sys.dm_os_waiting_tasks [owt]
WHERE [owt].[wait_type] LIKE 'PAGE%'
group by [owt].[wait_type]
order by 1
GO 100

यहां छवि विवरण दर्ज करें

"अच्छी" बात यह है कि हम आसानी से अपने आदर्श वातावरण में समस्या को पुन: उत्पन्न कर सकते हैं जिसमें समान मॉडल सरणी और समान सर्वर चश्मा है। मैं किसी भी विचार पर सराहना करूँगा कि समस्या को कैसे और कैसे देखा जाए। अभी हमारे अगले परीक्षणों में शामिल हैं: नया मदरबोर्ड और अधिक सीपीयू के साथ एक नया सर्वर; SIOS डेटाकेपर को निष्क्रिय करना (भले ही यह पुराने भंडारण के साथ हो); अलग एचबीए ब्रांड।

exec sp_Blitz @outputtype = 'markdown'

प्राथमिकता 5: विश्वसनीयता : - खतरनाक थर्ड पार्टी मॉड्यूल - सोफोस लिमिटेड - सोफोस बफर ओवररन प्रोटेक्शन - SOPHOS ~ 2.DLL - संदिग्ध खतरनाक थर्ड पार्टी मॉड्यूल स्थापित है।

प्राथमिकता 200: सूचनात्मक : - क्लस्टर नोड - यह एक क्लस्टर में एक नोड है। - ट्रेसफ्लैग ऑन - ट्रेस फ्लैग 1117 विश्व स्तर पर सक्षम है। - विश्व स्तर पर ट्रेस ध्वज 1118 सक्षम है। - विश्व स्तर पर ट्रेस ध्वज 3226 सक्षम है।

वरीयता 200: लाइसेंसिंग : - एंटरप्राइज़ संस्करण में उपयोग में सुविधाएँ * XXXXX - [xxxxxx] डेटाबेस संपीड़न का उपयोग कर रहा है। यदि इस डेटाबेस को एक मानक संस्करण सर्वर पर बहाल किया जाता है, तो पुनर्स्थापना 2016 SP1 से पहले के संस्करणों पर विफल हो जाएगी। * xxxxx - [xxxxxx] डेटाबेस विभाजन का उपयोग कर रहा है। यदि इस डेटाबेस को एक मानक संस्करण सर्वर पर बहाल किया जाता है, तो पुनर्स्थापना 2016 SP1 से पहले के संस्करणों पर विफल हो जाएगी।

प्राथमिकता २४०: वेट स्टैट्स : - कोई महत्त्वपूर्ण प्रतीक्षा नहीं की गई - यह सर्वर अभी बेकार बैठे हैं, या हो सकता है कि किसी ने प्रतीक्षा आँकड़े हाल ही में साफ़ किए हों।

प्राथमिकता 250: सर्वर जानकारी: - हार्डवेयर - लॉजिकल प्रोसेसर: 16. भौतिक मेमोरी: 512GB। - हार्डवेयर - NUMA कॉन्फ़िगरेशन - नोड: 0 राज्य: ऑनलाइन ऑनलाइन अनुसूचक: 8 ऑफ़लाइन अनुसूचक: 0 प्रोसेसर समूह: 0 मेमोरी नोड: 0 मेमोरी VAS आरक्षित GB: 1177 - नोड: 1 राज्य: ऑनलाइन ऑनलाइन अनुसूचक: 8 ऑफ़लाइन अनुसूचक: 0 प्रोसेसर समूह: 0 मेमोरी नोड: 1 मेमोरी वीएएस आरक्षित जीबी: 0 - पावर प्लान - आपके सर्वर में 3.50GHz सीपीयू है, और उच्च प्रदर्शन पावर मोड में है - सर्वर लास्ट रिस्टार्ट - Jul 4 2018 4:56 AM - एसक्यूएल सर्वर लास्ट रिस्टार्ट - Jul 5 2018 5:11 AM - SQL सर्वर सेवा - संस्करण: 11.0.7462.6। पैच स्तर: एसपी 4। संस्करण: एंटरप्राइज़ संस्करण (64-बिट)। उपलब्धता समूह सक्षम: 1. उपलब्धता समूह प्रबंधक स्थिति: 1 - वर्चुअल सर्वर - प्रकार: (HYPERVISOR) - विंडोज संस्करण - आप विंडोज का एक बहुत ही आधुनिक संस्करण चला रहे हैं: सर्वर 2012R2 युग, संस्करण 6.3

प्राथमिकता 200: नॉन-डिफॉल्ट सर्वर कॉन्फिग: - Agent XPs - यह sp_configure विकल्प बदल दिया गया है। इसका डिफ़ॉल्ट मान 0 है और इसे 1 पर सेट किया गया है - बैकअप संपीड़न डिफ़ॉल्ट - यह sp_configure विकल्प बदल दिया गया है। इसका डिफ़ॉल्ट मान 0 है और इसे 1. - अवरोधित प्रक्रिया थ्रेशोल्ड (s) पर सेट किया गया है - इस sp_configure विकल्प को बदल दिया गया है। इसका डिफ़ॉल्ट मान 0 है और इसे 20 पर सेट किया गया है। - समानता के लिए लागत सीमा - इस sp_configure विकल्प को बदल दिया गया है। इसका डिफ़ॉल्ट मान 5 है और इसे 30 पर सेट किया गया है। - डेटाबेस मेल XPs - इस sp_configure विकल्प को बदल दिया गया है। इसका डिफ़ॉल्ट मान 0 है और इसे 1 पर सेट किया गया है। - अधिकतम डिग्री की समानता - यह sp_configure विकल्प बदल दिया गया है। इसका डिफ़ॉल्ट मान 0 है और इसे 8 पर सेट किया गया है - अधिकतम सर्वर मेमोरी (MB) - इस sp_configure विकल्प को बदल दिया गया है। इसका डिफ़ॉल्ट मान 2147483647 है और इसे 496640 पर सेट किया गया है। - न्यूनतम सर्वर मेमोरी (एमबी) - यह sp_configure विकल्प बदल दिया गया है। इसका डिफ़ॉल्ट मान 0 है और इसे 8196 पर सेट किया गया है। - तदर्थ कार्यभार के लिए अनुकूलन - इस sp_configure विकल्प को बदल दिया गया है। इसका डिफ़ॉल्ट मान 0 है और इसे 1 पर सेट किया गया है - रिमोट एक्सेस - इस sp_configure विकल्प को बदल दिया गया है। इसका डिफ़ॉल्ट मान 1 है और इसे 0. - दूरस्थ व्यवस्थापक कनेक्शन पर सेट किया गया है - इस sp_configure विकल्प को बदल दिया गया है। इसका डिफ़ॉल्ट मान 0 है और इसे 1 पर सेट किया गया है - स्टार्टअप प्रोक्स के लिए स्कैन - इस sp_configure विकल्प को बदल दिया गया है। इसका डिफ़ॉल्ट मान 0 है और इसे 1 पर सेट किया गया है - उन्नत विकल्प दिखाएं - इस sp_configure विकल्प को बदल दिया गया है। इसका डिफ़ॉल्ट मान 0 है और इसे 1 पर सेट किया गया है - xp_cmdshell - इस sp_configure विकल्प को बदल दिया गया है।


उल्लेख करना भूल गए ... SQL 2012 SP4
Doley

क्या आप परिणामों के साथ sp_Blitz चला सकते हैं @OutputType = 'MARKDOWN'और परिणाम पोस्ट कर सकते हैं ?
किन्न शाह

मैंने उन्हें पोस्ट में जोड़ा (मुझे लगा कि वे उपयोगी थे)।
डोईले

क्या आपने एक I / O भारी कार्य किया है जैसे कि एक बड़े सूचकांक का पुनर्निर्माण और पुराने के साथ समय की तुलना में SAN? यह पुराने के रूप में एक ही Flash प्रकार है SAN? संस्करणों के लेआउट के बारे में और उन्हें अन्य अनुप्रयोगों या सर्वरों के साथ साझा करने के बारे में क्या?
एलन

1
और क्या आपके पास डेटाबेस, लॉग और टेम्पर्डब के बीच नए सरणी पर समान स्तर है? चेकपॉइंट डेटाबेस फ़ाइलों को स्लैम करता है, लेकिन उन ड्राइव पर अन्य IO के साथ विरोध कर सकता है।
डेविड ब्राउन - Microsoft

जवाबों:


1

हम्म। आप चेकपॉइंट के दौरान वेटिंग दिखाते हैं, लेकिन यह नहीं कि कब तक औसत / कुल मिलाकर प्रतीक्षा करें (जो कि, ईमानदारी से, मुझे सब ध्यान होगा)। यह देखने के लिए कि क्या अवधि चिंता की है, अंतर विश्लेषण आँकड़े विश्लेषण करें। इसके अलावा, क्या वास्तव में आपके चार्ट में दो इंतजार कर रहे हैं? अगर आपको 1 जीबी रैम के साथ बहुत सारे मेमोरी ग्रांट वेट मिल रहे हैं तो हमें एक अलग चर्चा करने की आवश्यकता है। :-D

चौकी के दौरान 125MB लेखन गति: क्या सिर्फ चौकी लिखती है या सभी? किसी भी तरह से यह सभी फ्लैश स्टोरेज के लिए कम लगता है। क्या आपने बेंचमार्क में विभिन्न लेखन पैटर्न के लिए भंडारण की बात कही है और यदि ऐसा है तो आपको कितने अंक मिले?


0

हमें यकीन नहीं है कि हमारे एसक्यूएल सर्वर का व्यवहार क्यों बदल गया (और हमारे पास इसका सबूत है कि यह स्टोरेज स्विच से पहले हुआ है), लेकिन उपयोगकर्ता डीबी के लिए अप्रत्यक्ष चौकियों को सक्षम करने से हमारे लिए समस्या तय हो गई है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.