SQL सर्वर में "मल्टी-कॉलम आँकड़े" नामक एक चीज़ होती है, लेकिन ऐसा नहीं है कि कोई भी इसका मतलब होगा।
आइए निम्नलिखित नमूना तालिका पर एक नज़र डालें:
CREATE TABLE BadStatistics
(
IsArchived BIT NOT NULL,
Id INT NOT NULL IDENTITY PRIMARY KEY,
Mystery VARCHAR(200) NOT NULL
);
CREATE NONCLUSTERED INDEX BadIndex
ON BadStatistics (IsArchived, Mystery);
इसके साथ, हमारे पास दो सूचकांक पर दो आँकड़े बनाए जा रहे हैं:
BadIndex के लिए आँकड़े:
+--------------+----------------+-------------------------+
| All density | Average Length | Columns |
+--------------+----------------+-------------------------+
| 0.5 | 1 | IsArchived |
+--------------+----------------+-------------------------+
| 4.149378E-06 | 37 | IsArchived, Mystery |
+--------------+----------------+-------------------------+
| 4.149378E-06 | 41 | IsArchived, Mystery, Id |
+--------------+----------------+-------------------------+
+--------------+------------+---------+---------------------+----------------+
| RANGE_HI_KEY | RANGE_ROWS | EQ_ROWS | DISTINCT_RANGE_ROWS | AVG_RANGE_ROWS |
+--------------+------------+---------+---------------------+----------------+
| 0 | 0 | 24398 | 0 | 1 |
+--------------+------------+---------+---------------------+----------------+
| 1 | 0 | 216602 | 0 | 1 |
+--------------+------------+---------+---------------------+----------------+
गुच्छेदार सूचकांक के लिए आँकड़े:
+--------------+----------------+---------+
| All density | Average Length | Columns |
+--------------+----------------+---------+
| 4.149378E-06 | 4 | Id |
+--------------+----------------+---------+
+--------------+------------+---------+---------------------+----------------+
| RANGE_HI_KEY | RANGE_ROWS | EQ_ROWS | DISTINCT_RANGE_ROWS | AVG_RANGE_ROWS |
+--------------+------------+---------+---------------------+----------------+
| 1 | 0 | 1 | 0 | 1 |
+--------------+------------+---------+---------------------+----------------+
| 240999 | 240997 | 1 | 240997 | 1 |
+--------------+------------+---------+---------------------+----------------+
| 241000 | 0 | 1 | 0 | 1 |
+--------------+------------+---------+---------------------+----------------+
(मैंने यादृच्छिक नमूना डेटा के साथ तालिका को पॉपुलेट किया है, जहां पंक्तियों के दसवें हिस्से के बारे में गैर-संग्रहीत हैं। मैंने बाद में एक पूर्ण स्कैन आँकड़े अपडेट चलाया।)
दो-स्तंभ आँकड़ों का हिस्टोग्राम केवल एक स्तंभ का उपयोग क्यों करता है? मुझे पता है कि कई लोगों ने लिखा है कि यह करता है , लेकिन तर्क क्या है? इस मामले में, यह पूरे हिस्टोग्राम को बहुत कम उपयोगी बनाता है, क्योंकि पहले कॉलम में केवल दो मान होते हैं। सांख्यिकी को मनमाने ढंग से प्रतिबंधित क्यों किया जाएगा?
कृपया ध्यान दें कि यह प्रश्न बहु-आयामी हिस्टोग्राम के संदर्भ में नहीं है, जो कि एक पूरी तरह से अलग जानवर हैं। यह एकल-आयामी हिस्टोग्राम के बारे में है, जिसमें एकल आयाम संबंधित, कई स्तंभों वाले ट्यूपल हैं।