क्या sys.stats_columns गलत है?

मान लें कि मेरे पास Fooकॉलम के साथ एक तालिका है ID1, ID2और एक समग्र प्राथमिक कुंजी परिभाषित है ID2, ID1। (मैं वर्तमान में एक सिस्टम सेंटर उत्पाद के साथ काम कर रहा हूं जिसमें कई टेबल हैं जो तालिका परिभाषा में दिखाई देने वाले विपरीत क्रम में सूचीबद्ध प्राथमिक कुंजी स्तंभों के साथ इस तरह परिभाषित हैं।)

CREATE TABLE dbo.Foo(
  ID1 int NOT NULL,
  ID2 int NOT NULL,
CONSTRAINT [PK_Foo] PRIMARY KEY CLUSTERED (ID2, ID1)
);
GO

-- Add a row and update stats so that histogram isn't empty
INSERT INTO Foo (ID1, ID2) VALUES (1,2);
UPDATE STATISTICS dbo.Foo;

key_ordinalमें स्तंभ sys.index_columnsसे पता चलता है उसी क्रम में वे समग्र प्राथमिक कुंजी में घोषित किया गया में सूचकांक कॉलम:

SELECT t.name, i.name, c.column_id, c.name, ic.index_column_id, ic.key_ordinal
FROM sys.tables AS t
JOIN sys.indexes AS i
ON t.[object_id] = i.[object_id]
JOIN sys.index_columns AS ic
ON ic.[object_id] = i.[object_id]
AND ic.index_id = i.index_id
JOIN sys.columns AS c
ON ic.column_id = c.column_id
AND ic.[object_id] = c.[object_id]
WHERE t.name = 'Foo';

सूची

हिस्टोग्राम भी उसी क्रम में आँकड़े दिखाता है:

DBCC SHOW_STATISTICS ('Foo',PK_Foo);

आँकड़े

हालाँकि, sys.stats_columnsउलटा क्रम ( ID1, ID2) में सूचीबद्ध कॉलम दिखाता है ।

SELECT s.name, sc.stats_column_id, c.name
FROM sys.stats AS s
JOIN sys.stats_columns AS sc 
ON s.stats_id = sc.stats_id 
AND s.[object_id] = sc.[object_id] 
JOIN sys.columns AS c 
ON c.[object_id] = s.[object_id]
AND c.column_id = sc.column_id
JOIN sys.objects AS o 
ON o.[object_id] = c.[object_id] 
WHERE o.name = 'Foo'
AND s.name = 'PK_Foo';

stats_columns

पुस्तकें ऑनलाइन कहती stats_column_idहैं, "सांख्यिकी स्तंभों के सेट के भीतर 1-आधारित ऑर्डिनल है," इसलिए मैं मान 1 की अपेक्षा कर रहा था कि आंकड़े ऑब्जेक्ट में पहले कॉलम को इंगित करें।

क्या यह sys.stats_columnsमेरी ओर से एक बग या गलतफहमी है?

मैंने सत्यापित किया है कि यह व्यवहार SQL Server 2005, 2008, 2008 R2, 2012 और 2014 के वर्तमान बिल्ड पर होता है।

sys.stats_columns उदाहरण के लिए, अन्य स्थितियों में सांख्यिकी ऑब्जेक्ट के भीतर ऑर्डर को प्रतिबिंबित करने के लिए लगता है:

CREATE TABLE dbo.Foo2(
  ID1 int NOT NULL,
  ID2 int NOT NULL,
  ID3 int NULL,
  String VARCHAR(10) NULL,
CONSTRAINT [PK_Foo2] PRIMARY KEY CLUSTERED (ID2, ID1)
);

GO

INSERT INTO Foo2 (ID1, ID2, ID3, String) VALUES (1,2,3,'String');

CREATE STATISTICS ST_Test ON Foo2 (ID3, String);
CREATE STATISTICS ST_Test2 ON Foo2 (String, ID3);

DBCC SHOW_STATISTICS ('Foo2',ST_Test);
DBCC SHOW_STATISTICS ('Foo2',ST_Test2);


SELECT s.name, sc.stats_column_id, c.name
FROM sys.stats AS s
JOIN sys.stats_columns AS sc 
ON s.stats_id = sc.stats_id 
AND s.[object_id] = sc.[object_id] 
JOIN sys.columns AS c 
ON c.[object_id] = s.[object_id]
AND c.column_id = sc.column_id
JOIN sys.objects AS o 
ON o.[object_id] = c.[object_id] 
WHERE o.name = 'Foo2'
AND s.name LIKE 'ST_Test%';

morestats

यहाँ एक और उदाहरण है जहाँ sys.stats_columnsसही डेटा वापस आता है, इस बार एक सूचकांक पर आँकड़ों के लिए:

--drop table dbo.Foo3
CREATE TABLE dbo.Foo3(
  ID1 int NOT NULL,
  ID2 int NOT NULL,
  ID3 int NULL,
  String VARCHAR(10) NULL,
CONSTRAINT [PK_Foo3] PRIMARY KEY CLUSTERED (ID2, ID1)
);

GO

INSERT INTO Foo3 (ID1, ID2, ID3, String) VALUES (1,2,3,'String');
UPDATE STATISTICS Foo3;

CREATE INDEX IX_Test ON Foo3 (ID3, String);
CREATE INDEX IX_Test2 ON Foo3 (String, ID3);

DBCC SHOW_STATISTICS ('Foo3',IX_Test);
DBCC SHOW_STATISTICS ('Foo3',IX_Test2);

SELECT s.name, sc.stats_column_id, c.name
FROM sys.stats AS s
JOIN sys.stats_columns AS sc 
ON s.stats_id = sc.stats_id 
AND s.[object_id] = sc.[object_id] 
JOIN sys.columns AS c 
ON c.[object_id] = s.[object_id]
AND c.column_id = sc.column_id
JOIN sys.objects AS o 
ON o.[object_id] = c.[object_id] 
WHERE o.name = 'Foo3'
AND s.name LIKE 'IX_Test%';

moremorestats

sql-server statistics

— जेम्स एल
स्रोत

मैंने कुछ महीने पहले भी यही सवाल किया था, लेकिन इसे हटा दिया। उसके लिए माफ़ करना। फिर भी, stats_column_idमें sys.stats_columnsयह क्या कहते हैं यह करता है करने के लिए प्रतीत नहीं होता। क्योंकि आप एक इंडेक्स का समर्थन कर रहे हैं, मैं इंडेक्स कॉलम ऑर्डर के साथ रहना चाहूंगा। तुम सिर्फ आँकड़े देख रहे हैं ऐसा लगता है कि वस्तुओं index_col()वर्तमान में सबसे अच्छा विकल्प है

— swasheck

शायद आपको इसके लिए Microsoft कनेक्ट आइटम दर्ज करना चाहिए / कर सकता है? मुझे छोटी लगती है।

— मैक्स वर्नोन

@MaxVernon, swashesk ने यहां

— James L

यह एक दीर्घकालिक त्रुटि प्रतीत होती है:

स्वैसेक - 5 मार्च, 2015 पोस्ट किया गया:

https://connect.microsoft.com/SQLServer/feedback/details/1163126

MSDN नोट जो sys.stats_columns.stats_column_id है, "आंकड़े कॉलम के भीतर 1-आधारित ऑर्डिनल है।" हालाँकि, यह वास्तव में तालिका परिभाषा क्रम को दर्शाता है। अनुक्रमणिका क्रम को sys.stats_columns में परिलक्षित नहीं किया जाता है।

मैक्स वर्नोन और जेम्स लुपोल्ट अपनी टिप्पणियों / प्रोत्साहन के आधार पर सहमत प्रतीत होते हैं।

— RLF
स्रोत