पहला शब्द
आप सुरक्षित रूप से नीचे दिए गए अनुभागों को अनदेखा कर सकते हैं (और शामिल हैं) JOINs: यदि आप कोड की एक दरार लेना चाहते हैं तो शुरू करना। पृष्ठभूमि और परिणाम सिर्फ संदर्भ के रूप में सेवा करते हैं। कृपया 2015-10-06 से पहले के संपादन इतिहास को देखें यदि आप यह देखना चाहते हैं कि कोड शुरू में कैसा दिखता था।
लक्ष्य
अंत में मैं तालिका में उपलब्ध जीपीएस डेटा की तारीख समय टिकटों के आधार पर ट्रांसमीटर ( X
या Xmit
) के लिए प्रक्षेपित जीपीएस निर्देशांक की गणना करना चाहता हूं जो तालिका में SecondTable
सीधे अवलोकन को फ्लैंक करता है FirstTable
।
अंतिम उद्देश्य को पूरा करने का मेरा तात्कालिक उद्देश्य यह पता लगाना है कि उन फ़्लैंकिंग समय बिंदुओं को प्राप्त FirstTable
करने के SecondTable
लिए सबसे अच्छा कैसे शामिल किया जाए। बाद में मैं उस जानकारी का उपयोग कर सकता हूं जो मैं एक समभुज निर्देशांक प्रणाली के साथ रैखिक फिटिंग मानने वाले मध्यवर्ती जीपीएस निर्देशांक की गणना कर सकता हूं (यह कहने के लिए फैंसी शब्द कि मुझे परवाह नहीं है कि पृथ्वी इस पैमाने पर एक क्षेत्र है)।
प्रशन
- क्या समय से पहले टिकटों के निकटतम और उत्पन्न करने का एक अधिक कुशल तरीका है?
- केवल "के बाद" को हथियाने और फिर "पहले" प्राप्त करने के द्वारा खुद के द्वारा निर्धारित किया गया है क्योंकि यह "बाद" से संबंधित है।
- क्या कोई अधिक सहज तरीका है जो
(A<>B OR A=B)
संरचना को शामिल नहीं करता है ।- Byrdzeye ने मूल विकल्प प्रदान किए, हालाँकि मेरा "वास्तविक दुनिया" का अनुभव उनकी सभी 4 रणनीतियों के साथ समान प्रदर्शन नहीं कर पाया। लेकिन वैकल्पिक जुड़ाव शैलियों को संबोधित करने के लिए उन्हें पूरा श्रेय।
- कोई अन्य विचार, चाल और सलाह जो आपके पास हो सकती है।
- दोनों thusfar byrdzeye और Phrancis इस संबंध में काफी मददगार रहे हैं। मैंने पाया कि फ्राँसिस की सलाह को बहुत अच्छी तरह से सामने रखा गया था और एक महत्वपूर्ण स्तर पर सहायता प्रदान की थी, इसलिए मैं उसे यहाँ किनारे दे दूँगा।
मैं अभी भी किसी भी अतिरिक्त मदद की सराहना करता हूं जो मुझे प्रश्न 3 के संबंध में मिल सकती है। बुलेटप्वाइंट यह दर्शाता है कि मैं कौन मानता हूं कि मैंने व्यक्तिगत प्रश्न पर सबसे अधिक मदद की।
टेबल परिभाषाएँ
अर्ध-दृश्य प्रतिनिधित्व
FirstTable
Fields
RecTStamp | DateTime --can contain milliseconds via VBA code (see Ref 1)
ReceivID | LONG
XmitID | TEXT(25)
Keys and Indices
PK_DT | Primary, Unique, No Null, Compound
XmitID | ASC
RecTStamp | ASC
ReceivID | ASC
UK_DRX | Unique, No Null, Compound
RecTStamp | ASC
ReceivID | ASC
XmitID | ASC
SecondTable
Fields
X_ID | LONG AUTONUMBER -- seeded after main table has been created and already sorted on the primary key
XTStamp | DateTime --will not contain partial seconds
Latitude | Double --these are in decimal degrees, not degrees/minutes/seconds
Longitude | Double --this way straight decimal math can be performed
Keys and Indices
PK_D | Primary, Unique, No Null, Simple
XTStamp | ASC
UIDX_ID | Unique, No Null, Simple
X_ID | ASC
ReceiverDetails टेबल
Fields
ReceivID | LONG
Receiver_Location_Description | TEXT -- NULL OK
Beginning | DateTime --no partial seconds
Ending | DateTime --no partial seconds
Lat | DOUBLE
Lon | DOUBLE
Keys and Indicies
PK_RID | Primary, Unique, No Null, Simple
ReceivID | ASC
ValidXmitters तालिका
Field (and primary key)
XmitID | TEXT(25) -- primary, unique, no null, simple
एसक्यूएल फिडल ...
... ताकि आप टेबल परिभाषाओं और कोड के साथ खेल सकें। यह सवाल MSAccess के लिए है, लेकिन जैसा कि Phrancis ने बताया है, Access के लिए कोई SQL फिडल स्टाइल नहीं है। तो, आपको यहाँ जाने में सक्षम होना चाहिए कि मेरी सारणी की परिभाषाएँ और कोड Phrancis के उत्तर के आधार पर देखें : http://sqlfiddle.com/## .6/e9942
/4 (बाहरी लिंक)
JOINs: शुरू हो रहा है
मेरी वर्तमान "आंतरिक हिम्मत" जोइन रणनीति
सबसे पहले एक FirstTable_rekeyed को कॉलम ऑर्डर और कंपाउंड प्राइमरी की के साथ (RecTStamp, ReceivID, XmitID)
अनुक्रमित / सॉर्ट करें ASC
। मैंने प्रत्येक कॉलम पर अलग-अलग इंडेक्स भी बनाए। फिर इसे ऐसे भरें।
INSERT INTO FirstTable_rekeyed (RecTStamp, ReceivID, XmitID)
SELECT DISTINCT ROW RecTStamp, ReceivID, XmitID
FROM FirstTable
WHERE XmitID IN (SELECT XmitID from ValidXmitters)
ORDER BY RecTStamp, ReceivID, XmitID;
उपरोक्त क्वेरी नई तालिका को 153006 रिकॉर्ड के साथ भरती है और 10 सेकंड या उससे अधिक के भीतर लौटती है।
जब यह पूरी विधि "सिलेक्ट काउंट (*) FROM (...)" में लिपट जाती है तो एक या दो सेकंड के भीतर पूरा हो जाता है जब TOP 1 सबक्वेरी विधि का उपयोग किया जाता है
SELECT
ReceiverRecord.RecTStamp,
ReceiverRecord.ReceivID,
ReceiverRecord.XmitID,
(SELECT TOP 1 XmitGPS.X_ID FROM SecondTable as XmitGPS WHERE ReceiverRecord.RecTStamp < XmitGPS.XTStamp ORDER BY XmitGPS.X_ID) AS AfterXmit_ID
FROM FirstTable_rekeyed AS ReceiverRecord
-- INNER JOIN SecondTable AS XmitGPS ON (ReceiverRecord.RecTStamp < XmitGPS.XTStamp)
GROUP BY RecTStamp, ReceivID, XmitID;
-- No separate join needed for the Top 1 method, but it would be required for the other methods.
-- Additionally no restriction of the returned set is needed if I create the _rekeyed table.
-- May not need GROUP BY either. Could try ORDER BY.
-- The three AfterXmit_ID alternatives below take longer than 3 minutes to complete (or do not ever complete).
-- FIRST(XmitGPS.X_ID)
-- MIN(XmitGPS.X_ID)
-- MIN(SWITCH(XmitGPS.XTStamp > ReceiverRecord.RecTStamp, XmitGPS.X_ID, Null))
पिछले "आंतरिक हिम्मत" क्वेरी में शामिल हों
पहला (व्रत ... लेकिन बहुत अच्छा नहीं)
SELECT
A.RecTStamp,
A.ReceivID,
A.XmitID,
MAX(IIF(B.XTStamp<= A.RecTStamp,B.XTStamp,Null)) as BeforeXTStamp,
MIN(IIF(B.XTStamp > A.RecTStamp,B.XTStamp,Null)) as AfterXTStamp
FROM FirstTable as A
INNER JOIN SecondTable as B ON
(A.RecTStamp<>B.XTStamp OR A.RecTStamp=B.XTStamp)
GROUP BY A.RecTStamp, A.ReceivID, A.XmitID
-- alternative for BeforeXTStamp MAX(-(B.XTStamp<=A.RecTStamp)*B.XTStamp)
-- alternatives for AfterXTStamp (see "Aside" note below)
-- 1.0/(MAX(1.0/(-(B.XTStamp>A.RecTStamp)*B.XTStamp)))
-- -1.0/(MIN(1.0/((B.XTStamp>A.RecTStamp)*B.XTStamp)))
दूसरा (धीमा)
SELECT
A.RecTStamp, AbyB1.XTStamp AS BeforeXTStamp, AbyB2.XTStamp AS AfterXTStamp
FROM (FirstTable AS A INNER JOIN
(select top 1 B1.XTStamp, A1.RecTStamp
from SecondTable as B1, FirstTable as A1
where B1.XTStamp<=A1.RecTStamp
order by B1.XTStamp DESC) AS AbyB1 --MAX (time points before)
ON A.RecTStamp = AbyB1.RecTStamp) INNER JOIN
(select top 1 B2.XTStamp, A2.RecTStamp
from SecondTable as B2, FirstTable as A2
where B2.XTStamp>A2.RecTStamp
order by B2.XTStamp ASC) AS AbyB2 --MIN (time points after)
ON A.RecTStamp = AbyB2.RecTStamp;
पृष्ठभूमि
मेरे पास 1 मिलियन प्रविष्टियों के तहत एक टेलीमेट्री टेबल (ए के रूप में उर्फ) है DateTime
, जिसमें एक स्टांप, एक ट्रांसमीटर आईडी और एक रिकॉर्डिंग डिवाइस आईडी के आधार पर एक प्राथमिक प्राथमिक कुंजी है । मेरे नियंत्रण से परे परिस्थितियों के कारण, मेरी SQL भाषा Microsoft Access में मानक जेट DB है (उपयोगकर्ता 2007 और बाद के संस्करणों का उपयोग करेंगे)। इनमें से केवल 200,000 प्रविष्टियाँ ट्रांसमीटर आईडी के कारण क्वेरी के लिए प्रासंगिक हैं।
एक दूसरी टेलीमेट्री टेबल (उर्फ बी) है जिसमें एक ही DateTime
प्राथमिक कुंजी के साथ लगभग 50,000 प्रविष्टियां शामिल हैं
पहले चरण के लिए, मैंने दूसरी तालिका से पहली तालिका में टिकटों के निकटतम टाइमस्टैम्प को खोजने पर ध्यान केंद्रित किया।
परिणाम प्राप्त करें
Quirks कि मैंने खोजा है ...
... डिबगिंग के दौरान रास्ते के साथ
JOIN
तर्क लिखने में बहुत अजीब लगता है, जैसा FROM FirstTable as A INNER JOIN SecondTable as B ON (A.RecTStamp<>B.XTStamp OR A.RecTStamp=B.XTStamp)
कि @byrdzeye ने एक टिप्पणी में बताया (जो गायब हो गया है) क्रॉस-जॉइन का एक रूप है। ध्यान दें कि प्रतिस्थापन LEFT OUTER JOIN
के लिए INNER JOIN
प्रकट होता है इसके बाद के संस्करण कोड में मात्रा या लाइनों लौटे की पहचान करने में कोई प्रभाव बनाने के लिए। मैं भी बंद खंड या कहने के लिए छोड़ने के लिए प्रतीत नहीं कर सकते ON (1=1)
। इस क्वेरी में दी गई पंक्तियों के परिणाम में (बजाय INNER
या उससे LEFT OUTER
JOIN
) सम्मिलित होने के लिए Count(select * from A) * Count(select * from B)
केवल एक प्रति तालिका ए के बजाय (ए <> बी या ए = बी) के रूप में स्पष्ट JOIN
रिटर्न देता है। यह स्पष्ट रूप से उपयुक्त नहीं है। FIRST
एक यौगिक प्राथमिक कुंजी प्रकार दिए गए उपयोग करने के लिए उपलब्ध प्रतीत नहीं होता है।
दूसरी JOIN
शैली, हालांकि यकीनन अधिक सुपाठ्य है, धीमे होने के कारण। ऐसा इसलिए हो सकता है क्योंकि JOIN
बड़ी तालिका के साथ-साथ CROSS JOIN
दोनों विकल्पों में पाए गए दो s के लिए एक अतिरिक्त दो आंतरिक s की आवश्यकता होती है ।
एक IIF
साथ : क्लॉज को बदलने MIN
/ MAX
समान संख्या में प्रविष्टियों को वापस करने के लिए प्रकट होता है।
MAX(-(B.XTStamp<=A.RecTStamp)*B.XTStamp)
"पहले" ( MAX
) टाइमस्टैम्प के लिए काम करता है, लेकिन "बाद में" ( MIN
) के लिए सीधे काम नहीं करता है इस प्रकार है:
MIN(-(B.XTStamp>A.RecTStamp)*B.XTStamp)
क्योंकि स्थिति के लिए न्यूनतम हमेशा 0 होता है FALSE
। यह 0 किसी भी पोस्ट-एपोच से कम है DOUBLE
(जो कि एक DateTime
क्षेत्र एक्सेस का सबसेट है और यह गणना फ़ील्ड को में बदल देती है)। IIF
और MIN
/ MAX
तरीकों विकल्पों शून्य से क्योंकि विभाजन AfterXTStamp मूल्य काम के लिए प्रस्तावित ( FALSE
) शून्य मान है, जो कुल कार्यों MIN और MAX छोड़ उत्पन्न करता है।
अगला कदम
इसे और आगे ले जाते हुए, मैं दूसरी तालिका में टाइमस्टैम्प को खोजने की इच्छा रखता हूं जो सीधे पहली तालिका में टाइमस्टैम्प को फ्लैंक करता है और उन बिंदुओं पर समय दूरी के आधार पर दूसरी तालिका से डेटा मानों का एक रैखिक प्रक्षेप करता है (अर्थात यदि टाइमस्टैम्प से पहली तालिका "पहले" और "के बाद" के बीच 25% है, मैं "तालिका के बाद" बिंदु से जुड़े 2 तालिका मूल्य डेटा और "पहले" से 75% से आने वाले गणना मूल्य का 25% चाहूंगा। )। आंतरिक हिम्मत के हिस्से के रूप में संशोधित शामिल प्रकार का उपयोग करना, और नीचे दिए गए उत्तर के बाद मैं उत्पादन ...
SELECT
AvgGPS.XmitID,
StrDateIso8601Msec(AvgGPS.RecTStamp) AS RecTStamp_ms,
-- StrDateIso8601MSec is a VBA function returning a TEXT string in yyyy-mm-dd hh:nn:ss.lll format
AvgGPS.ReceivID,
RD.Receiver_Location_Description,
RD.Lat AS Receiver_Lat,
RD.Lon AS Receiver_Lon,
AvgGPS.Before_Lat * (1 - AvgGPS.AfterWeight) + AvgGPS.After_Lat * AvgGPS.AfterWeight AS Xmit_Lat,
AvgGPS.Before_Lon * (1 - AvgGPS.AfterWeight) + AvgGPS.After_Lon * AvgGPS.AfterWeight AS Xmit_Lon,
AvgGPS.RecTStamp AS RecTStamp_basic
FROM ( SELECT
AfterTimestampID.RecTStamp,
AfterTimestampID.XmitID,
AfterTimestampID.ReceivID,
GPSBefore.BeforeXTStamp,
GPSBefore.Latitude AS Before_Lat,
GPSBefore.Longitude AS Before_Lon,
GPSAfter.AfterXTStamp,
GPSAfter.Latitude AS After_Lat,
GPSAfter.Longitude AS After_Lon,
( (AfterTimestampID.RecTStamp - GPSBefore.XTStamp) / (GPSAfter.XTStamp - GPSBefore.XTStamp) ) AS AfterWeight
FROM (
(SELECT
ReceiverRecord.RecTStamp,
ReceiverRecord.ReceivID,
ReceiverRecord.XmitID,
(SELECT TOP 1 XmitGPS.X_ID FROM SecondTable as XmitGPS WHERE ReceiverRecord.RecTStamp < XmitGPS.XTStamp ORDER BY XmitGPS.X_ID) AS AfterXmit_ID
FROM FirstTable AS ReceiverRecord
-- WHERE ReceiverRecord.XmitID IN (select XmitID from ValidXmitters)
GROUP BY RecTStamp, ReceivID, XmitID
) AS AfterTimestampID INNER JOIN SecondTable AS GPSAfter ON AfterTimestampID.AfterXmit_ID = GPSAfter.X_ID
) INNER JOIN SecondTable AS GPSBefore ON AfterTimestampID.AfterXmit_ID = GPSBefore.X_ID + 1
) AS AvgGPS INNER JOIN ReceiverDetails AS RD ON (AvgGPS.ReceivID = RD.ReceivID) AND (AvgGPS.RecTStamp BETWEEN RD.Beginning AND RD.Ending)
ORDER BY AvgGPS.RecTStamp, AvgGPS.ReceivID;
... जो 152928 रिकॉर्ड लौटाता है, (कम से कम लगभग) अपेक्षित रिकॉर्ड के अंतिम संख्या के अनुरूप। मेरे i7-4790, 16GB RAM, कोई SSD, विन 8.1 प्रो सिस्टम पर रन समय शायद 5-10 मिनट है।
संदर्भ 1: एमएस एक्सेस मिलिसकॉन्ड टाइम मानों को संभाल सकता है - वास्तव में और साथ में स्रोत फ़ाइल [08080011.txt]