मुझे एक प्रदर्शन महत्वपूर्ण द्विआधारी निर्णय पेड़ मिला है, और मैं इस प्रश्न को कोड की एक पंक्ति पर केंद्रित करना चाहता हूं। बाइनरी ट्री इट्रेटर के लिए कोड इसके खिलाफ प्रदर्शन विश्लेषण चलाने से परिणामों के साथ नीचे है।
public ScTreeNode GetNodeForState(int rootIndex, float[] inputs)
{
0.2% ScTreeNode node = RootNodes[rootIndex].TreeNode;
24.6% while (node.BranchData != null)
{
0.2% BranchNodeData b = node.BranchData;
0.5% node = b.Child2;
12.8% if (inputs[b.SplitInputIndex] <= b.SplitValue)
0.8% node = b.Child1;
}
0.4% return node;
}
ब्रांचडाटा एक फील्ड है, प्रॉपर्टी नहीं। मैंने ऐसा नहीं किया ताकि इसके जोखिम को कम न किया जा सके।
BranchNodeData वर्ग निम्नानुसार है:
public sealed class BranchNodeData
{
/// <summary>
/// The index of the data item in the input array on which we need to split
/// </summary>
internal int SplitInputIndex = 0;
/// <summary>
/// The value that we should split on
/// </summary>
internal float SplitValue = 0;
/// <summary>
/// The nodes children
/// </summary>
internal ScTreeNode Child1;
internal ScTreeNode Child2;
}
जैसा कि आप देख सकते हैं, जबकि लूप / नल चेक प्रदर्शन पर भारी हिट है। पेड़ बड़े पैमाने पर है, इसलिए मैं थोड़ी देर के लिए एक पत्ती की खोज करने की उम्मीद करूंगा, लेकिन मैं उस एक लाइन पर खर्च किए गए समय की अनुपातहीन मात्रा को समझना चाहूंगा।
मैंने कोशिश की:
- नल चेक को कुछ समय के लिए अलग करना - यह नल चेक है जो हिट है।
- ऑब्जेक्ट के लिए बूलियन फ़ील्ड जोड़ना और उसके खिलाफ जांच करना, इससे कोई फर्क नहीं पड़ा। इससे कोई फर्क नहीं पड़ता कि क्या तुलना की जा रही है, यह तुलना है कि यह मुद्दा है।
क्या यह एक शाखा भविष्यवाणी मुद्दा है? यदि हां, तो मैं इसके बारे में क्या कर सकता हूं? अगर कुछ भी?
मैं CIL को समझने का नाटक नहीं करूँगा, लेकिन मैं इसे किसी के लिए भी पोस्ट करूँगा ताकि वे इसमें से कुछ जानकारी निकालने की कोशिश कर सकें।
.method public hidebysig
instance class OptimalTreeSearch.ScTreeNode GetNodeForState (
int32 rootIndex,
float32[] inputs
) cil managed
{
// Method begins at RVA 0x2dc8
// Code size 67 (0x43)
.maxstack 2
.locals init (
[0] class OptimalTreeSearch.ScTreeNode node,
[1] class OptimalTreeSearch.BranchNodeData b
)
IL_0000: ldarg.0
IL_0001: ldfld class [mscorlib]System.Collections.Generic.List`1<class OptimalTreeSearch.ScRootNode> OptimalTreeSearch.ScSearchTree::RootNodes
IL_0006: ldarg.1
IL_0007: callvirt instance !0 class [mscorlib]System.Collections.Generic.List`1<class OptimalTreeSearch.ScRootNode>::get_Item(int32)
IL_000c: ldfld class OptimalTreeSearch.ScTreeNode OptimalTreeSearch.ScRootNode::TreeNode
IL_0011: stloc.0
IL_0012: br.s IL_0039
// loop start (head: IL_0039)
IL_0014: ldloc.0
IL_0015: ldfld class OptimalTreeSearch.BranchNodeData OptimalTreeSearch.ScTreeNode::BranchData
IL_001a: stloc.1
IL_001b: ldloc.1
IL_001c: ldfld class OptimalTreeSearch.ScTreeNode OptimalTreeSearch.BranchNodeData::Child2
IL_0021: stloc.0
IL_0022: ldarg.2
IL_0023: ldloc.1
IL_0024: ldfld int32 OptimalTreeSearch.BranchNodeData::SplitInputIndex
IL_0029: ldelem.r4
IL_002a: ldloc.1
IL_002b: ldfld float32 OptimalTreeSearch.BranchNodeData::SplitValue
IL_0030: bgt.un.s IL_0039
IL_0032: ldloc.1
IL_0033: ldfld class OptimalTreeSearch.ScTreeNode OptimalTreeSearch.BranchNodeData::Child1
IL_0038: stloc.0
IL_0039: ldloc.0
IL_003a: ldfld class OptimalTreeSearch.BranchNodeData OptimalTreeSearch.ScTreeNode::BranchData
IL_003f: brtrue.s IL_0014
// end loop
IL_0041: ldloc.0
IL_0042: ret
} // end of method ScSearchTree::GetNodeForState
संपादित करें: मैंने एक शाखा भविष्यवाणी परीक्षण करने का फैसला किया, मैंने थोड़ी देर के भीतर एक समान जोड़ा, तो हमारे पास है
while (node.BranchData != null)
तथा
if (node.BranchData != null)
उसके अंदर। मैंने उसके बाद प्रदर्शन विश्लेषण चलाया, और पहली तुलना को निष्पादित करने में छह गुना अधिक समय लगा क्योंकि यह दूसरी तुलना को निष्पादित करने के लिए किया था जो पूरी तरह से वापस आ गई थी। तो ऐसा लगता है कि यह वास्तव में एक शाखा भविष्यवाणी मुद्दा है - और मुझे लगता है कि वहाँ कुछ भी नहीं मैं इसके बारे में क्या कर सकता हूँ ?!
एक और संपादन
उपरोक्त परिणाम तब भी होगा यदि नोड। BranchData को थोड़ी देर के लिए RAM से लोड किया जाना था - यह तब के स्टेटमेंट के लिए कैश किया जाएगा।
यह एक समान विषय पर मेरा तीसरा प्रश्न है। इस बार मैं कोड की एक पंक्ति पर ध्यान केंद्रित कर रहा हूं। इस विषय पर मेरे अन्य प्रश्न हैं:
while(true) { /* current body */ if(node.BranchData == null) return node; }
:। क्या यह कुछ बदलता है?
while(true) { BranchNodeData b = node.BranchData; if(ReferenceEquals(b, null)) return node; node = b.Child2; if (inputs[b.SplitInputIndex] <= b.SplitValue) node = b.Child1; }
होगा : यह node. BranchData
केवल एक बार प्राप्त होगा ।
BranchNode
संपत्ति के कार्यान्वयन को दिखाएं । कृपया बदलने का प्रयास करेंnode.BranchData != null
ReferenceEquals(node.BranchData, null)
। इससे क्या फ़र्क पड़ता है?