मेरे पास एक बड़ी सॉर्ट की गई फ़ाइल है जिसमें अरबों लाइनों की चर लंबाई है। एक नई लाइन को देखते हुए मैं यह जानना चाहूंगा कि अगर यह सॉर्ट की गई फ़ाइल में शामिल हो जाती है तो कौन सी बाइट नंबर मिलेगा।
उदाहरण
a\n
c\n
d\n
f\n
g\n
इनपुट 'फू' को देखते हुए मुझे आउटपुट 9 मिलेगा।
यह केवल पूरी फ़ाइल के माध्यम से जाने के लिए आसान है, लेकिन अरबों लाइनों की चर लंबाई होने के कारण यह द्विआधारी खोज करने के लिए तेज़ होगा।
क्या इस तरह का टेक्स्ट प्रोसेसिंग टूल पहले से मौजूद है?
संपादित करें:
अब यह होता है: https://gitlab.com/ole.tange/tangetools/blob/master/bsearch/bsearch