मैं पढ़ रहा था:
https://en.wikipedia.org/wiki/Tf%E2%80%93idf#Definition
लेकिन मुझे ठीक से समझ में नहीं आ रहा है कि फार्मूला का निर्माण इस तरह से क्यों किया गया।
मैं क्या समझता हूँ:
iDF को कुछ स्तरों पर मापना चाहिए कि प्रत्येक दस्तावेज़ में S शब्द कितनी बार दिखाई देता है, मूल्य में कमी होने के कारण शब्द अधिक बार प्रकट होता है।
उस दृष्टिकोण से
इसके अलावा अवधि आवृत्ति के रूप में वर्णित किया जा सकता है
तो फिर उपाय
किसी तरह से यह निर्धारित किया जाता है कि किसी दिए गए दस्तावेज़ में कोई शब्द कितनी बार दिखाई देता है, और यह शब्द दस्तावेजों के सेट पर कितना अनूठा है।
जो मुझे समझ नहीं आ रहा है
लेकिन जो सूत्र दिया गया है वह इसका वर्णन करता है
मैं परिभाषा में वर्णित लघुगणक की आवश्यकता को समझना चाहता हूं। जैसे, वे वहाँ क्यों हैं? वे किस पहलू पर जोर देते हैं?