फाइनेंशियल सर्विसेज बिग डेटा का एक बड़ा उपयोगकर्ता है, और इनोवेटर भी। एक उदाहरण बंधक बॉन्ड ट्रेडिंग है। इसके लिए अपने सवालों के जवाब देने के लिए:
इन कंपनियों ने किस तरह का डेटा इस्तेमाल किया। डेटा का आकार क्या था?
- पिछले कई वर्षों से जारी किए गए प्रत्येक बंधक के लंबे इतिहास, और उनके खिलाफ महीने के भुगतान। (अरबों पंक्तियों का)
- क्रेडिट इतिहास के लंबे इतिहास। (अरबों पंक्तियों का)
- घर की कीमत सूचकांकों। (उतना बड़ा नहीं)
डेटा को संसाधित करने के लिए वे किस प्रकार की टूल तकनीकों का उपयोग करते हैं?
ये बदलता रहता है। कुछ इन-हाउस सॉल्यूशंस का उपयोग करते हैं जो नेटिज़ा या टेराडाटा जैसे डेटाबेस पर निर्मित होते हैं। अन्य डेटा प्रदाताओं द्वारा प्रदान की गई प्रणालियों के माध्यम से डेटा तक पहुंचते हैं। (Corelogic, Experian, आदि) कुछ बैंक KDB या 1010data जैसे स्तंभ डेटाबेस तकनीकों का उपयोग करते हैं।
उन्हें किस समस्या का सामना करना पड़ रहा था और उन्हें डेटा कैसे मिला, इस मुद्दे को सुलझाने में उनकी मदद की।
मुख्य मुद्दा यह निर्धारित कर रहा है कि बंधक बांड (बंधक समर्थित-प्रतिभूतियां) प्रीपे या डिफ़ॉल्ट होगी। यह उन बांडों के लिए विशेष रूप से महत्वपूर्ण है जिनमें सरकारी गारंटी की कमी है। भुगतान इतिहास, क्रेडिट फ़ाइलों में खुदाई और घर के वर्तमान मूल्य को समझने से, डिफ़ॉल्ट की संभावना का अनुमान लगाना संभव है। एक ब्याज दर मॉडल और प्रीपेमेंट मॉडल जोड़ना भी पूर्व भुगतान की संभावना का अनुमान लगाने में मदद करता है।
कैसे उन्होंने अपनी जरूरत के अनुरूप टूल \ प्रौद्योगिकी का चयन किया।
यदि परियोजना आंतरिक आईटी द्वारा संचालित होती है, तो आमतौर पर यह ओरेकल, टेराडाटा या नेटिज़ा जैसे बड़े डेटाबेस विक्रेता से दूर होता है। यदि यह क्वेंट द्वारा संचालित होता है, तो वे सीधे डेटा विक्रेता, या एक 3 पार्टी "ऑल इन" सिस्टम पर जाने की अधिक संभावना रखते हैं।
वे डेटा से किस तरह के पैटर्न की पहचान करते थे और डेटा से किस तरह के पैटर्न देख रहे थे।
डेटा को जोड़ने से उनके ऋणों में डिफ़ॉल्ट होने की संभावना है, और उन्हें प्रीपे करने में महान अंतर्दृष्टि मिलती है। जब आपने ऋणों को बांडों में एकत्रित किया, तो यह 20,000 जारी किए गए बॉन्ड के बीच का अंतर हो सकता है ।100,000,000beingworththatamount,oraslittleas