ऑडियो आधारित गेम जैसे ऑडिओसर्फ और बीट हेज़र्ड कैसे काम करते हैं?


43

नोट: मैं यह नहीं पूछ रहा हूं कि इनमें से किसी एक का क्लोन कैसे बनाया जाए। मैं इस बारे में पूछ रहा हूं कि वे कैसे काम करते हैं।

मुझे यकीन है कि हर किसी ने उन खेलों को देखा है जहां आप अपनी खुद की संगीत फ़ाइलों (या प्रदान की गई) का उपयोग करते हैं और गेम उन पर आधारित स्तर का उत्पादन करते हैं, जैसे कि ऑडिओसर्फ और बीट हाजर्ड

एक्शन में ऑडिओसर्फ का एक वीडियो है, यह दिखाने के लिए कि मेरा क्या मतलब है।

यदि आप एक भारी धातु गीत प्रदान करते हैं, तो आपको विवाल्डी जैसी किसी चीज़ से बाधाओं, दुश्मनों और खेल के अनुभव का पूरी तरह से अलग सेट मिलेगा।

मेरी रुचि क्या है कि ये खेल कैसे काम करते हैं। मुझे ऑडियो (अच्छी तरह से, डेटा-साइड) के बारे में ज्यादा जानकारी नहीं है, लेकिन वे गाने को समझने के लिए प्रक्रिया कैसे करते हैं कि यह कब सुलझ रहा है या कब गति हो रही है? मुझे लगता है कि वे एक स्तर बनाने के लिए पिच मानों (ऑडियो फाइलों में मौजूद चीजों के उन प्रकारों को मानते हुए) को खिला सकते हैं, लेकिन यह पूरी तरह से इसकी व्याख्या नहीं करेगा।

मैं या तो एक स्पष्टीकरण की तलाश कर रहा हूं, इस तरह की चीज़ के बारे में लेख के कुछ लिंक (मुझे यकीन है कि इसके लिए कोई शब्द या शब्द हैं), या इस तरह की चीज़ का एक खुला स्रोत कार्यान्वयन; ;-)

EDIT: कुछ खोज और थोड़ी मदद के बाद, मुझे FFT (फास्ट फूरियर ट्रांसफॉर्म) के बारे में पता चला । यह शायद सही दिशा में एक कदम है, लेकिन यह एक ऐसी चीज है, जिसका मुझे कोई मतलब नहीं है..जो लहरों के मेरे भौतिकी ज्ञान के साथ फिट बैठती है।


1
मैंने एफएफटी पर कुछ जानकारी जोड़ने के लिए संपादित किया, आशा है कि मदद करता है :)
रे डे

जवाबों:


30

आप जिस शब्द की तलाश कर रहे हैं, वह सिग्नल प्रोसेसिंग / विश्लेषण है, इसमें बहुत सारी तकनीकें शामिल हैं, लेकिन मौलिक यह है कि उन खेलों का उपयोग बीट डिटेक्शन है । यह गीत के टेम्पो की गणना करने की कोशिश करता है और जहां एक माप में धड़कता है और इसलिए बाधाओं को प्रत्येक बीट के साथ मेल खाने के अलावा उचित दूरी पर रखता है।

जिस तरह से खेल को पता है कि कब "किक" में जाना बहुत सरल हो सकता है और तरंग के आयाम (माप) को माप सकता है या कुछ और अधिक जटिल हो सकता है जैसे कुछ आवृत्तियों के वॉल्यूम को अलग करना और उनकी मात्रा को मापना।

यदि आप रुचि रखते हैं, तो डिजिटल सिग्नल प्रोसेसिंग में देखें कि आप तरंगों का विश्लेषण कैसे कर सकते हैं, जो अनिवार्य रूप से ये गेम उनके लोडिंग चरण में कर रहे हैं।

ये लिंक आपको आरंभ करने के लिए अच्छे हैं:

डिजिटल फिल्टर्स के लिए साउंड प्रोसेसिंग
थ्योरी और इलेक्ट्रॉनिक म्यूजिक की तकनीक का
परिचय

उम्मीद है की वो मदद करदे :)

रे

संपादित करें: मैंने बस फूरियर ट्रांसफॉर्म के बारे में आपका संपादन देखा और सोचा कि मैं इसमें कुछ अंतर्दृष्टि जोड़ूंगा, हालांकि मैं इस पर कोई विशेषज्ञ नहीं हूं।

एफएफटी एक तरंग के वास्तविक फूरियर रूपांतरण की गणना करने का एक तरीका है। असल में, यदि आप एक ऑडियो फ़ाइल को ऑडेसिटी में लोड करते हैं , तो आपको शीर्ष के साथ टाइमलाइन के साथ वेव फॉर्म दिखाई देगा, इसे टाइम डोमेन के रूप में जाना जाता है । एफएफटी समय डोमेन से आवृत्ति डोमेन (मूल रूप से ऑडियो के भीतर होने वाली सभी आवृत्तियों) में एक संकेत को परिवर्तित करेगा ।

यह रूपांतरण वर्णक्रमीय विश्लेषण के लिए उपयोगी है। एक गेम उदाहरण में, यदि आप एक फूरियर ट्रांसफॉर्म करने के लिए थे, तो आप आसानी से ऑडियो में उच्च आवृत्ति घटनाओं की मात्रा की गणना कर सकते हैं, और इससे आप आमतौर पर उच्च आवृत्ति ध्वनियों के साथ ट्विंकल विज़ुअल इफेक्ट्स, सितारे, या कुछ जोड़ सकते हैं। कम आवृत्तियों के लिए आपके पास बड़े, लसदार राक्षस हो सकते हैं जो बास ध्वनियों के समय में आगे बढ़ रहे हैं, आदि।


1
महान लिंक! हालाँकि, मैंने उन्हें क्लिक किया और मेरी आँखें थोड़ी पिघल गईं। : पी
कम्युनिस्ट डक

5
@ द कम्युनिस्ट डक: वह कमजोर हिस्सा था। अब आपकी आँखें मजबूत हैं।
doppelgreener

3
@ कम्युनिस्ट डक आपने अभी खरगोश के छेद के नीचे कदम रखा है और यह नीचे की ओर लुओगोन्ग जाता है;)
रे डे

मुझे गुस्सा आ रहा है XNA वास्तव में मुझे एमपी 3 फ़ाइलों के साथ इनमें से कोई भी काम करने की अनुमति नहीं देता है (मैं कर सकता हूं। मैं जो सोचता हूं, लेकिन वे बहुत बड़े हैं) जो कष्टप्रद है। लेकिन हे, महान संसाधनों और सिरदर्द के लिए बहुत बहुत धन्यवाद: डी
द कम्युनिस्ट डक

1
@Kay
रे डे

6

बैजलॉजिक गेम्स द्वारा इस विषय पर एक महान सात भाग ट्यूटोरियल श्रृंखला दी गई है। वे मूल बातें से कार्यान्वयन तक सब कुछ कवर करते हैं।

http://www.badlogicgames.com/wordpress/?cat=18

वे कोड और सभी के साथ Audiosurf एल्गोरिदम की नकल करने की कोशिश करते हैं।


0

स्पेक्ट्रल ऊर्जा भिन्नता के विश्लेषण से आने वाले डेटा इस तरह के नक्शे बनाने के लिए पर्याप्त हैं। यहां समस्या यह हो सकती है कि प्रक्रिया करने के लिए बहुत अधिक डेटा हैं: न कि किस प्रकार के डेटा का उपयोग किया जाता है, लेकिन कैसे।

कुछ वीडियो देखने के बाद, मैं यह मानना ​​शुरू कर रहा हूं कि फीचर-डोमेन (टाइम-डोमेन -> फ़्रीक्वेंसी-डोमेन -> फ़ीचर-डोमेन) में डेटा को और आगे ले जाया जाता है। सॉफ्टवेयर वर्णक्रमीय ऊर्जा परिवर्तनों का उपयोग करके डेटा उत्पन्न करता है और ज्ञात विशेषताओं को पहचानने की कोशिश करता है, फिर यह मानचित्र को सेटअप करने के लिए सुविधाओं के बारे में जानकारी का उपयोग करता है। मान्यता को क्लीनीकरण, अधिकतम संभावना, तंत्रिका नेटवर्क, जेनेटिक एल्गोरिदम और इतने पर किया जा सकता है।

मान्यता को पूरा करने के बाद, आपके पास जानकारी है जैसे: जहां समय और आवृत्ति में सुविधा मिलती है , किस प्रकार का करतब पाया जाता है, सुविधा वेक्टर जिस गति से बढ़ रहा है और इसी तरह; आप इन डेटा का उपयोग मैप जनरेशन अल्गोरिथम को खिलाने के लिए कर सकते हैं, बेहतर पहचान एल्गोरिदम बनाने जैसे सुधारों के लिए जगह छोड़कर, सुविधाओं के अधिक परिवार को पहचानें, अधिक डेटा निकालें, इन डेटा को "रेंडर" करने के नए तरीके खोजें।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.