पठन में * .wav फाइलें पढ़ना

Question 1

मुझे .wav फ़ाइल में लिखी गई ध्वनि का विश्लेषण करने की आवश्यकता है। उसके लिए मुझे इस फ़ाइल को संख्याओं के सेट में बदलना होगा (उदाहरण के लिए, सरणियाँ)। मुझे लगता है कि मुझे लहर पैकेज का उपयोग करने की आवश्यकता है। हालांकि, मुझे नहीं पता कि यह कैसे काम करता है। उदाहरण के लिए मैंने निम्नलिखित कार्य किए:

import wave
w = wave.open('/usr/share/sounds/ekiga/voicemail.wav', 'r')
for i in range(w.getnframes()):
    frame = w.readframes(i)
    print frame

इस कोड के परिणामस्वरूप मुझे समय के कार्य के रूप में ध्वनि दबाव देखने की उम्मीद थी। इसके विपरीत मैं बहुत सारे अजीब, रहस्यमय प्रतीकों (जो हेक्साडेसिमल संख्या नहीं हैं) को देखता हूं। किसी को भी, दलीलों, मुझे उस के साथ मदद कर सकते हैं?

Question 2

प्रति प्रलेखन , scipy.io.wavfile.read(somefile)दो मदों की एक टपल देता है: पहला है नमूना दर प्रति सेकंड के नमूनों में, दूसरा एक है numpyसभी डेटा फ़ाइल से पढ़ने के साथ सरणी:

from scipy.io import wavfile
samplerate, data = wavfile.read('./output/audio.wav')

Question 3

structमॉड्यूल का उपयोग करते हुए , आप वेव फ्रेम (जो कि 2 के पूरक बाइनरी में -32768 और 32767 (यानी 0x8000और 0x7FFF) के बीच ले जा सकते हैं । यह एक मोनो, 16-बीआईटी, वेव फाइल को पढ़ता है। मुझे यह वेबपेज इसको बनाने में काफी उपयोगी लगा:)

import wave, struct

wavefile = wave.open('sine.wav', 'r')

length = wavefile.getnframes()
for i in range(0, length):
    wavedata = wavefile.readframes(1)
    data = struct.unpack("<h", wavedata)
    print(int(data[0]))

यह स्निपेट 1 फ्रेम पढ़ता है। एक से अधिक फ़्रेम पढ़ने के लिए (उदाहरण के लिए, 13), का उपयोग करें

wavedata = wavefile.readframes(13)
data = struct.unpack("<13h", wavedata)

Question 4

अलग-अलग पायथन मॉड्यूल wav को पढ़ने के लिए:

लहर ऑडियो फ़ाइलों को पढ़ने के लिए कम से कम ये निम्नलिखित पुस्तकालय हैं:

SoundFile
scipy.io.wavfile (से scipy )
लहर (धाराओं को पढ़ने के लिए। अजगर 2 और 3 में शामिल)
scikits.audiolab (2010 से अयोग्य )
साउंडदेविस (नाटक और रिकॉर्ड की आवाज़, धाराओं और वास्तविक समय के लिए अच्छा)
pyglet
लिब्रोसा (संगीत और ऑडियो विश्लेषण)
मैडम (संगीत सूचना पुनर्प्राप्ति (एमआईआर) कार्यों पर मजबूत ध्यान)

सबसे सरल उदाहरण:

साउंडफाइल के साथ यह एक सरल उदाहरण है:

import soundfile as sf
data, samplerate = sf.read('existing_file.wav')

आउटपुट का प्रारूप:

चेतावनी, डेटा हमेशा एक ही प्रारूप में नहीं होते हैं, जो कि पुस्तकालय पर निर्भर करता है। उदाहरण के लिए:

from scikits import audiolab
from scipy.io import wavfile
from sys import argv
for filepath in argv[1:]:
    x, fs, nb_bits = audiolab.wavread(filepath)
    print('Reading with scikits.audiolab.wavread:', x)
    fs, x = wavfile.read(filepath)
    print('Reading with scipy.io.wavfile.read:', x)

आउटपुट:

Reading with scikits.audiolab.wavread: [ 0.          0.          0.         ..., -0.00097656 -0.00079346 -0.00097656]
Reading with scipy.io.wavfile.read: [  0   0   0 ..., -32 -26 -32]

साउंडफाइल और ऑडिओलैब रिटर्न -1 और 1 के बीच तैरता है (जैसा कि मैटाब करता है, यह ऑडियो सिग्नल के लिए कन्वेंशन है)। स्कैपी और वेव रिटर्न पूर्णांक, जिसे आप फ़्लोटिंग के बिट्स की संख्या के अनुसार फ़्लोट में बदल सकते हैं, उदाहरण के लिए:

from scipy.io.wavfile import read as wavread
samplerate, x = wavread(audiofilename)  # x is a numpy array of integers, representing the samples 
# scale to -1.0 -- 1.0
if x.dtype == 'int16':
    nb_bits = 16  # -> 16-bit wav files
elif x.dtype == 'int32':
    nb_bits = 32  # -> 32-bit wav files
max_nb_bit = float(2 ** (nb_bits - 1))
samples = x / (max_nb_bit + 1)  # samples is a numpy array of floats representing the samples

Question 5

IMHO, साउंड फ़ाइल से एक NumPy सरणी में ऑडियो डेटा प्राप्त करने का सबसे आसान तरीका SoundFile है :

import soundfile as sf
data, fs = sf.read('/usr/share/sounds/ekiga/voicemail.wav')

यह बॉक्स से 24-बिट फ़ाइलों का भी समर्थन करता है।

कई ध्वनि फ़ाइल लाइब्रेरी उपलब्ध हैं, मैंने एक सिंहावलोकन लिखा है जहां आप कुछ पेशेवरों और विपक्षों को देख सकते हैं। यह एक पृष्ठ भी बताता है कि waveमॉड्यूल के साथ 24-बिट wav फ़ाइल कैसे पढ़ें ।

Question 6

आप scikits.audiolab का उपयोग करके इसे पूरा कर सकते हैं मॉड्यूल । यह कार्य करने के लिए NumPy और SciPy की आवश्यकता है, और libsndfile की भी।

ध्यान दें, मैं केवल Ubunutu पर काम करने में सक्षम था और OSX पर नहीं।

from scikits.audiolab import wavread

filename = "testfile.wav"

data, sample_frequency,encoding = wavread(filename)

अब आपके पास wav data है

Question 7

यदि आप किसी ऑडियो ब्लॉक को ब्लॉक करके प्रोक करना चाहते हैं, तो दिए गए कुछ समाधान इस अर्थ में काफी भयानक हैं कि वे पूरे ऑडियो को मेमोरी में लोड कर रहे हैं जो कई कैश मिक्स का उत्पादन कर रहे हैं और आपके प्रोग्राम को धीमा कर रहे हैं। अजगर-wavefile जनरेटर के माध्यम से कुशल और पारदर्शी ब्लॉक प्रबंधन का उपयोग करके न्यूम ब्लॉक-बाय-ब्लॉक प्रसंस्करण करने के लिए कुछ पाइथोनिक निर्माण प्रदान करता है। अन्य pythonic niceties फ़ाइलों के लिए संदर्भ प्रबंधक, गुण के रूप में मेटाडेटा हैं ... और यदि आप संपूर्ण फ़ाइल इंटरफ़ेस चाहते हैं, क्योंकि आप एक त्वरित प्रोटोटाइप विकसित कर रहे हैं और आप प्रभावकारिता के बारे में परवाह नहीं करते हैं, तो पूरी फ़ाइल इंटरफ़ेस अभी भी है।

प्रसंस्करण का एक सरल उदाहरण होगा:

import sys
from wavefile import WaveReader, WaveWriter

with WaveReader(sys.argv[1]) as r :
    with WaveWriter(
            'output.wav',
            channels=r.channels,
            samplerate=r.samplerate,
            ) as w :

        # Just to set the metadata
        w.metadata.title = r.metadata.title + " II"
        w.metadata.artist = r.metadata.artist

        # This is the prodessing loop
        for data in r.read_iter(size=512) :
            data[1] *= .8     # lower volume on the second channel
            w.write(data)

उदाहरण पूरी फाइल को पढ़ने के लिए एक ही ब्लॉक का उपयोग करता है, यहां तक कि अंतिम ब्लॉक के मामले में भी जो आमतौर पर आवश्यक आकार से कम है। इस मामले में आपको ब्लॉक का एक टुकड़ा मिलता है। इसलिए किसी भी आगे की प्रक्रिया के लिए हार्डकोड 512 आकार का उपयोग करने के बजाय लौटे ब्लॉक की लंबाई पर भरोसा करें।

Question 8

यदि आप तरंग डेटा पर स्थानांतरण करने जा रहे हैं, तो शायद आपको विशेष रूप से SciPy का उपयोग करना चाहिए scipy.io.wavfile।

Question 9

मुझे 1-चैनल 24-बिट WAV फ़ाइल पढ़ने की आवश्यकता है। नाक द्वारा ऊपर पोस्ट बहुत उपयोगी थी। लेकिन, जैसा कि ऊपर उल्लेख किया द्वारा basj 24 बिट सरल नहीं है। अंत में मुझे निम्नलिखित स्निपेट का उपयोग करके काम करना पड़ा:

from scipy.io import wavfile
TheFile = 'example24bit1channelFile.wav'
[fs, x] = wavfile.read(TheFile)

# convert the loaded data into a 24bit signal

nx = len(x)
ny = nx/3*4    # four 3-byte samples are contained in three int32 words

y = np.zeros((ny,), dtype=np.int32)    # initialise array

# build the data left aligned in order to keep the sign bit operational.
# result will be factor 256 too high

y[0:ny:4] = ((x[0:nx:3] & 0x000000FF) << 8) | \
  ((x[0:nx:3] & 0x0000FF00) << 8) | ((x[0:nx:3] & 0x00FF0000) << 8)
y[1:ny:4] = ((x[0:nx:3] & 0xFF000000) >> 16) | \
  ((x[1:nx:3] & 0x000000FF) << 16) | ((x[1:nx:3] & 0x0000FF00) << 16)
y[2:ny:4] = ((x[1:nx:3] & 0x00FF0000) >> 8) | \
  ((x[1:nx:3] & 0xFF000000) >> 8) | ((x[2:nx:3] & 0x000000FF) << 24)
y[3:ny:4] = (x[2:nx:3] & 0x0000FF00) | \
  (x[2:nx:3] & 0x00FF0000) | (x[2:nx:3] & 0xFF000000)

y = y/256   # correct for building 24 bit data left aligned in 32bit words

यदि आपको -1 और +1 के बीच परिणाम की आवश्यकता है, तो कुछ अतिरिक्त स्केलिंग आवश्यक है। हो सकता है कि आपमें से कुछ को यह उपयोगी लगे

Question 10

अगर इसकी सिर्फ दो फाइलें और नमूना दर काफी अधिक है, तो आप उन्हें इंटरलेव कर सकते हैं।

from scipy.io import wavfile
rate1,dat1 = wavfile.read(File1)
rate2,dat2 = wavfile.read(File2)

if len(dat2) > len(dat1):#swap shortest
    temp = dat2
    dat2 = dat1
    dat1 = temp

output = dat1
for i in range(len(dat2)/2): output[i*2]=dat2[i*2]

wavfile.write(OUTPUT,rate,dat)

Question 11

यू भी साधारण import wavioपुस्तकालय का उपयोग कर सकते हैं यू भी ध्वनि के कुछ बुनियादी ज्ञान की आवश्यकता है।

Question 12

PyDub ( http://pydub.com/ ) का उल्लेख नहीं किया गया है और इसे ठीक किया जाना चाहिए। IMO यह पायथन में अभी ऑडियो फ़ाइलों को पढ़ने के लिए सबसे व्यापक पुस्तकालय है, हालांकि इसके दोष के बिना नहीं। एक wav फ़ाइल पढ़ना:

from pydub import AudioSegment

audio_file = AudioSegment.from_wav('path_to.wav')
# or
audio_file = AudioSegment.from_file('path_to.wav')

# do whatever you want with the audio, change bitrate, export, convert, read info, etc.
# Check out the API docs http://pydub.com/

पुनश्च। उदाहरण एक wav फ़ाइल पढ़ने के बारे में है, लेकिन PyDub बॉक्स से बाहर विभिन्न स्वरूपों को संभाल सकता है। चेतावनी यह है कि यह दोनों देशी पायथन wav समर्थन और ffmpeg पर आधारित है, इसलिए आपको ffmpeg स्थापित करना होगा और बहुत से pydub क्षमताओं को ffmpeg संस्करण पर निर्भर करना होगा। आमतौर पर अगर ffmpeg कर सकता है, तो pydub कर सकते हैं (जो काफी शक्तिशाली है)।

गैर-अस्वीकरण: मैं परियोजना से संबंधित नहीं हूं, लेकिन मैं एक भारी उपयोगकर्ता हूं।