मैं एक Numpy सरणी में नए आयाम कैसे जोड़ सकता हूं?

Question 1

मैं एक छवि के एक सुन्न सरणी के साथ शुरू कर रहा हूँ।

In[1]:img = cv2.imread('test.jpg')

आकार वह है जो आप 640x480 RGB छवि के लिए उम्मीद कर सकते हैं।

In[2]:img.shape
Out[2]: (480, 640, 3)

हालांकि, यह छवि जो मेरे पास है वह एक वीडियो का एक फ्रेम है, जो 100 फ्रेम लंबा है। आदर्श रूप में, मैं एक ऐसा सरणी रखना चाहूंगा जिसमें इस वीडियो का सारा डेटा हो जैसे कि img.shapeरिटर्न (480, 640, 3, 100)।

अगले फ्रेम को जोड़ने का सबसे अच्छा तरीका क्या है - अर्थात्, छवि डेटा का अगला सेट, दूसरा 480 x 640 x 3 सरणी - मेरे प्रारंभिक सरणी के लिए?

Question 2

आप पूछ रहे हैं कि एक नंबरी सरणी में एक आयाम कैसे जोड़ा जाए, ताकि नए डेटा को समायोजित करने के लिए उस आयाम को उगाया जा सके। एक आयाम इस प्रकार जोड़ा जा सकता है:

image = image[..., np.newaxis]

Question 3

वैकल्पिक रूप से

image = image[..., np.newaxis]

में @dbliss 'जवाब , आप भी उपयोग कर सकते हैं numpy.expand_dimsकी तरह

image = np.expand_dims(image, <your desired dimension>)

उदाहरण के लिए (ऊपर दिए गए लिंक से लिया गया):

x = np.array([1, 2])

print(x.shape)  # prints (2,)

फिर

y = np.expand_dims(x, axis=0)

पैदावार

array([[1, 2]])

तथा

y.shape

देता है

(1, 2)

Question 4

आप सही आकार के सामने वाले हिस्से को बना सकते हैं और उसे भर सकते हैं:

frames = np.empty((480, 640, 3, 100))

for k in xrange(nframes):
    frames[:,:,:,k] = cv2.imread('frame_{}.jpg'.format(k))

यदि फ़्रेम व्यक्तिगत jpg फ़ाइल थे, जिन्हें किसी विशेष तरीके से नाम दिया गया था (उदाहरण में, फ्रेम_0.jpg, फ़्रेम_1.जेपीजी, आदि)।

केवल एक नोट, आप (nframes, 480,640,3)इसके बजाय एक आकार सरणी का उपयोग करने पर विचार कर सकते हैं ।

Question 5

pythonic

X = X[:, :, None]

जो के बराबर है

X = X[:, :, numpy.newaxis] तथा X = numpy.expand_dims(X, axis=-1)

लेकिन जैसा कि आप स्पष्ट रूप से स्टैकिंग छवियों के बारे में पूछ रहे हैं, मैं आपको उन listछवियों के स्टैकिंग के लिए जाने की सलाह दूंगा np.stack([X1, X2, X3])जो आपने लूप में एकत्र किए होंगे।

यदि आप उन आयामों के क्रम को पसंद नहीं करते हैं जिनके साथ आप पुनर्व्यवस्थित कर सकते हैं np.transpose()

Question 6

आप इसका उपयोग np.concatenate()करके निर्दिष्ट कर सकते हैं कि कौन सा axisआवेदन करना है np.newaxis:

import numpy as np
movie = np.concatenate((img1[:,np.newaxis], img2[:,np.newaxis]), axis=3)

यदि आप कई फाइलों से पढ़ रहे हैं:

import glob
movie = np.concatenate([cv2.imread(p)[:,np.newaxis] for p in glob.glob('*.jpg')], axis=3)

Question 7

संख्यात्मक में कोई संरचना नहीं है जो आपको बाद में अधिक डेटा संलग्न करने की अनुमति देती है।

इसके बजाय, numpy आपके सभी डेटा को संख्याओं (मूल रूप से; एक C सरणी) के एक सन्निहित भाग में रखता है, और किसी भी आकार को इसे धारण करने के लिए एक नया हिस्सा मेमोरी को आवंटित करने की आवश्यकता होती है। Numpy की गति मेमोरी के एक ही चंक में सभी डेटा को एक सुस्पष्ट सरणी में रखने में सक्षम होने से आती है; उदाहरण के लिए, गणितीय क्रियाओं को गति के लिए समानांतर किया जा सकता है और आपको कम कैश मिसेज़ मिलते हैं ।

तो आपके पास दो तरह के उपाय होंगे:

स्मृति को पूर्व-आबंटित सरणी के लिए आवंटित करें और मानों में भरें, जैसे जोश एडेल के उत्तर में, या
अपने डेटा को एक सामान्य अजगर सूची में रखें, जब तक कि वास्तव में उन सभी को एक साथ रखने की आवश्यकता न हो (नीचे देखें)

images = []
for i in range(100):
    new_image = # pull image from somewhere
    images.append(new_image)
images = np.stack(images, axis=3)

ध्यान दें कि पहले व्यक्तिगत छवि सरणियों के आयामों का विस्तार करने की आवश्यकता नहीं है, न ही आपको यह जानने की आवश्यकता है कि आप समय से पहले कितनी छवियों की अपेक्षा करते हैं।

Question 8

दृष्टिकोण 1 विधि के साथ दृष्टिकोण 1 और दृष्टिकोण 2 np.newaxis विधि के साथ विचार करें जो समान परिणाम उत्पन्न करते हैं:

#Lets suppose, we have:
x = [1,2,3,4,5,6,7,8,9]
print('I. x',x)

xNpArr = np.array(x)
print('II. xNpArr',xNpArr)
print('III. xNpArr', xNpArr.shape)

xNpArr_3x3 = xNpArr.reshape((3,3))
print('IV. xNpArr_3x3.shape', xNpArr_3x3.shape)
print('V. xNpArr_3x3', xNpArr_3x3)

#Approach 1 with reshape method
xNpArrRs_1x3x3x1 = xNpArr_3x3.reshape((1,3,3,1))
print('VI. xNpArrRs_1x3x3x1.shape', xNpArrRs_1x3x3x1.shape)
print('VII. xNpArrRs_1x3x3x1', xNpArrRs_1x3x3x1)

#Approach 2 with np.newaxis method
xNpArrNa_1x3x3x1 = xNpArr_3x3[np.newaxis, ..., np.newaxis]
print('VIII. xNpArrNa_1x3x3x1.shape', xNpArrNa_1x3x3x1.shape)
print('IX. xNpArrNa_1x3x3x1', xNpArrNa_1x3x3x1)

हमारे पास परिणाम हैं:

I. x [1, 2, 3, 4, 5, 6, 7, 8, 9]

II. xNpArr [1 2 3 4 5 6 7 8 9]

III. xNpArr (9,)

IV. xNpArr_3x3.shape (3, 3)

V. xNpArr_3x3 [[1 2 3]
 [4 5 6]
 [7 8 9]]

VI. xNpArrRs_1x3x3x1.shape (1, 3, 3, 1)

VII. xNpArrRs_1x3x3x1 [[[[1]
   [2]
   [3]]

  [[4]
   [5]
   [6]]

  [[7]
   [8]
   [9]]]]

VIII. xNpArrNa_1x3x3x1.shape (1, 3, 3, 1)

IX. xNpArrNa_1x3x3x1 [[[[1]
   [2]
   [3]]

  [[4]
   [5]
   [6]]

  [[7]
   [8]
   [9]]]]

Question 9

मैंने इस दृष्टिकोण का अनुसरण किया:

import numpy as np
import cv2

ls = []

for image in image_paths:
    ls.append(cv2.imread('test.jpg'))

img_np = np.array(ls) # shape (100, 480, 640, 3)
img_np = np.rollaxis(img_np, 0, 4) # shape (480, 640, 3, 100).