फ़ाइल से लिखने के लिए यादृच्छिक पर सूची से 50 आइटम का चयन करें


129

अब तक मुझे पता चला है कि फाइल को कैसे आयात किया जाए, नई फाइलें बनाई जाए और सूची को रैंडमाइज किया जाए।

मुझे सूची से फ़ाइल में लिखने के लिए सूची से केवल 50 आइटम चुनने में परेशानी हो रही है?

def randomizer(input,output1='random_1.txt',output2='random_2.txt',output3='random_3.txt',output4='random_total.txt'):

#Input file 
    query=open(input,'r').read().split()
    dir,file=os.path.split(input)

    temp1 = os.path.join(dir,output1)
    temp2 = os.path.join(dir,output2)
    temp3 = os.path.join(dir,output3)
    temp4 = os.path.join(dir,output4)


    out_file4=open(temp4,'w')

    random.shuffle(query)

    for item in query:
        out_file4.write(item+'\n')   

तो अगर कुल randomization फ़ाइल थी

example:

random_total = ['9','2','3','1','5','6','8','7','0','4']

मुझे 3 फाइलें चाहिए (out_file1 | 2 | 3) 3 के पहले यादृच्छिक सेट के साथ, 3 का दूसरा यादृच्छिक सेट, और 3 का तीसरा यादृच्छिक सेट (इस उदाहरण के लिए, लेकिन मैं जिसे बनाना चाहता हूं उसके पास 50 होना चाहिए)

random_1 = ['9','2','3']
random_2 = ['1','5','6']
random_3 = ['8','7','0']

इसलिए अंतिम '4' को शामिल नहीं किया जाएगा जो ठीक है।

मैं उस सूची से 50 कैसे चुन सकता हूं जिसे मैंने यादृच्छिक किया था?

इससे भी बेहतर, मैं मूल सूची से यादृच्छिक पर 50 का चयन कैसे कर सकता हूं?


आपका मतलब क्या है?
O.rka

जवाबों:


269

यदि सूची यादृच्छिक क्रम में है, तो आप पहले 50 ले सकते हैं।

अन्यथा, उपयोग करें

import random
random.sample(the_list, 50)

random.sample मदद पाठ:

sample(self, population, k) method of random.Random instance
    Chooses k unique random elements from a population sequence.

    Returns a new list containing elements from the population while
    leaving the original population unchanged.  The resulting list is
    in selection order so that all sub-slices will also be valid random
    samples.  This allows raffle winners (the sample) to be partitioned
    into grand prize and second place winners (the subslices).

    Members of the population need not be hashable or unique.  If the
    population contains repeats, then each occurrence is a possible
    selection in the sample.

    To choose a sample in a range of integers, use xrange as an argument.
    This is especially fast and space efficient for sampling from a
    large population:   sample(xrange(10000000), 60)

1
क्या मेरे random.sampleद्वारा चुने गए सूचकांकों को भी वापस कर सकते हैं ?
zyy

43

यादृच्छिक वस्तुओं का चयन करने का एक आसान तरीका यह है कि फिर स्लाइस करें।

import random
a = [1,2,3,4,5,6,7,8,9]
random.shuffle(a)
print a[:4] # prints 4 random variables

@MonicaHeddneck यादृच्छिक फेरबदल और टुकड़ा करना बेहतर क्यों होगा? चयन को रैंडम करके नमूने के एक नंबर का चयन नहीं करेंगे यादृच्छिक यादृच्छिक फेरबदल के रूप में एक ही गुण है और फिर फेरबदल के नमूने का एक टुकड़ा लेने? क्या आप समझा सकते हैं? धन्यवाद।
सालु 14:28

7
मैंने मशीन सीखने की परियोजना के लिए आसानी से एक परीक्षण / ट्रेन सेट बनाने के लिए इसका उपयोग किया। का उपयोग करते हुए random.choice(mylist,3)दो असमान सेट नहीं बनाएंगे जैसा कि यह किया था।
मोनिका हेडडेक

29

मुझे लगता random.choice()है कि एक बेहतर विकल्प है।

import numpy as np

mylist = [13,23,14,52,6,23]

np.random.choice(mylist, 3, replace=False)

फ़ंक्शन सूची से 3 यादृच्छिक रूप से चुने गए मानों की एक सरणी देता है


7
मुझे लगता है कि आपको उपयोग करने की आवश्यकता है random.choice(mylist, 3, replace=False)। उपयोग करने के लिए भी कम भ्रामक import numpy as npऔरnp.random.choice(mylist, 3, replace=False)
जॉन ला रूय

10
यह सूची आइटम को दोहराने की संभावना है
पाउलो

नहीं, यह एक बेहतर विकल्प नहीं है, यह ~ 100 गुना धीमा है
नितेश कांसल

-3

मान लें कि आपकी सूची में 100 तत्व हैं और आप उनमें से 50 को यादृच्छिक तरीके से चुनना चाहते हैं। यहाँ चरणों का पालन करें:

  1. पुस्तकालयों को आयात करें
  2. यादृच्छिक संख्या जनरेटर के लिए बीज बनाएं, मैंने इसे 2 पर रखा है
  3. उन संख्याओं की एक सूची तैयार करें जिनसे यादृच्छिक तरीके से उठाया जा सके
  4. संख्या सूची से यादृच्छिक विकल्प बनाएं

कोड:

from random import seed
from random import choice

seed(2)
numbers = [i for i in range(100)]

print(numbers)

for _ in range(50):
    selection = choice(numbers)
    print(selection)
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.