मैं कई चीजें देख सकता हूं जो आपकी स्क्रिप्ट को धीमा कर सकती हैं। जिस चीज की संभावना बहुत धीमी है, वह है arcpy.CalculateField_management()
फंक्शन। आपको एक कर्सर का उपयोग करना चाहिए, यह तेजी से कई परिमाणों द्वारा करेगा। इसके अलावा, आपने कहा था कि आप आर्कगिस डेस्कटॉप 10.3.1 का उपयोग कर रहे हैं, लेकिन आप पुराने आर्कजीएस 10.0 शैली के कर्सर का उपयोग कर रहे हैं, जो बहुत धीमे हैं।
200K की एए सूची पर भी मिन () ऑपरेशन बहुत जल्दी होगा। आप इस छोटे स्निपेट को चलाकर इसे सत्यापित कर सकते हैं; यह पलक झपकते ही होता है:
>>> min(range(200000)) # will return 0, but is still checking a list of 200,000 values very quickly
देखें कि क्या यह कोई तेज़ है:
import arcpy
fc = arcpy.env.workspace = arcpy.GetParameterAsText(0)
Xfield = "XKoordInt"
with arcpy.da.SearchCursor(fc, [Xfield]) as rows:
ListVal = [r[0] for r in rows]
value = min(ListVal) - 20
print value
# now update
with arcpy.da.UpdateCursor(fc, [Xfield, 'Matrix_Z']) as rows:
for r in rows:
if r[0] is not None:
r[1] = (r[0] - value) / 20.0
rows.updateRow(r)
संपादित करें:
मैंने कुछ समय परीक्षण चलाए और जैसा कि मुझे संदेह था, क्षेत्र कैलकुलेटर ने नए स्टाइल कर्सर के रूप में लगभग दो बार लिया। दिलचस्प बात यह है कि पुराने स्टाइल कर्सर फील्ड कैलकुलेटर की तुलना में ~ 3x धीमा था। मैंने 200,000 यादृच्छिक अंक बनाए और समान फ़ील्ड नामों का उपयोग किया।
प्रत्येक फ़ंक्शन को समय के लिए एक डेकोरेटर फ़ंक्शन का उपयोग किया गया था (सेटअप में कुछ मामूली ओवरहेड हो सकता है और फ़ंक्शन को फाड़ सकता है, इसलिए शायद टाइमपेट मॉड्यूल स्निपेट्स का परीक्षण करने के लिए थोड़ा अधिक सटीक होगा)।
यहाँ परिणाम हैं:
Getting the values with the old style cursor: 0:00:19.23
Getting values with the new style cursor: 0:00:02.50
Getting values with the new style cursor + an order by sql statement: 0:00:00.02
And the calculations:
field calculator: 0:00:14.21
old style update cursor: 0:00:42.47
new style cursor: 0:00:08.71
और यहाँ वह कोड है जिसका मैंने उपयोग किया था ( timeit
डेकोरेटर का उपयोग करने के लिए व्यक्तिगत कार्यों के लिए सब कुछ तोड़ दिया ):
import arcpy
import datetime
import sys
import os
def timeit(function):
"""will time a function's execution time
Required:
function -- full namespace for a function
Optional:
args -- list of arguments for function
kwargs -- keyword arguments for function
"""
def wrapper(*args, **kwargs):
st = datetime.datetime.now()
output = function(*args, **kwargs)
elapsed = str(datetime.datetime.now()-st)[:-4]
if hasattr(function, 'im_class'):
fname = '.'.join([function.im_class.__name__, function.__name__])
else:
fname = function.__name__
print'"{0}" from {1} Complete - Elapsed time: {2}'.format(fname, sys.modules[function.__module__], elapsed)
return output
return wrapper
@timeit
def get_value_min_old_cur(fc, field):
rows = arcpy.SearchCursor(fc)
return min([r.getValue(field) for r in rows])
@timeit
def get_value_min_new_cur(fc, field):
with arcpy.da.SearchCursor(fc, [field]) as rows:
return min([r[0] for r in rows])
@timeit
def get_value_sql(fc, field):
"""good suggestion to use sql order by by dslamb :) """
wc = "%s IS NOT NULL"%field
sc = (None,'Order By %s'%field)
with arcpy.da.SearchCursor(fc, [field]) as rows:
for r in rows:
# should give us the min on the first record
return r[0]
@timeit
def test_field_calc(fc, field, expression):
arcpy.management.CalculateField(fc, field, expression, 'PYTHON')
@timeit
def old_cursor_calc(fc, xfield, matrix_field, value):
wc = "%s IS NOT NULL"%xfield
rows = arcpy.UpdateCursor(fc, where_clause=wc)
for row in rows:
if row.getValue(xfield) is not None:
row.setValue(matrix_field, (row.getValue(xfield) - value) / 20)
rows.updateRow(row)
@timeit
def new_cursor_calc(fc, xfield, matrix_field, value):
wc = "%s IS NOT NULL"%xfield
with arcpy.da.UpdateCursor(fc, [xfield, matrix_field], where_clause=wc) as rows:
for r in rows:
r[1] = (r[0] - value) / 20
rows.updateRow(r)
if __name__ == '__main__':
Xfield = "XKoordInt"
Mfield = 'Matrix_Z'
fc = r'C:\Users\calebma\Documents\ArcGIS\Default.gdb\Random_Points'
# first test the speed of getting the value
print 'getting value tests...'
value = get_value_min_old_cur(fc, Xfield)
value = get_value_min_new_cur(fc, Xfield)
value = get_value_sql(fc, Xfield)
print '\n\nmin value is {}\n\n'.format(value)
# now test field calculations
expression = "(!XKoordInt!-{0})/20".format(value)
test_field_calc(fc, Xfield, expression)
old_cursor_calc(fc, Xfield, Mfield, value)
new_cursor_calc(fc, Xfield, Mfield, value)
और अंत में, यह वही है जो वास्तविक प्रिंट आउट मेरे कंसोल से था।
>>>
getting value tests...
"get_value_min_old_cur" from <module '__main__' from 'C:/Users/calebma/Desktop/speed_test2.py'> Complete - Elapsed time: 0:00:19.23
"get_value_min_new_cur" from <module '__main__' from 'C:/Users/calebma/Desktop/speed_test2.py'> Complete - Elapsed time: 0:00:02.50
"get_value_sql" from <module '__main__' from 'C:/Users/calebma/Desktop/speed_test2.py'> Complete - Elapsed time: 0:00:00.02
min value is 5393879
"test_field_calc" from <module '__main__' from 'C:/Users/calebma/Desktop/speed_test2.py'> Complete - Elapsed time: 0:00:14.21
"old_cursor_calc" from <module '__main__' from 'C:/Users/calebma/Desktop/speed_test2.py'> Complete - Elapsed time: 0:00:42.47
"new_cursor_calc" from <module '__main__' from 'C:/Users/calebma/Desktop/speed_test2.py'> Complete - Elapsed time: 0:00:08.71
>>>
संपादित करें 2: बस कुछ अपडेट किए गए परीक्षणों को पोस्ट किया, मुझे अपने timeit
फ़ंक्शन के साथ एक मामूली दोष मिला ।