मैंने GH विकास मास्टर से स्पार्क 1.4 का निर्माण किया, और निर्माण ठीक से गुजरा। लेकिन जब मैं करता bin/pyspark
हूं मुझे पायथन 2.7.9 संस्करण मिलता है। मेरे द्वारा इसे कैसे बदला जा सकता है?
मैंने GH विकास मास्टर से स्पार्क 1.4 का निर्माण किया, और निर्माण ठीक से गुजरा। लेकिन जब मैं करता bin/pyspark
हूं मुझे पायथन 2.7.9 संस्करण मिलता है। मेरे द्वारा इसे कैसे बदला जा सकता है?
जवाबों:
बस पर्यावरण चर सेट करें:
export PYSPARK_PYTHON=python3
यदि आप चाहते हैं कि यह एक स्थायी परिवर्तन हो तो इस लाइन को pyspark स्क्रिप्ट में जोड़ें।
export PYSPARK_PYTHON=python3.5
Python 3.5
$SPARK_HOME/conf/spark-env.sh
ताकि spark-submit
एक ही दुभाषिया का उपयोग किया जा सके।
PYSPARK_PYTHON=python3
./bin/pyspark
यदि आप IPython नोटबुक में चलाना चाहते हैं, तो लिखें:
PYSPARK_PYTHON=python3
PYSPARK_DRIVER_PYTHON=ipython
PYSPARK_DRIVER_PYTHON_OPTS="notebook"
./bin/pyspark
यदि python3
पहुंच योग्य नहीं है, तो आपको इसके बजाय पथ पास करने की आवश्यकता है।
ध्यान रखें कि वर्तमान प्रलेखन (1.4.1 के रूप में) ने निर्देशों को पार कर दिया है। सौभाग्य से, यह पैच किया गया है ।
फ़ाइल पर एक नज़र है। शेबबैंग लाइन शायद 'एनवी' बाइनरी की ओर इशारा करती है जो पहले संगत निष्पादन योग्य के लिए रास्ता खोजती है।
आप अजगर को अजगर 3 में बदल सकते हैं। Pvthon3 बाइनरी को हार्डकोडेड का सीधे उपयोग करने के लिए एनवी को बदलें। या python3 के साथ सीधे बाइनरी निष्पादित करें और शेबंग लाइन को छोड़ दें।
PYSPARK_PYTHON
पर्यावरण चर सेट करने की आवश्यकता है ।
Jupyter नोटबुक के लिए, spark-env.sh
कमांड लाइन से नीचे दिखाए अनुसार फ़ाइल को संपादित करें
$ vi $SPARK_HOME/conf/spark-env.sh
फाइल के नीचे गोटो और इन लाइनों को कॉपी पेस्ट करें
export PYSPARK_PYTHON=python3
export PYSPARK_DRIVER_PYTHON=jupyter
export PYSPARK_DRIVER_PYTHON_OPTS="notebook"
फिर, नोटबुक में pyspark शुरू करने के लिए बस कमांड का पालन करें
$ pyspark
PYSPARK_DRIVER_PYTHON=ipython3 PYSPARK_DRIVER_PYTHON_OPTS="notebook" ./bin/pyspark
, इसकी तलाश में किसी के लिए: जिस स्थिति में यह IPython 3 नोटबुक चलाता है।