मैं pyspark डेटाफ़्रेम में .csv फ़ाइल कैसे आयात कर सकता हूं? मैंने पंडों में सीएसवी फ़ाइल को पढ़ने की भी कोशिश की और फिर इसे createDataFrame का उपयोग करके एक स्पार्क डेटाफ़्रेम में बदल दिया, लेकिन यह अभी भी कुछ त्रुटि दिखा रहा है। क्या कोई इसके माध्यम से मेरा मार्गदर्शन कर सकता है? इसके अलावा, कृपया मुझे बताएं कि मैं xlsx फ़ाइल कैसे आयात कर सकता हूं? मैं पांडा डेटाफ़्रेम में सीएसवी सामग्री आयात करने की कोशिश कर रहा हूं और फिर इसे स्पार्क डेटा फ़्रेम में परिवर्तित कर सकता हूं, लेकिन यह त्रुटि दिखा रहा है:
"Py4JJavaError" An error occurred while calling o28.applySchemaToPythonRDD. : java.lang.RuntimeException: java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient
मेरा कोड है:
from pyspark import SparkContext
from pyspark.sql import SQLContext
import pandas as pd
sqlc=SQLContext(sc)
df=pd.read_csv(r'D:\BestBuy\train.csv')
sdf=sqlc.createDataFrame(df)