Hướng dẫn com crealytics/spark-excel databricks - com crealytics/spark-excel databricks

Tôi đang cố đọc một tệp Excel với Spark bằng Jupyter trong VSCODE, với phiên bản Java là 1.8.0_311 (Oracle Corporation) và phiên bản Scala của phiên bản 2.12.15.

Nội dung chính ShowShow

  • java.lang.LlegalArgumentException: tham số "USEHeader" bị thiếu trong các tùy chọn.
  • Làm cách nào để cài đặt com crealytics spark trong excel?
  • Com crealytics Spark Excel là gì?
  • Làm cách nào để đọc một tệp excel trong Databricks?

Đây là mã dưới đây:

# import necessary library 
import pandas as pd 
from pyspark.sql.types import StructType

# entry point for spark's functionality 
from pyspark import SparkContext, SparkConf, SQLContext 
    
configure = SparkConf().setAppName("name").setMaster("local")
sc = SparkContext(conf= configure)
sql = SQLContext(sc)

# entry point for spark's dataframes
from pyspark.sql import SparkSession

spark = SparkSession \
    .builder \
    .master("local") \
    .appName("pharmacy scraper") \
    .config("spark.jars.packages", "com.crealytics:spark-excel_2.11:0.12.2") \
    .getOrCreate()

# reading excel file 
df_generika = spark.read.format("com.crealytics.spark.excel").option("useHeader", "true").option("inferSchema", "true").option("dataAddress", "Sheet1").load("./../data/raw-data/generika.xlsx")

Thật không may, nó tạo ra một lỗi

Py4JJavaError: An error occurred while calling o36.load.
: java.lang.ClassNotFoundException: 
Failed to find data source: com.crealytics.spark.excel. Please find packages at
http://spark.apache.org/third-party-projects.html

Xin chào, Tôi có thể biết Java.LangILLEGALARGUMENTException là gì: tham số "USEHeader" bị thiếu trong các tùy chọn. May I know what's java.langIllegalArgumentException: Parameter "useHeader" is missing in options.
May I know what's java.langIllegalArgumentException: Parameter "useHeader" is missing in options.

Để đọc tệp XLSX, mã của tôi theo DF_EXCEL = Spark.Read.Format ("com.crealytics.spark.excel"). Tùy chọn ("Tiêu đề", "True"). . df_excel= spark.read.format("com.crealytics.spark.excel").option("header", "true").option("treatEmptyValuesAsNulls", "false").option("inferSchema", "false").option("addColorColumns", "false").load("/FileStore/tables/test.xlsx")
df_excel= spark.read.format("com.crealytics.spark.excel").option("header", "true").option("treatEmptyValuesAsNulls", "false").option("inferSchema", "false").option("addColorColumns", "false").load("/FileStore/tables/test.xlsx")

display(df_excel)

Sử dụng Apache Spark 2.4.5, Scala 2.11 Spark-Excel 2.11: 0.12.5 spark-excel 2.11:0.12.5
spark-excel 2.11:0.12.5

Lỗi đầy đủ:

java.lang.LlegalArgumentException: tham số "USEHeader" bị thiếu trong các tùy chọn.

Làm cách nào để cài đặt com crealytics spark trong excel?
/databricks/spark/python/pyspark/sql/utils.py in deco(*a, **kw)
62 try:
---> 63 return f(*a, **kw)
64 except py4j.protocol.Py4JJavaError as e:

Com crealytics Spark Excel là gì?
327 "An error occurred while calling {0}{1}{2}.\n".
--> 328 format(target_id, ".", name), value)
329 else:

Làm cách nào để đọc một tệp excel trong Databricks?
: java.lang.IllegalArgumentException: Parameter "useHeader" is missing in options.
at com.crealytics.spark.excel.DefaultSource.checkParameter(DefaultSource.scala:68)
at com.crealytics.spark.excel.DefaultSource.createRelation(DefaultSource.scala:31)
at com.crealytics.spark.excel.DefaultSource.createRelation(DefaultSource.scala:18)
at com.crealytics.spark.excel.DefaultSource.createRelation(DefaultSource.scala:12)
at org.apache.spark.sql.execution.datasources.DataSource.resolveRelation(DataSource.scala:351)
at org.apache.spark.sql.DataFrameReader.loadV1Source(DataFrameReader.scala:311)
at org.apache.spark.sql.DataFrameReader.load(DataFrameReader.scala:297)
at org.apache.spark.sql.DataFrameReader.load(DataFrameReader.scala:214)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
at java.lang.reflect.Method.invoke(Method.java:498)
at py4j.reflection.MethodInvoker.invoke(MethodInvoker.java:244)
at py4j.reflection.ReflectionEngine.invoke(ReflectionEngine.java:380)
at py4j.Gateway.invoke(Gateway.java:295)
at py4j.commands.AbstractCommand.invokeMethod(AbstractCommand.java:132)
at py4j.commands.CallCommand.execute(CallCommand.java:79)
at py4j.GatewayConnection.run(GatewayConnection.java:251)
at java.lang.Thread.run(Thread.java:748)

Đây là mã dưới đây:

Thật không may, nó tạo ra một lỗi
in
----> 1 df_excel= spark.read.format("com.crealytics.spark.excel").option("treatEmptyValuesAsNulls", "false").option("inferSchema", "false").option("addColorColumns", "false").load("/FileStore/tables/test.xlsx")
2
3 display(df_excel)

/databricks/spark/python/pyspark/sql/readwriter.py in load (self, path, format, lược đồ, ** tùy chọn) 166 return self._df (self._jreader.load ( Không Phải là Không: 168 nếu loại (Đường dẫn)! = Danh sách: 164 self.options (** Tùy chọn) 165 nếu isInstance (đường dẫn, basestring): -> 166 return self._df (self._jreader.load (đường dẫn)) đường dẫn)! = Danh sách:
164 self.options(**options)
165 if isinstance(path, basestring):
--> 166 return self._df(self._jreader.load(path))
167 elif path is not None:
168 if type(path) != list:

/databricks 1259 CHO TEMP_ARG Trong TEMP_ARGS: Gọi (tự, *args) 1255 Trả lời = self.gateway_client.send_command (lệnh) 1256 return_value = get_return_value ( -> 1257 Trả lời trong temp_args:call(self, *args)
1255 answer = self.gateway_client.send_command(command)
1256 return_value = get_return_value(
-> 1257 answer, self.gateway_client, self.target_id, self.name)
1258
1259 for temp_arg in temp_args:

/databricks/spark/python/pyspark/sql/utils.py in deco (*a, ** kW) 77 Rain Khôn 77 RAIN .StartSwith ('java.lang.illegalargumentexception:'): ---> 79 Nâng cao bất hợp pháp
77 raise QueryExecutionException(s.split(': ', 1)[1], stackTrace)
78 if s.startswith('java.lang.IllegalArgumentException: '):
---> 79 raise IllegalArgumentException(s.split(': ', 1)[1], stackTrace)
80 raise
81 return deco

IllectalArgumentException: 'Tham Số "Người dùng"

LÀm Cách nào để cài đặt com crealytics Spark trong excel?

1 câu trả lời ...

Cú Phá: Thư Viện Databricks Cyi Đặt --Cluster-id "id Cụm"-Maven-T-Toordates "GroupId: ArtifactId: Phiênn Bản" (TứC Là.org.jsoup: JSoup: 1.7.2).

BướC 1: Từ Tọa Độ Maven, Bạn Có Thể Vào Kho

BướC 2: Sử dụng lệNH CLI Databricks Bênn dưới Để Cài Đặt 'Com ..

Com crealytics Spark excel là gì?

GitHub - Creaiytics/Spark -Excel: Một plugin Spark Để ĐọC Và VIết Các tệp Excel.A Plugin Spark để đọc và viết các tệp Excel.A Spark plugin for reading and writing Excel files.

LÀm Cách nào để ôn một tệp excel trong databricks?

.có thể làm việc!login in your databricks account, click clusters, then double click the cluster you want to work with.to intall libs.(4) After the lib installation is over, open a notebook to read excel file as follow code chương trình, nó có thể hoạt động!login in your databricks account, click clusters, then double click the cluster you want to work with. to intall libs. (4) After the lib installation is over, open a notebook to read excel file as follow code shows, it can work!