火花误差读数镶木地板

提问者：小点点

火花误差读数镶木地板

我们正在使用apache park，我们将json文件保存为hdfs中的gzip压缩parquet文件。但是，当读取它们以生成数据帧时，某些文件（但不是全部）会导致以下异常：

ERROR Executor: Exception in task 2.0 in stage 72.0 (TID 88)
org.apache.parquet.io.ParquetDecodingException: Can not read value at 351 in 
block 0 in file file:/path/to/file [...]
Caused by: java.lang.ClassCastException: 
org.apache.spark.sql.catalyst.expressions.MutableLong cannot be cast to 
org.apache.spark.sql.catalyst.expressions.MutableDouble

任何帮助都非常感谢！

共1个答案

匿名用户

当您尝试同时读取具有不同模式的parquet文件时，会发生这种错误。尝试 /convert所有源文件具有相同的模式或同时转换所有源文件。

相关问题

火花：找不到单位类型的编码器
无法找到存储在数据集中的类型的编码器。在火花结构化流中
如何读取CSV格式数据从JavaRDD<字符串>使用结构类型架构在火花Java
如何组顶部项目从JavaRDD不使用火花SQL？
火花Java再分配
写/读/删除二进制数据在火花数据库（scala）
Apache火花：如何插入数据列与空值dataFrame使用Java
scala火花盒类通用编码器
行类型火花数据集的编码器
火花错误：无法找到存储在数据集中的类型的编码器
将RDD转换为数据集在Java火花
火花JavaRdd/DataFrame/DataSetXML
如何创建一个火花数据帧从整数RDD
加入数据框火花java
为什么Spring/hibernate只读数据库事务比读写运行得慢？
将火花行对象转换为javapojo
在Apache Beam中使用Snappy压缩编写镶木地板文件
使用apache光束在镶木地板中编写原型对象
如何创建从postgres到镶木地板的管道？
使用Apache Beam为每个窗口编写独特的镶木地板文件Python

火花误差读数镶木地板

共1个答案

相关问题

热门标签

微信关注