Spark

这里整理Spark相关的文章与实践记录，内容以问题排查、使用经验和项目笔记为主。

使用datavines 中spark 引擎做任务检测，程序和spark 这一套环境必须部署在同一台服务器中吗

使用datavines 中spark 引擎做任务检测，程序和spark 这一套环境必须部署在同一台服务器中吗

请教一下，使用datavines 中spark 引擎做任务检测，程序和spark 这一套环境必须部署在同一台服务器中吗？具体要做哪些配置，才能完全把任务跑起来[捂脸][捂脸]...

帅平大数据2025-10-23326 阅读1 评论

park读取paimon的数据来跑批耗时太久，导致源数据的snapshot已经过期了，找不到对应的数据了

park读取paimon的数据来跑批耗时太久，导致源数据的snapshot已经过期了，找不到对应的数据了

你们有没有遇到过这样的问题，spark读取paimon的数据来跑批，但是spark的任务耗时都比较久7-8个小时，这样就会导致源数据的snapshot已经过期了，找不到对应的数据了，现在怎么办？...

帅平大数据2025-10-14461 阅读1 评论

请问一下paimon的流批一体, 指的是存储和读写的一体吗?

请问一下paimon的流批一体, 指的是存储和读写的一体吗?

请问一下paimon的流批一体, 指的是存储和读写的一体吗? 计算代码是否也是一套能搞定呢? 比如flink sql流读写法和spark sql写法不一样，比较好奇这一点。...

帅平大数据2025-06-10546 阅读1 评论

FlinkSQL与SparkSQL相比有哪些优势和特点？

FlinkSQL与SparkSQL相比有哪些优势和特点？

FlinkSQL与SparkSQL相比有哪些优势和特点？...

帅平面试刷题2025-05-27468 阅读1 评论

如何在Spark中使用Paimon？

如何在Spark中使用Paimon？

如何在Spark中使用Paimon？...

帅平面试刷题2025-05-26417 阅读1 评论

Spark Stage的划分逻辑？如何查看Spark任务的Stage？你在做任务优化的时候有哪些优化策略？

Spark Stage的划分逻辑？如何查看Spark任务的Stage？你在做任务优化的时候有哪些优化策略？

Spark Stage的划分逻辑？如何查看Spark任务的Stage？你在做任务优化的时候有哪些优化策略？...

帅平面试刷题2025-05-15490 阅读1 评论

Apache Spark有哪些优缺点？

Apache Spark有哪些优缺点？

Apache Spark有哪些优缺点？...

帅平面试刷题2025-04-15486 阅读1 评论

Spark和MapReduce之间有什么区别？

Spark和MapReduce之间有什么区别？

Spark和MapReduce之间有什么区别？...

帅平面试刷题2025-04-15521 阅读1 评论

spark SQL 和hive on spark有什么区别？

spark SQL 和hive on spark有什么区别？

spark SQL 和hive on spark有什么区别？...

帅平面试刷题2025-02-08663 阅读1 评论

如何使用Spark解决TopN问题？

如何使用Spark解决TopN问题？

如何使用Spark解决TopN问题？...

帅平面试刷题2025-01-22778 阅读1 评论

Spark使用parquet文件存储格式能带来哪些好处？

Spark使用parquet文件存储格式能带来哪些好处？

Spark使用parquet文件存储格式能带来哪些好处？...

帅平面试刷题2025-01-22576 阅读1 评论

Spark 应用程序中的什么情况下容易出现OOM，如何解决？

Spark 应用程序中的什么情况下容易出现OOM，如何解决？

Spark 应用程序中的什么情况下容易出现OOM，如何解决？...

帅平面试刷题2025-01-22574 阅读6 评论

Spark中repartition和colease有什么区别？

Spark中repartition和colease有什么区别？

Spark中repartition和colease有什么区别？...

帅平面试刷题2025-01-22556 阅读1 评论

Spark中Persist与Cache的关系和区别是什么？

Spark中Persist与Cache的关系和区别是什么？

Spark中Persist与Cache的关系和区别是什么？...

帅平面试刷题2025-01-22542 阅读1 评论

Spark 3.0 的AQE 是如何进行性能优化的？

Spark 3.0 的AQE 是如何进行性能优化的？

Spark 3.0 的AQE 是如何进行性能优化的？...

帅平面试刷题2025-01-22534 阅读1 评论