1.内存优化
3 m. }8 ^8 ?4 p5 f) x$ t2小文件过多问题
& X. T. | [- h( l& t5 p$ [3.spark sql合理利用cpu资源/ B$ M4 u) t, |' j9 l$ @
4.spark sql广播join: D/ ~4 \0 q0 v; g! b( f; V
5.提高并行度解决数据倾斜错误演示8 m+ N% \; K; v1 I! v
6.解决数据倾斜打散大表扩容小表
# o; R( @* F7 f7 V2 h( R1 C* P1 y7.大表join大表优化SMBJoin. w/ ~" G" Q- |4 j) ?: j
8.使用堆外内存 {+ v) N% ~* S+ D/ r, C7 H
9.spark 3.0AQE动态缩小分区+ q, g2 p5 s* b0 I9 B B* h
10.spark 3.0AQE动态选择join策略
3 y$ U6 v( b, x% M+ b4 `11 spark3.0AQE动态优化倾斜join
) |9 L! S0 u8 m, j @12 sparak3.0 dpp动态分区修剪/ o. D/ A+ c# o' O# A2 t- x! V
4 C! M" p1 e. {1 t本站精挑细选,只分享优质精品资源,已泛滥、已过时、质量差的资源不录入!2 b6 j u6 g+ w% g b1 k0 o
$ G+ g( F* I) F. k. g6 \/ z$ e# n
) y, B( j1 b& k. c' c) i% _9 A- E. g
# [6 u: A( |7 s) I. O4 B* V3 E# k' B# K; @' C
|