博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
spark遇到的错误1-内存不足
阅读量:5812 次
发布时间:2019-06-18

本文共 1447 字,大约阅读时间需要 4 分钟。

 

原来的代码:

JavaRDD
javaRdd = rdd.flatMap(new FlatMapFunction
() { private static final long serialVersionUID = 10000L; List
newList = new ArrayList
(); public Iterable
call(String line) throws Exception { String[] splits = line.split("\t"); ArticleReply bean = new ArticleReply(); bean.setAreaId(split[0]); bean.setAgent(Integer.parseInt(splits[1])); bean.setSerial(splits[2]); newList.add(bean); return newList; } });

 

正确写法:

JavaRDD
javaRdd = rdd.flatMap(new FlatMapFunction
() {
private static final long serialVersionUID = 10000L;                        public Iterable
call(String line) throws Exception {
         List
newList = new ArrayList
(); String[] splits = line.split("\t"); ArticleReply bean = new ArticleReply(); bean.setAreaId(split[0]); bean.setAgent(Integer.parseInt(splits[1])); bean.setSerial(splits[2]); newList.add(bean); return newList; } });

错误的写法中把list声明和初始化在flatMap函数之外,造成每次调用flatMap函数后,list的bean会增加一个,同时程序会将改list返还回去,那么spark接收的对象1+2+3+...+N个,

而不是N个,会极大地消耗spark的内存,造成spark运行内存不足。

转载于:https://www.cnblogs.com/fillPv/p/5013732.html

你可能感兴趣的文章
C语言数据类型char
查看>>
Online Patching--EBS R12.2最大的改进
查看>>
Binary Search Tree Iterator leetcode
查看>>
Oracle性能优化--DBMS_PROFILER
查看>>
uva-317-找规律
查看>>
Event事件的兼容性(转)
查看>>
我的2014-相对奢侈的生活
查看>>
zoj 2412 dfs 求连通分量的个数
查看>>
Java设计模式
查看>>
一文读懂 AOP | 你想要的最全面 AOP 方法探讨
查看>>
ndk制作so库,ndk-build不是内部或外部命令。。。的错误
查看>>
Spring Cloud 微服务分布式链路跟踪 Sleuth 与 Zipkin
查看>>
ORM数据库框架 SQLite 常用数据库框架比较 MD
查看>>
STL_算法_依据第n个元素排序(nth_element)
查看>>
BNU 34990 Justice String (hash+二分求LCP)
查看>>
华为OJ 名字美丽度
查看>>
Android 带清除功能的输入框控件EditTextWithDel
查看>>
微信公众号与APP微信第三方登录账号打通
查看>>
onchange()事件的应用
查看>>
PowerPoint 2010 设置演讲者模式
查看>>