spark遇到的错误1-内存不足-白红宇

spark遇到的错误1-内存不足

阅读量：5812 次

发布时间：2019-06-18

本文共 1447 字，大约阅读时间需要 4 分钟。

原来的代码：

JavaRDD
     
       javaRdd = rdd.flatMap(new FlatMapFunction
      
       () {            private static final long serialVersionUID = 10000L;            List
       
         newList = new ArrayList
        
         ();            public Iterable
         
           call(String line) throws Exception {                String[] splits = line.split("\t");                ArticleReply bean = new ArticleReply();                bean.setAreaId(split[0]);                bean.setAgent(Integer.parseInt(splits[1]));                bean.setSerial(splits[2]);                newList.add(bean);                return newList;            }        });

正确写法：

JavaRDD
     
       javaRdd = rdd.flatMap(new FlatMapFunction
      
       () {

private static final long serialVersionUID = 10000L;                        public Iterable
     
       call(String line) throws Exception {
   　　　　　　　　　List
      
        newList = new ArrayList
       
        ();                String[] splits = line.split("\t");                ArticleReply bean = new ArticleReply(); bean.setAreaId(split[0]); bean.setAgent(Integer.parseInt(splits[1])); bean.setSerial(splits[2]); newList.add(bean); return newList; } });

错误的写法中把list声明和初始化在flatMap函数之外，造成每次调用flatMap函数后，list的bean会增加一个，同时程序会将改list返还回去，那么spark接收的对象1+2+3+...+N个，

而不是N个，会极大地消耗spark的内存，造成spark运行内存不足。

转载于:https://www.cnblogs.com/fillPv/p/5013732.html

你可能感兴趣的文章

C语言数据类型char

查看>>

Online Patching--EBS R12.2最大的改进

查看>>

Binary Search Tree Iterator leetcode

查看>>

Oracle性能优化--DBMS_PROFILER

查看>>