4.RDD操作

发布时间:2022-06-23 发布网站:脚本宝典
脚本宝典收集整理的这篇文章主要介绍了4.RDD操作脚本宝典觉得挺不错的,现在分享给大家,也给大家做个参考。

一、 RDD创建

  1. 从本地文件系统中加载数据创建RDD将本地文件TextOne.txt中的数据导入RDD中

          

4.RDD操作

   2.从HDFS加载数据创建RDD

   启动hdfs

   

4.RDD操作

   上传文件

   

4.RDD操作

   查看文件

           

4.RDD操作

   加载

           

4.RDD操作

   停止hdfs

           

4.RDD操作

  1. 通过并行集合(列表)创建RDD 输入列表 字符串 numpy生成数组

   

4.RDD操作

二、 RDD操作

  1.转换操作

   map(func)显式定义函数lambda函数

   

4.RDD操作

   filter(func)   显式定义函数   lambda函数

   

4.RDD操作

 

   2.行动操作

   foreach(print)   foreach(lambda a:print(a.upper())

       

4.RDD操作

   collect()

   

4.RDD操作

 

脚本宝典总结

以上是脚本宝典为你收集整理的4.RDD操作全部内容,希望文章能够帮你解决4.RDD操作所遇到的问题。

如果觉得脚本宝典网站内容还不错,欢迎将脚本宝典推荐好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。
标签: