本文所使用方式为在windows独立环境中进行pyspark的开发 , 如需链接hdfs还是要借助虚拟机的 , 主要包含以下几个步骤
一、windows中的环境配置 1、java的安装 这里建议大家选择版本较低的java版本 , 如果版本较高可能会出现不兼容问题 , Java和hadoop的安装流程我之前的文章里面有 , 大家可以看一下 , 这里附上链接
hadoop安装
2、hadoop的安装 hadoop安装
链接同上
3、scala的安装 先下载scala的压缩包,依然是官网地址,建议2.11的版本,因为后续我们使用的spark版本为2.4.3
直接解压压缩包即可,
建议所有的解压文件都放在同一目录下,以方便后续查找
解压完毕后,配置环境变量,SCALA_HOME,以及path
4、spark的安装 和scala一样 , 直接本地解压 , 就不用管了 , 当然 , 如果你比较讨厌看到红色的很多很多的日志信息 ,
可以再spark的conf文件夹下 , 修改一下log4j这个文件 ,
把log4j.rootCategory这个参数改为ERROR
这样可以隐去大多数日志信息
解压完毕之后 , 也是配置环境变量就可以了
最后 , 检验是否安装成功
java -version
hadoop version
spark-shell
这样环境配置就搞定了
二 , pyspark的导入 1.安装pyspark 先第一步是安装pyspark , 直接使用pip安装
- 春季老年人吃什么养肝?土豆、米饭换着吃
- 三八妇女节节日祝福分享 三八妇女节节日语录
- 老人谨慎!选好你的“第三只脚”
- 校方进行了深刻的反思 青岛一大学生坠亡校方整改校规
- 脸皮厚的人长寿!有这特征的老人最长寿
- 长寿秘诀:记住这10大妙招 100%增寿
- 春季老年人心血管病高发 3条保命要诀
- 眼睛花不花要看四十八 老年人怎样延缓老花眼
- 香槟然能防治老年痴呆症? 一天三杯它人到90不痴呆
- 老人手抖的原因 为什么老人手会抖
