news 2026/6/9 13:57:47

PySpark on Linux系统配置 Hadoop3.1.3+Spark3.4.4(PySpark3)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
PySpark on Linux系统配置 Hadoop3.1.3+Spark3.4.4(PySpark3)

https://www.apache.org/dyn/closer.lua/spark/spark-3.4.4/spark-3.4.4-bin-hadoop3.tgz

https://repo.anaconda.com/archive/Anaconda3-2024.10-1-Linux-x86_64.sh

1.安装vmworkstation 15.5

2. 安装linux-centos7

3.配置网络,ip静态化

ip静态化:

vim /etc/sysconfig/network-scripts/ifcfg-ens33

配置网络ip

对本机ip进行修改.

这里一定要改,不然moba连接不上

配置开机激活网络

vim /etc/sysconfig/network

重启网络服务即可生效

systemctl restart network service

4.配置主机,修改主机名

更改主机名

配置主机 ip及名字

5.配置主机与ip映射关系

这里暂时做伪分布式,就不配了

6.关闭虚拟机防火墙

systemctl status firewalld.service

状态已关闭,不必继续关了

7.安装jdk配置环境变量

export JAVA_HOME=/root/meituan/jdk1.8.0_121

export PATH=$JAVA_HOME/bin:$PATH

查看环境变量配置

vim /etc/profile

8.配置免秘钥登录

ssh-keygen -t rsa

把当前密钥追加到

cat ~/.ssh/id_rsa.pub>> ~/.ssh/authorized_keys
设置权限

chmod 600 ~/.ssh/authorized_keys

600 6=4+2 自己可读可写,不可执行

此时重启一下电脑

9.上传hadoop3.1.3

tar -zxvf hadoop-3.1.3.tar.gz

mv hadoop-3.1.3 hadoop

10. 配置Hadoop环境变量

  1. 配置环境变量

vi /etc/profile

export HADOOP_HOME=/root/soft/hadoop

export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

export HDFS_NAMENODE_USER=root

export HDFS_SECONDARYNAMENODE_USER=root

export HDFS_DATANODE_USER=root

export YARN_RESOURCEMANAGER_USER=root

export YARN_NODEMANAGER_USER=root

配置完,刷新一下

source /etc/profile

检查一下环境变量是否配置成功

hadoop version

11.需要修改Hadoop的核心配置文件包括:共7个

配置文件所在位置/root/soft/hadoop/etc/hadoop

vimhadoop-env.sh

export JAVA_HOME=/root/meituan/jdk1.8.0_121

yarn-env.sh

export JAVA_HOME=/root/meituan/jdk1.8.0_121

3.core-site.xml、

添加内容如下:

<configuration>

<!-- 设置namenode内部通信端口 hdfs://主机名:端口号 -->

<property>

<name>fs.defaultFS</name>

<value>hdfs://tonymin:9820</value>

</property>

<!-- 设置hadoop数据存储的临时文件夹 -->

<property>

<name>hadoop.tmp.dir</name>

<value>/root/soft/hadoop/tmp</value>

</property>

</configuration>

4.hdfs-site.xml、

<configuration>

<!--设置hdfs的副本数-->

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

<!--设置namenode文件存储路径-->

<property>

<name>dfs.name.dir</name>

<value>/root/soft/hadoop/tmp/hdfs/name</value>

</property>

<!--设置datanode文件存储路径-->

<property>

<name>dfs.data.dir</name>

<value>/root/soft/hadoop/tmp/hdfs/data</value>

</property>

<!-- namenode的web端访问地址:主机名:端⼝号 -->

<property>

<name>dfs.namenode.http-address</name>

<value>tonymin:9870</value>

</property>

<!-- secondarynamenode的web端访问地址:主机名:端⼝号-->

<property>

<name>dfs.namenode.secondary.http-address</name>

<value>tonymin:9868</value>

</property>

</configuration>

装Hive

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/30 20:13:06

SMB挂载与iSCSI挂载飞牛存储:你该选择哪一种连接方式?

作为一个刚刚跨入“私有云”大门的小白&#xff0c;面对飞牛存储后台里那两个让人头大的选项——SMB挂载和iSCSI挂载&#xff0c;你是不是也感觉像在选修天文学还是量子物理&#xff1f; 别担心&#xff0c;今天我们就用“人话”来聊聊这事儿&#xff0c;保证不出现一句让你想…

作者头像 李华
网站建设 2026/6/7 15:58:09

大规模语言模型在个性化职业规划中的应用

大规模语言模型在个性化职业规划中的应用 关键词:大规模语言模型、个性化职业规划、职业分析、职业推荐、职业发展路径 摘要:本文深入探讨了大规模语言模型在个性化职业规划领域的应用。首先介绍了研究的背景、目的、预期读者、文档结构和相关术语。接着阐述了大规模语言模型…

作者头像 李华
网站建设 2026/5/31 15:04:28

FHIR 资源查询实战指南:从 HTTP 接口到 Java 客户端的完整实现

一、前言&#xff1a;为什么需要理解 FHIR 查询&#xff1f; 在医疗健康信息系统中&#xff0c;FHIR&#xff08;Fast Healthcare Interoperability Resources&#xff09;已成为事实上的数据交换标准。无论是设备管理、任务审批、还是患者服务&#xff0c;我们常常需要回答这…

作者头像 李华
网站建设 2026/5/30 8:30:06

微服务架构设计大比拼:独立数据库 VS 集中式DAO,谁才是真香定律?

前言各位码农朋友们&#xff0c;今天咱们来聊一个让人又爱又恨的话题——微服务的数据层设计。相信不少小伙伴都经历过这样的场景&#xff1a;领导一拍脑袋说要搞微服务拆分&#xff0c;结果拆着拆着就发现&#xff0c;哎呀&#xff0c;数据库连接不够用了&#xff01;这感觉就…

作者头像 李华