news 2026/6/26 5:27:20

不用sqoop将Hive中的30万条数据导入到了MySQL中。

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
不用sqoop将Hive中的30万条数据导入到了MySQL中。

Hive数据导入MySQL完整步骤记录

一、环境准备

1. 确认Hive数据存在

bash

# 查看Hive表中的数据量 hive -e "SELECT COUNT(*) FROM ymx_dblab.ymx_action;"

结果:300000条记录

2. 确认MySQL表存在

bash

# 查看MySQL中的表 mysql -uroot -pItcast@2022 -e "SHOW TABLES FROM dblab_ymx;"

结果ymx_action表已存在

二、数据导出与导入(核心步骤)

第1步:开启MySQL本地文件导入功能

bash

# 登录MySQL mysql -uroot -pItcast@2022 # 在MySQL中执行 SET GLOBAL local_infile = 1; EXIT;
第2步:从Hive导出数据到本地文件

bash

# 导出Hive数据到/tmp目录 hive -e "SET hive.cli.print.header=false; SELECT * FROM ymx_dblab.ymx_action;" 2>/dev/null > /tmp/hive_data.txt
第3步:验证导出数据量

bash

# 查看导出的数据行数 wc -l /tmp/hive_data.txt

结果:300000行

第4步:导入数据到MySQL

bash

# 使用LOAD DATA命令导入 mysql -uroot -pItcast@2022 --local-infile=1 dblab_ymx -e "LOAD DATA LOCAL INFILE '/tmp/hive_data.txt' INTO TABLE ymx_action FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n';"

三、验证导入结果

验证1:查看总记录数

bash

mysql -uroot -pItcast@2022 -e "SELECT COUNT(*) FROM dblab_ymx.ymx_action;"

结果:300000条

验证2:查看前10条数据

bash

# 进入MySQL交互界面 mysql -uroot -pItcast@2022 # 执行查询 USE dblab_ymx; SELECT * FROM ymx_action LIMIT 10; EXIT;
验证3:查看各行为类型分布

bash

mysql -uroot -pItcast@2022 -e "SELECT behavior_type, COUNT(*) FROM dblab_ymx.ymx_action GROUP BY behavior_type;"

四、完整命令汇总

以下是你执行过的所有命令,按顺序排列:

bash

# 1. 查看Hive数据量 hive -e "SELECT COUNT(*) FROM ymx_dblab.ymx_action;" # 2. 查看MySQL表 mysql -uroot -pItcast@2022 -e "SHOW TABLES FROM dblab_ymx;" # 3. 开启MySQL本地文件导入 mysql -uroot -pItcast@2022 -e "SET GLOBAL local_infile = 1;" # 4. 导出Hive数据 hive -e "SET hive.cli.print.header=false; SELECT * FROM ymx_dblab.ymx_action;" 2>/dev/null > /tmp/hive_data.txt # 5. 查看导出行数 wc -l /tmp/hive_data.txt # 6. 导入MySQL mysql -uroot -pItcast@2022 --local-infile=1 dblab_ymx -e "LOAD DATA LOCAL INFILE '/tmp/hive_data.txt' INTO TABLE ymx_action FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n';" # 7. 验证总记录数 mysql -uroot -pItcast@2022 -e "SELECT COUNT(*) FROM dblab_ymx.ymx_action;" # 8. 清理临时文件 rm -f /tmp/hive_data.txt

五、遇到的问题及解决方案

问题错误信息解决方案
本地文件导入被禁用ERROR 3948: Loading local data is disabled执行SET GLOBAL local_infile = 1;
管道方式导入失败同上改用分步方式:先导出文件,再导入文件

六、关键参数说明

参数含义
SET hive.cli.print.header=false;不打印Hive查询结果的表头
2>/dev/null重定向错误输出,让输出更干净
--local-infile=1启用MySQL本地文件导入
FIELDS TERMINATED BY '\t'字段分隔符为制表符
LINES TERMINATED BY '\n'行分隔符为换行符

七、最终状态

  • 源数据:Hive表ymx_dblab.ymx_action,30万条记录

  • 目标数据:MySQL表dblab_ymx.ymx_action,30万条记录

  • 数据一致性:已验证记录数完全一致 ✅

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/26 5:27:09

构建四层支持性环境系统:从物理空间到认知模式的个人效能提升实践

1. 项目概述:从“华丽的周遭”到个人能量场的构建“华丽的周遭”这个标题,乍一听有点抽象,甚至带点文艺范儿。但如果你把它理解为一个关于“如何系统性地优化你身边的一切,从而提升个人状态、效率与幸福感”的实践项目&#xff0c…

作者头像 李华
网站建设 2026/6/26 5:24:11

第三视觉理解徐玉生与他的商业活动(4)

这是一个非常深刻且反直觉的洞察。通常人们认为“开源”和“分红50%”意味着放弃利润,但结合他**“极客黑客”的身份、“个人持有专利”的底层架构以及“汽配全球批发”的实体赛道来看,他实际上是在追求一种更高级、更隐蔽且更具爆发力的“利润最大化”*…

作者头像 李华
网站建设 2026/6/26 5:22:09

中兴光猫超级管理员权限获取终极指南:3分钟解锁隐藏功能

中兴光猫超级管理员权限获取终极指南:3分钟解锁隐藏功能 【免费下载链接】zteOnu A tool that can open ZTE onu device factory mode 项目地址: https://gitcode.com/gh_mirrors/zt/zteOnu 对于网络爱好者和家庭网络管理员来说,拥有光猫的完全控…

作者头像 李华
网站建设 2026/6/26 5:20:05

Awesome GNOME:一份 GNOME 桌面生态的完整清单

文章目录Awesome GNOME:一份 GNOME 桌面生态的完整清单Awesome GNOME:一份 GNOME 桌面生态的完整清单 GNOME 是 Linux 和类 Unix 系统上使用广泛的桌面环境,以简洁的界面和流畅的交互著称。围绕这个桌面环境,社区积累了大量应用、…

作者头像 李华
网站建设 2026/6/26 5:16:25

如何用Video2X免费实现4K视频画质提升:完整AI视频增强教程

如何用Video2X免费实现4K视频画质提升:完整AI视频增强教程 【免费下载链接】video2x A machine learning-based video super resolution and frame interpolation framework. Est. Hack the Valley II, 2018. 项目地址: https://gitcode.com/GitHub_Trending/vi/v…

作者头像 李华