news 2026/3/4 10:14:03

Linux 命令:sort

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Linux 命令:sort

概述

sort命令,这个命令是文本排序的核心工具,能对文件内容或命令输出按行进行排序(字母、数字、时间等规则),还支持按指定列、自定义分隔符、去重等高级操作,是处理结构化文本、日志、数据清单的必备命令,也是joinuniq等命令的前置依赖(很多命令要求输入已排序)。

资料合集:https://pan.quark.cn/s/6fe3007c3e95https://pan.quark.cn/s/561de99256a5https://pan.quark.cn/s/985f55b13d94https://pan.quark.cn/s/d0fb20abd19a

一、基本语法

sort[选项][文件1][文件2]...
  • 无文件参数时,默认读取标准输入(可配合管道|处理其他命令输出);
  • 默认按每行的字符ASCII码值升序排序(字母A-Z、数字0-9);
  • 多文件排序时,会先拼接所有文件内容,再整体排序。

二、核心选项(按功能分类)

sort的选项覆盖排序规则、字段配置、输出控制,高频选项易记且组合性强:

选项分类选项作用实用场景
排序方向
-r--reverse降序排序(默认升序)按数字从大到小、时间从新到旧排序
-n--numeric-sort数字值排序(而非字符ASCII)排序大小、金额、行数等数字列
-h--human-numeric-sort按人类可读的数字(如1K、2M、3G)排序排序du -hls -lh的输出
-V--version-sort按版本号排序(如v1.10 > v1.9)排序软件版本、文件版本号
字段/分隔符配置(核心)
-t "字符"--field-separator=字符指定字段分隔符(默认空格/制表符)处理CSV(逗号分隔)、竖线分隔的文本
-k N--key=N指定按第N列排序(可指定列范围,如-k2,3按指定列(如用户ID、金额列)排序
-k N,M——按第N列到第M列排序多列组合排序(如先按城市、再按年龄)
-k Nn——第N列按数字排序(组合选项)列是数字时,避免按字符排序
输出控制
-u--unique排序并去重(仅保留唯一行)去重文本、统计唯一值
-o 文件--output=文件将排序结果输出到指定文件(替代重定向>排序后覆盖原文件(sort -o file file
-s--stable稳定排序(相同键值的行保持原顺序)需保留原始相对顺序的场景
-f--ignore-case忽略大小写(如A和a视为相同)字母排序时统一大小写规则

三、基础示例(快速上手)

先准备测试文件test.txt

banana Apple cherry 100 20 3 hello Hello
场景1:默认排序(ASCII码升序)
sorttest.txt

输出(数字<大写字母<小写字母,ASCII码顺序):

100 20 3 Apple Hello banana cherry hello
场景2:数字排序(-n)+ 降序(-r)
sort-n -r test.txt# 优先按数字降序,非数字行按原规则排

输出:

100 20 3 cherry hello banana Hello Apple
场景3:忽略大小写排序(-f)
sort-f test.txt

输出(A/a、H/h视为相同,按字母顺序):

100 20 3 Apple banana cherry Hello hello
场景4:排序并去重(-u)
# 新增重复行后测试echo-e"apple\nApple\napple"|sort-f -u# 输出:apple(忽略大小写+去重)

四、进阶示例(结构化文本排序,核心场景)

准备结构化文件user.csv(逗号分隔:姓名,年龄,城市,薪资):

张三,25,北京,8000 李四,30,上海,15000 王五,28,北京,10000 赵六,35,广州,12000 钱七,25,上海,9000
场景1:按指定列排序(按城市+薪资降序)
# -t ",":分隔符为逗号# -k3,3:按第3列(城市)排序# -k4nr:按第4列(薪资)数字降序sort-t","-k3,3 -k4nr user.csv

输出(先按城市字母序,同城市按薪资降序):

李四,30,上海,15000 钱七,25,上海,9000 王五,28,北京,10000 张三,25,北京,8000 赵六,35,广州,12000
场景2:处理人类可读数字(-h)
# 模拟du -h输出echo-e"100K\ndata\n2M\n1G\n500K"|sort-h

输出(按大小升序:100K < 500K < 2M < 1G):

100K 500K 2M 1G data
场景3:版本号排序(-V)
echo-e"v1.9\nv1.10\nv2.1\nv1.8.1"|sort-V

输出(按版本号自然顺序):

v1.8.1 v1.9 v1.10 v2.1
场景4:排序后覆盖原文件(-o)

直接排序并替换原文件(避免sort file > file导致文件清空):

sort-t","-k2n -o user.csv user.csv# 按年龄升序排序,结果覆盖原文件

五、关键注意事项

  1. 分隔符处理
    • 若字段分隔符是多个空格/制表符混合,无需指定-tsort默认将连续空白视为一个分隔符;
    • CSV文件若含引号(如"张三,男",25),sort无法识别,需先用sed/awk处理引号。
  2. 空行处理:默认空行排在最前面,可通过grep -v "^$"先过滤空行再排序。
  3. 稳定排序:默认排序在键值相同时,行顺序可能随机,加-s可保持原始相对顺序。
  4. 超大文件sort会自动使用临时文件,支持GB级文件排序,无需担心内存不足。
  5. 与uniq配合uniq仅能去重连续重复行,需先sortuniqsort file | uniq),等价于sort -u file

六、高频组合用法

1. 统计日志中出现次数最多的IP
# 提取IP列 → 排序 → 去重并计数 → 按次数降序grep-o"\b[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\b"access.log|sort|uniq-c|sort-nr
2. 按文件大小排序(ls -lh + sort)
ls-lh|grep-v"^total"|sort-k5h -r# -k5h:按第5列(文件大小)人类可读降序
3. 排序后关联数据(sort + join)
# 先排序两个文件,再joinsortfile1.txt -o file1_sorted.txtsortfile2.txt -o file2_sorted.txtjoinfile1_sorted.txt file2_sorted.txt

总结

sort文本排序的万能工具,核心价值是自定义规则排序文本行,日常高频用法:

  1. 基础排序:sort 文件名(升序)、sort -r 文件名(降序);
  2. 数字排序:sort -n 文件名sort -nr 文件名(数字降序);
  3. 按列排序:sort -t "分隔符" -k N 文件名
  4. 去重排序:sort -u 文件名(等价sort | uniq);
  5. 特殊排序:sort -h(人类可读数字)、sort -V(版本号)。
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/3 15:22:41

使用高版本SpringBoot导致Junit5的NoSuchMethodError的错误

关于作者&#xff1a; 一个深耕自己&#xff0c;不内耗的长期主义者。一个对技术充满激情&#xff0c;对工作对生活充满热情的热血青年。坚信&#xff0c;真正能让大家看懂的技术文章才是好文章&#xff0c;坚持用通俗易懂的大白话写技术文章&#xff0c;并会持续更新。 一、问…

作者头像 李华
网站建设 2026/2/22 1:10:21

深入理解 Java 虚拟机内存模型

深入理解 Java 虚拟机内存模型&#xff08;JMM&#xff09;—— 从底层原理到多线程实战&#xff08;2026 年视角&#xff09; Java 内存模型&#xff08;Java Memory Model&#xff0c;简称 JMM&#xff09;是 JVM 规范中定义的抽象模型&#xff0c;它屏蔽了底层硬件&#xf…

作者头像 李华
网站建设 2026/3/3 15:29:05

现代嵌入式C++教程——C++一定会使得代码膨胀嘛?

现代嵌入式 C 教程系列 —— “C 一定会导致代码膨胀吗&#xff1f;” 答案是&#xff1a;不一定&#xff0c;甚至在很多情况下不会。 现代 C&#xff08;C11/14/17/20/23&#xff09;在嵌入式领域已经可以做到零成本抽象&#xff08;zero-cost abstractions&#xff09;或极低…

作者头像 李华
网站建设 2026/3/4 6:55:21

Python 文件读写核心机制与最佳实践

Python 文件读写核心机制与最佳实践 &#xff08;2025-2026 年视角&#xff0c;兼顾性能、安全、可维护性&#xff09; Python 的文件操作表面上看很简单&#xff08;open() 一行搞定&#xff09;&#xff0c;但底层机制、编码处理、缓冲策略、异常场景、并发安全等细节如果没…

作者头像 李华
网站建设 2026/3/4 2:54:18

使用 Wireshark 进行网络嗅探是有效的网络监控和安全分析方法

使用 Wireshark 进行网络嗅探是有效的网络监控和安全分析方法 如何使用 Wireshark 进行网络嗅探区分网络嗅探的合法与非法使用 网络嗅探作为一种强大的网络分析技术&#xff0c;可以帮助用户深入了解网络流量中的数据包细节。Wireshark 作为该领域最流行的工具之一&#xff0…

作者头像 李华