——一个二本程序员对未来的思考
写在前面
我是一个普通二本出来的程序员,有一年 Java 和 C# 的后端经验。
今天之前,我还在焦虑。焦虑学 Python 来不来得及,焦虑 AI 会不会取代程序员,焦虑自己是不是在学一些“调包”就能干的技术。但今天,我忽然想明白了一件事,在这里把它记下来,给未来的自己看。
正文
一、以前的软件工程,重心是“代码”
过去十年,软件工程的核心是“写代码”。
你值多少钱,取决于你代码写得好不好,架构设计得漂不漂亮,算法够不够优化,对业务理解够不够深。
工程师的护城河是“逻辑的正确性”——if-else 的分支能不能覆盖所有情况,事务能不能保证一致性,接口能不能扛住高并发。
代码是资产,逻辑是壁垒。
二、AI 来了,但事情和我们想的不太一样
起初我也以为,大模型会写代码了,程序员要失业了。
但当我真的开始学大模型应用开发时,我发现了一件事:大模型根本不知道企业的业务数据是什么。它不知道公司的退货政策,不知道去年的财报数据,不知道内部的审批流程。
它能写诗、能聊天、能写代码,但它不知道“你公司的事”。
那怎么让它知道?把企业的数据喂给它。
但企业的数据不是干净的。它们躺在几千份 PDF、Word、扫描件、Excel 表格里,格式混乱,结构不一,有些还是图片。你要做的,不是写一段漂亮的业务逻辑,而是把这些“屎山”一样的数据,变成大模型能读懂的、高质量的向量数据。
三、我意识到,重心变了
以前软件工程的核心是“写代码”,未来 AI 应用工程的核心是“建数据”。
不是随便建,而是建高质量的数据流水线:
- 把扫描件 OCR 成文字,保持表格结构不乱
- 设计切片策略,不要让“退货地址”和“退货时效”被切成两段
- 给每一块数据打上标签——来源、时间、权限、部门
- 做多路召回,向量检索找语义,关键词检索找精确匹配,合并后再重排序
- 用评估体系验证,把准确率从 68% 拽到 91%
这些工作,跟“写 CRUD”完全是两码事。它们不需要你发明新算法,但需要你理解数据的形态、业务场景的痛点,以及检索系统的底层逻辑。
四、那么,什么变了,什么没变?
- 代码的价值没有归零,但它从核心资产变成了上下文技能。你还是得会写代码,但代码本身不是壁垒了,谁都能写。
- 数据的价值正在成为新的壁垒。因为数据是私有的,场景是专属的,每家企业都要处理自己的“脏数据”,这个能力无法被大模型替代。
- 工程师的定位也在变。以前我们是“逻辑的构建者”,现在我们是“数据质量的守护者”。谁能把企业混乱的文档变成 AI 能精准检索的知识,谁就值钱。
五、那我接下来学什么?
我不会去卷算法,不去推公式,也不去发论文。那些是科学家做的事。
我要做的,是把这几件事做到极致:
- 文档解析——PDF、扫描件、表格,什么格式都能读
- 切片策略——知道怎么切、切多大、哪里要重叠
- 元数据设计——打标签、做过滤、设权限
- 检索调优——混合检索、重排序,用数据证明准确率提升
- 评估体系——让老板看到数字,让面试官看到结果
这些技能,目前市场极度稀缺,而且短时间不会被 AI 取代。
六、写在最后
我不知道一年后的自己会在哪里,但我知道今天的自己已经不再焦虑了。
不是因为学会了什么新框架,而是因为看清了方向。在这个方向上,普通二本出身的程序员,和名校硕士站在同一条起跑线上。因为 AI 应用工程考验的不是数学天赋,而是对数据的耐心、对业务的理解、对检索系统的掌控力。
这些,跟学历无关,跟学校无关,跟能不能坐得住冷板凳有关。
以前值钱的是代码,以后值钱的是数据。更重要的是,把数据和 AI 连接起来的能力。
而我现在,正在往这个方向走。
2026年7月1日