PyPI作为Python生态的核心仓库,自2025年以来,每周新发布的软件包数量增长了30%,近几个月增长曲线尤为陡峭,几乎呈指数级上升。这一增长的主要驱动力是AI辅助编程工具的普及,任何人只需几分钟就能生成并发布一个“可用”的Python包。
这种爆发式增长给PyPI的维护者带来巨大压力。存储需求持续攀升,每周下载量也在增长,而支撑PyPI运营的Python软件基金会是依赖捐赠的非营利组织,当垃圾包增长速度远超资源增长时,系统的可持续性成了严肃问题。
开发者Artem Golubin开发的Hexora恶意Python代码检测工具发现,大量新发布的包是“vibecoded”的产物,会触发大量误报。这些包滥用eval、exec和subprocess调用,而这些操作在Python中完全可以避免。
eval和exec用于动态执行代码,是恶意软件常用的隐藏载荷手段。当敏感数据被传递其中,或者代码呈现混淆特征时,就构成明确的红色警报。例如某包读取Python代码、修改后将所有环境变量和本地变量传递给eval然后执行,几乎没有合理使用场景;另一个项目将Python代码以base64编码字符串形式存入数据库,读取时解码并用exec执行,除了让代码像恶意软件外毫无意义。
监测中还发现,某些包的发布频率高得离谱,有人在单一天内发布了392个包版本,这明显是滥用行为。
这种趋势若持续,PyPI生态系统的稳定性和安全性将面临严峻挑战。供应链攻击监控项目需要人工干预来过滤误报,包越多,人工工作量越大,安全研究者的负担也在快速增长。
编辑观点:AI代码大量涌入PyPI,数量与质量的失衡敲响了安全警钟。行业需重视代码质量审核,升级安全防御机制,以保障Python生态的稳定与安全。