news 2026/5/24 17:05:15

每日一个开源项目 #110:ai-engineering-from-scratch - 从零构建 AI 工程全栈能力

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
每日一个开源项目 #110:ai-engineering-from-scratch - 从零构建 AI 工程全栈能力

项目简介

ai-engineering-from-scratch是一个极度硬核且完整的 AI 工程课程体系。它不只是教你如何调用 OpenAI 的接口,而是带你从底层的数学原理开始,一步步构建出分词器(Tokenizer)、反向传播(Backprop)、注意力机制(Attention),直到最后的自主智能体集群。

整个课程包含20 个阶段435 个课程,预计学习时长约320 小时。最独特的地方在于,每一课都会产出一个实际可用的“组件”(Artifact),比如一个提示词模板、一个 Agent 技能或一个 MCP 服务器,这些工具可以直接集成到你的日常开发流中。

核心特性

  • 从零开始的构建理念:遵循“理解它的最好方式是亲手实现它”的原则。在引入 PyTorch 等框架之前,你会先用原生 Python/math 实现底层的算法。
  • 全方位覆盖
    • 数学基础:从线性代数到神经网络的第一性原理。
    • 经典 ML 与深度学习:CNN、RNN 以及到 Transformers 的演进。
    • 生成式 AI:图像、视频、音频的生成原理。
    • LLM 工程:训练、微调、量化以及生产环境部署。
    • 智能体(Agent)工程:ReAct 循环、记忆管理、多智能体协作、自主系统。
  • 产出导向:每个课程结束时,你不仅获得了知识,还获得了一个可以在 Claude/Cursor 等 AI 助手里直接使用的.md技能文件。
  • 多语言适配:虽然以编程语言 Python 为主,但也涵盖了 TypeScript、Rust 和 Julia。

如何使用

项目提供了几种不同的“入坑”方式:

  1. 直接阅读:访问 aiengineeringfromscratch.com 在线浏览所有课程文档。
  2. 本地运行
    gitclone https://github.com/rohitg00/ai-engineering-from-scratch.gitcdai-engineering-from-scratch python phases/01-math-foundations/01-linear-algebra-intuition/code/vectors.py
  3. 智能体驱动(推荐):如果你使用 Claude 或 Cursor 等 AI 编辑器,可以直接在对话框里运行/find-your-level。该项目内置了 10 个问题的水平测试,会根据你的现状为你定制一条学习路径。

总结

如果你已经厌倦了各种“一分钟学会 Prompt 技巧”的快餐教程,想要真正深入 AI 底层逻辑,并建立起一套属于自己的 AI 工程兵工厂,那么ai-engineering-from-scratch绝对是目前最全面、最高质量的选择。


访问项目地址:rohitg00/ai-engineering-from-scratch


欢迎来我的个人主页找到更多有用的知识和有趣的产品

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/24 17:01:50

以技术管控替代人为约束,夯实煤矿安全生产根基 ——结合山西沁源5·22瓦斯爆炸事故剖析矿山安全管控升级方案

以技术管控替代人为约束,夯实煤矿安全生产根基——结合山西沁源522瓦斯爆炸事故剖析矿山安全管控升级方案一、前言山西沁源留神峪煤矿522特别重大瓦斯爆炸事故,惨痛伤亡数据为整个煤炭行业敲响警钟。复盘事故诱因,除地质灾害、设备隐患等客观…

作者头像 李华
网站建设 2026/5/24 16:55:38

PerfView诊断.NET内存泄漏的四层穿透法

1. 这不是“内存涨了”那么简单:Heap泄漏的本质是对象生命周期失控 你有没有遇到过这样的场景:一个C#服务跑着跑着,内存占用从300MB慢慢爬到1.2GB,GC回收后只回落到900MB,再过几小时又冲到1.5GB——重启一下立刻回到3…

作者头像 李华
网站建设 2026/5/24 16:43:32

增长曲线模型缺失数据处理:机器学习插补为何不敌传统方法?

1. 项目概述与核心问题在心理学、教育学、社会学等领域的纵向研究中,增长曲线模型是我们追踪个体随时间变化轨迹的利器。但现实中的数据往往“千疮百孔”——被试中途退出、问卷漏答、设备故障,都会导致数据缺失。面对这些缺失值,是简单粗暴地…

作者头像 李华