1. 定位导航
第 43-45 篇的 RNN 处理"等长序列"任务(每个 token 一个标签、整序列一个标签)。
但翻译任务输入输出长度通常不同:
- 输入:英语 “I love deep learning” (4 tokens)
- 输出:中文 “我爱深度学习” (5 tokens)
Seq2Seq 架构(2014)就是为此而生——它也是注意力机制的诞生地,最终演化出Transformer。
第 10 章规划进度:
| 篇号 | 主题 | 状态 |
|---|---|---|
| 43-45 | RNN/LSTM 基础 | ✅ |
| 46(本篇) | Seq2Seq + Attention | 🚀 |