1. 项目概述:为什么我们需要一个更好的“人工突触”?
在人工智能硬件加速的赛道上,我们一直在寻找能真正模拟人脑高效、低功耗计算方式的器件。人脑的算力核心是神经元和突触,其中突触的权重可以根据信号强度进行动态、模拟式的调整,这个过程被称为“可塑性”。要在硅基芯片上复现这种能力,关键在于找到一个既能稳定存储信息(非易失性),又能像生物突触那样进行精细、连续调控(模拟特性)的电子元件。
传统的数字存储器,比如闪存,只有“0”和“1”两种状态,显然无法胜任。而许多新兴的非易失性存储器,如相变存储器(PCM)和丝状电阻式随机存取存储器(Filamentary RRAM),虽然能实现多态存储,但其电导变化往往是非对称且突变的——一个方向可以慢慢调,另一个方向却容易“跳变”,这就像你试图用一把刻度不均匀的尺子去画精细的素描,很难实现精准的权重更新,尤其是在需要反向传播算法进行训练的深度神经网络中。
这时,基于钙钛矿氧化物材料(如 Pr₀.₇Ca₀.₃MnO₃,简称PCMO)的非丝状RRAM进入了我们的视野。它的核心魅力在于其双向、渐变的模拟开关特性。其原理不是靠形成和断裂一根局部的导电细丝,而是通过电场驱动氧离子在整个电极界面附近进行迁移,从而均匀地改变整个器件区域的电阻。这种机制天生就适合做“模拟突触”,因为电导可以随着施加的电压脉冲次数或幅度平滑地增加或减少。
然而,理想很丰满,现实却遇到了两个具体的“拦路虎”:电导对比度和状态稳定性。早期采用钼(Mo)作为顶电极的Mo/PCMO器件,虽然稳定性不错,但高阻态和低阻态之间的电导差异(即开关比)太小,动态范围有限,这限制了它能表达的权重精度。而改用更活泼的铝(Al)作为电极的Al/PCMO器件,虽然获得了很高的开关比,但低阻态(LRS)却像沙堡一样不稳定,电导会随着时间自发衰减,这对于需要长时间保持权重值的神经网络训练来说是致命的。
问题的根源在于界面。铝太容易氧化了,即便没有外加电场,它也会自发地与PCMO中的氧发生反应,导致界面状态漂移。我们需要的,是一个既能“缓冲”剧烈氧化还原反应、又能保持高开关比的解决方案。这就引出了本文的核心:通过引入超薄的MoOx界面层,构建Al/Mo/PCMO复合结构,在电极和功能层之间建立一个可控的“氧离子缓冲池”。这个设计思路,正是典型的界面工程思维——当材料本身性能遇到瓶颈时,在界面上做文章往往是破局的关键。
2. 核心原理与设计思路:理解“氧离子迁移”与界面调控
要理解为什么Al/Mo/PCMO结构能解决问题,我们得先深入PCMO基RRAM的开关机理,以及不同电极材料带来的影响。
2.1 PCMO非丝状RRAM的开关机理
PCMO是一种强关联电子体系材料,其电阻率对氧空位的浓度极其敏感。器件通常采用简单的金属-绝缘体-金属(MIM)三明治结构。其开关过程本质上是电场驱动的氧离子(O²⁻)迁移及界面氧化还原反应。
- SET过程(电导增加,对应生物突触的“增强”):当在顶电极施加负电压时,电场驱动氧离子从顶电极/PCMO界面处向体PCMO层迁移。这导致界面处的氧化层被还原(失去氧),同时PCMO体相因获得氧离子而氧空位浓度降低。界面氧化层变薄且PCMO体相导电性增强,两者共同作用使器件整体电阻下降,电导升高。
- RESET过程(电导减小,对应生物突触的“抑制”):当施加正电压时,电场方向反转,氧离子从PCMO体相被拉向顶电极界面。氧离子与电极金属发生氧化反应,形成一层金属氧化物界面层。这层氧化物通常是高阻的,同时PCMO体相因失去氧离子而产生更多氧空位,电阻率增加。两者叠加,器件整体电阻上升,电导降低。
关键在于,这个过程是全域性的,氧离子的迁移发生在整个电极面积下,而非形成局域化细丝。因此,器件的电流与电极面积成正比(如图4(b)所示),这有利于器件按比例缩小和性能均匀性。
2.2 电极材料的选择困境:Mo与Al的权衡
理解了机理,就能看清Mo和Al作为电极的优缺点:
- Mo/PCMO的困境:钼本身比较稳定,其氧化物(MoOx)具有多种价态,且有一定的导电性。这带来了良好的界面稳定性和状态保持特性,因为氧化层不会无限增厚或剧烈变化。但正因为MoOx有一定导电性,它在高阻态时提供的电阻贡献不够大,导致器件的开关比(ON/OFF Ratio)较低,通常只有10倍左右。对于需要高精度权重的神经网络,这个动态范围太小了。
- Al/PCMO的困境:铝非常活泼,其氧化自由能很低,极易与氧结合生成高电阻的Al₂O₃。这使得Al/PCMO器件在RESET后能形成一层高质量的高阻界面层,从而获得极高的开关比(可达100倍甚至更高)。但成也萧何败也萧何,铝的过度活泼导致了** retention(保持特性)问题**。即使在低阻态(SET态),铝电极也会自发地从PCMO中“抽取”氧离子,导致界面氧化层缓慢生长,电导随时间衰减。这对于需要长期保持权重的应用是不可接受的。
2.3 Al/Mo/PCMO的协同设计:引入“氧缓冲层”
我们的解决方案是在活泼的Al和PCMO之间,插入一层仅3-4纳米厚的超薄Mo层。这个设计非常精妙:
Mo层作为氧扩散屏障和缓冲层:这层超薄Mo在沉积和初始操作中会部分氧化,形成一层导电的MoOx层(如图8 TEM图像所示)。这层MoOx扮演了两个角色:
- 物理屏障:它部分阻隔了Al和PCMO的直接接触,降低了铝自发氧化的驱动力和速率。
- 氧离子缓冲池:在RESET(正电压)时,从PCMO迁移来的氧离子会优先与这层MoOx反应,调节其价态和厚度,而不是全部涌向Al形成过厚的Al₂O₃。在SET(负电压)时,氧离子又从这层MoOx中释放回PCMO。MoOx的多价态特性使其能够可逆地容纳和释放一定量的氧离子,从而稳定了整个氧化还原反应的动力学过程。
Al电极提供高开关比:由于MoOx层很薄且导电,它不会显著削弱Al电极在完全氧化时形成的高阻态(HRS)。因此,器件依然能利用Al/Al₂O₃之间巨大的电阻差异,维持高的开关比。
协同效应:最终,Al/Mo/PCMO结构结合了二者的优点。MoOx缓冲层提高了界面稳定性,改善了状态保持特性(尤其是低阻态的稳定性),而Al电极则确保了足够高的电导对比度。能量色散X射线光谱(EDS)分析(图8)证实,在开关过程中,Mo和Al层都参与了反应,共同决定了器件的最终性能。
注意:界面层的厚度是关键。太薄起不到缓冲作用;太厚则会引入过大串联电阻,影响器件性能,并可能使开关机制发生变化。实验中3-4nm是一个经验优化的结果。
3. 器件制备与关键电学特性验证
理论需要实验的验证。下面我们拆解一下Al/Mo/PCMO器件的制备流程,并深入分析其核心电学性能数据,看看这个设计是否真的达到了预期目标。
3.1 器件制备工艺要点
制备流程基于标准的半导体微加工工艺,核心在于多层薄膜的沉积与图形化:
- 衬底与底电极:通常在硅片上生长氧化层,然后沉积并图形化铂(Pt)作为底电极。Pt化学性质稳定,是理想的底电极材料。
- PCMO功能层沉积:采用磁控溅射法在Pt电极上沉积一层多晶PCMO薄膜。溅射工艺可以较好地控制薄膜的化学计量比和结晶质量,这对可重复的电阻开关行为至关重要。
- 介质层隔离与通孔定义:在PCMO上沉积一层氮化硅(SiNx)作为钝化和隔离层。然后通过反应离子刻蚀(RIE)在SiNx层上刻蚀出不同直径(从150 nm到3 μm)的通孔,暴露出下面的PCMO,从而定义出器件的有效面积。
- 顶电极堆叠沉积:这是最关键的一步。通过物理气相沉积(PVD)依次向通孔内溅射:
- 超薄Mo层:厚度严格控制为3-4 nm。这个厚度需要足够薄以不影响整体电阻,又要连续成膜以确保功能。
- Al层:厚度约10 nm,作为主要的反应电极。
- Pt盖帽层:厚度约80 nm,用于防止上方的Al在后续工艺或环境中被氧化,并提供良好的测试接触。
- 顶电极图形化:通过光刻和刻蚀工艺将顶电极Pt/Al/Mo堆叠图形化为所需的电极形状(如圆形或方形点电极)。
整个工艺的关键控制点在于界面清洁度和超薄Mo层的厚度均匀性。任何污染或厚度不均都会导致器件性能的巨大波动。
3.2 直流I-V特性与开关行为
使用半导体参数分析仪(如Agilent B1500A)对器件进行测试。图7展示了不同电极结构器件的典型直流I-V曲线。
- 双向开关与模拟特性:Al/Mo/PCMO器件展示了清晰的双向、非易失性电阻开关行为。电压从0开始正向扫描时,电流逐渐减小(RESET,电导降低);反向扫描时,电流逐渐增大(SET,电导增加)。曲线呈连续的类“八字形”,没有突变的跳变点,这证明了其模拟(连续多态)特性,而非数字式的“0/1”翻转。
- 与对比器件的差异:与Mo/PCMO器件相比,Al/Mo/PCMO的SET电流更低,这是因为部分电压降在了新形成的界面氧化层上。与Al/PCMO相比,其开关曲线更加对称和稳定。
3.3 性能提升的核心证据:开关比与保持特性
图9的数据直观地展示了Al/Mo/PCMO结构的优势:
- 开关比(ON/OFF Ratio):图9(a)对比了三种器件的电导开关比(低阻态电导G_LRS / 高阻态电导G_HRS)。Al/PCMO最高,Mo/PCMO最低,而Al/Mo/PCMO介于两者之间,但显著高于Mo/PCMO。这意味着我们通过折中,用一部分开关比换来了更重要的稳定性,但最终获得的开关比仍然足够高(通常>50倍),能满足神经网络权重表达的需求。
- 保持特性(Retention):图9(b)和11是更重要的证据。它显示了器件在设定到某个电导状态后,该状态随时间(尤其是在高温下)的保持能力。
- Al/PCMO在低阻态(LRS)下电导衰减非常快,几秒或几分钟内就漂移严重。
- Mo/PCMO和Al/Mo/PCMO都表现出优异的保持特性,在长时间(10^4秒以上)和高温(120°C)下电导状态基本不变。
- 这直接证明了MoOx缓冲层有效抑制了Al电极的自发氧化,解决了Al/PCMO最致命的稳定性问题。
3.4 脉冲响应:模拟突触行为的直接体现
对于神经形态计算,器件对离散电压脉冲的响应比直流扫描更重要。我们使用一系列相同幅度和宽度的脉冲来测试器件的“学习”行为。
- 电导渐变调控:如图13和14所示,对新鲜的Al/Mo/PCMO器件施加一系列负电压脉冲(如-4V),其电导会随着脉冲个数逐渐、连续地增加(Potentiation,增强)。反之,施加正电压脉冲,电导会逐渐、连续地减小(Depression,抑制)。这正是生物突触“长时程增强(LTP)”和“长时程抑制(LTD)”的电子版体现。
- 非线性与饱和:可以观察到,电导的变化并不是线性的。初始的几个脉冲变化幅度大,后续脉冲的变化幅度逐渐减小,最终趋于饱和。这种非线性是离子迁移机制的固有特性,也是神经网络训练算法需要克服或利用的挑战。
- “老化”效应:图15展示了一个重要现象:经过大量循环(“extensively-exercised”)的器件,其电导动态范围(最大电导与最小电导之差)会比全新器件(图14)有所缩小。这类似于器件的“磨损”,是评估器件耐久性(Endurance)的重要指标。在实际应用中,需要确保这种动态范围的损失是有限的,并且在一个可接受的循环次数内保持稳定。
4. “跳变表”测量:为精准神经网络仿真铺路
在实验室里看到器件有模拟特性是一回事,但要把它用到实际的神经网络硬件中,又是另一回事。芯片设计者和算法工程师需要一个能够精确预测器件在任意状态下,受到一个编程脉冲后其电导将如何变化的模型。传统的做法是用一个数学公式去拟合图13、14中的中值曲线。但这个方法有两个致命缺陷:1) 拟合公式往往无法精确描述复杂的器件响应;2)完全忽略了器件行为的随机性(波动性)。在实际的阵列中,每个器件由于微观结构的细微差异,其响应都不会完全一样,这种随机性会严重影响神经网络训练的精度。
为此,我们引入并测量了“跳变表”(Jump-table),这是一种更强大、更真实的器件行为描述工具。
4.1 什么是跳变表?
跳变表本质上是一个条件概率查找表。它回答的问题是:“对于一个当前电导值为G的器件,施加一个特定的SET(或RESET)脉冲后,它的电导变化量ΔG的统计分布是怎样的?”
具体构建方法如下:
- 选取一个固定的编程脉冲条件(例如,SET脉冲:-4.0V, 10ms;RESET脉冲:3.5V, 10ms)。
- 在一个器件(或一批器件)上,施加成千上万次这样的脉冲,并记录每次脉冲前后的电导值。
- 将所有数据点按照**脉冲前的电导值(G)**进行分组。
- 在每个电导区间内,统计电导变化量(ΔG)的累积分布函数(CDF)。
最终,我们得到两张表:一张用于SET,一张用于RESET。表中的每个“格子”对应一个特定的初始电导G,格子里的颜色(或数值)表示发生小于某个ΔG的概率。图17展示的就是从实测数据中构建出的跳变表。
4.2 跳变表的价值与洞察
捕获随机性:跳变表最大的优势是能完整描述器件响应的统计分布,而不仅仅是中值。在进行大规模神经网络仿真时,我们可以通过查询跳变表并引入随机数,来模拟每个“突触”器件独特的、带有噪声的更新行为,从而使仿真结果无限接近真实硬件。
揭示内在状态:分析构建跳变表的原始数据(图18)时,我们发现了一个有趣的现象:器件对下一个脉冲的响应,不仅取决于当前的绝对电导值G,还强烈依赖于自上次极性反转以来,已经施加了多少个同极性脉冲。
- 例如,一个刚从RESET(正脉冲)转为SET(负脉冲)的器件,即使它的电导值和另一个已经连续吃了很多个SET脉冲的器件相同,它对下一个SET脉冲的响应也会大不相同。新反转的器件响应通常更剧烈。
- 这表明,绝对电导值G并不能完全描述器件的内部状态。内部状态可能��与界面氧化层的厚度、氧离子的浓度梯度分布等有关。这为未来的器件物理建模提供了重要线索。目前,在跳变表模型中,我们将这种无法由G预测的响应变化视为随机变量来处理。
指导算法与电路设计:从跳变表(图17)中可以清晰看到,在电导范围的极端值(很低或很高),SET或RESET脉冲会导致非常大的电导跳变。同时,在中间电导区域,RESET脉冲引起的平均跳变量通常大于SET脉冲。这种非对称性和非线性是器件固有的。神经网络训练算法(如反向传播)必须考虑到这些特性,或许需要通过设计特殊的脉冲序列或采用“测量-再编程”的策略来补偿,否则训练精度会大打折扣。这正是本论文第二部分(配套文章)用这些跳变表进行大规模网络仿真所要研究的核心问题。
5. 开关能量与器件缩放路径分析
对于旨在实现高能效计算的神经形态硬件,器件的编程能量是至关重要的指标。我们最终希望的是在极低的能量下完成一次突触权重的更新。
5.1 开关能量的测量与面积依赖性
我们通过积分单个编程脉冲期间的电压和电流波形,直接测量了每次开关操作所消耗的能量。图19展示了关键发现:
- 能量与电导状态相关:开关能量随着器件电导状态的升高而增加。并且,SET过程(负电压,电导增加)的能量通常高于RESET过程(正电压,电导减小)。这源于氧化和还原反应本身的不对称性能垒。
- 面积缩放特性:如图19(b)所示,当把开关能量除以器件的有效面积(得到能量密度)后,不同尺寸器件(150nm, 200nm, 500nm, 1μm)的数据点大致落在同一条趋势线上。这强有力地证明了Al/Mo/PCMO的开关是全域性的,而非局域化的细丝机制。其开关电流和能量与器件面积成正比,这是实现器件按比例缩小的良好基础。
5.2 通往飞焦耳级能量的挑战与路径
目前,对于一个150nm尺寸的器件,施加一个10ms长的脉冲进行编程,其开关能量在皮焦耳(pJ, 10^-12 J)量级。然而,对于大规模并行更新的神经形态系统,我们的目标是飞焦耳(fJ, 10^-15 J)量级。如何实现三个数量级的能量降低?路径是清晰的,但充满挑战:
- 缩小器件尺寸(Scaling Down):从150nm缩小到更先进的工艺节点(如25nm),根据面积缩放趋势,预计能将开关能量降低约35倍。这是最直接的途径。
- 缩短脉冲宽度(Speeding Up):将编程脉冲时间从10ms(毫秒级)缩短到10ns(纳秒级),理论上能再降低约6个数量级的能量(因为能量 ≈ 电压 × 电流 × 时间)。这是最具挑战性的一步。
然而,这里存在一个根本性的权衡(Trade-off):氧离子的迁移是一个相对缓慢的离子运动过程。要在一个短得多的脉冲(10ns vs. 10ms)内驱动相同数量的氧离子移动,从而产生相同的电导变化量,根据动力学公式,很可能需要大幅提高编程电压。更高的电压意味着:
- 单次脉冲能量可能不会按比例下降:虽然时间短了,但电压和电流可能升高。
- 可靠性风险:过高的电压会增加器件发生永久性击穿(Breakdown)的风险,严重影响耐久性和良率。
- 电路设计难度:产生和控制纳秒级的高压脉冲,对周边CMOS驱动电路提出了极高要求。
因此,未来的材料研究可能需要探索新的方向:例如,寻找离子迁移势垒更低的PCMO类似物,或者进一步优化Al/MoOx界面,在保持良好保持特性的同时,提升其开关速度。或许需要在材料特性上做出一些折中,用一部分 retention 性能来换取更快的开关速度。
6. 总结与未来展望
通过这项研究,我们成功演示了如何通过界面工程——在Al电极和PCMO之间插入超薄MoOx缓冲层——来协同优化非丝状RRAM的关键性能。Al/Mo/PCMO器件在高电导开关比和优异的电导状态保持特性之间取得了良好的平衡,基本满足了作为模拟突触器件的核心材料要求。
我们系统地表征了其双向、渐变的模拟开关特性,并首次为这类器件构建了详尽的“跳变表”,为后续进行包含器件随机性的大规模、高保真神经网络仿真奠定了坚实基础。这些跳变表揭示出器件内部状态比简单的电导值更为复杂,这指引着未来需要建立更精细的物理模型。
开关能量的测量指明了实现超低功耗神经形态硬件的路径:持续缩小器件尺寸和努力缩短编程脉冲时间。但后者面临着电压与速度、可靠性的深刻矛盾,需要材料、器件和电路设计的共同创新。
从我个人的实验经验来看,有几点实操心得值得分享:
- 界面层的质量控制是重中之重:那层3-4nm的MoOx,其厚度、均匀性和氧化状态的重现性,直接决定了器件性能的均匀性。在工艺上,需要极其精密的沉积速率控制和良好的腔体真空度。
- “老化”或“成型”操作的必要性:新鲜的Al/Mo/PCMO器件通常需要经过几十到上百个初始化的开关循环,其性能(如动态范围、非线性度)才会稳定下来。在测试和评估前,进行一个标准的“老化”流程是获得可重复数据的关键。
- 测试中的延迟效应:在测量脉冲响应时,读脉冲和写脉冲之间的延迟时间需要仔细考虑。如图10所示,对于稳定性差的器件,延迟时间越长,电导弛豫越明显。在构建跳变表或评估用于实时训练的器件时,应采用与实际应用场景匹配的时序进行测量。
未来的工作将沿着几个方向深入:一是探索更快的编程机制,在纳秒脉冲下能否实现有效的电导调控;二是深入研究器件“老化”后动态范围缩小的根本原因,这是决定器件耐久性寿命的关键;三是将基于跳变表的仿真与更复杂的神经网络训练任务结合,量化器件非理想特性对最终系统精度的影响,从而为器件-电路-算法的协同设计提供精确的指导规范。这条从材料创新到系统应用的路径,正是构建下一代人工智能硬件的核心。