91书院(91shuyuan.com)更新快,无弹窗!
天权6号功耗曲线优化攻关启动会定在早上八点,但张京京七点不到就已经坐在中央研究院四号会议室的角落里,面前摊着三份厚度不一的仿真报告。她的多时钟域方案在RTL冻结前通过了全部时序收敛签核,影子寄存器组异步交换路径在最差工艺角下的延迟压缩到了0.08纳秒,比设计预期还优了0.02纳秒。但功耗闭环验证中暴露的第三个泄漏源——异构互联总线瞬时电流尖峰被仿真平滑——并没有随着RTL冻结而自动消失。它只是被小芯AI预调度模型暂时压住了,压住不等于根治。
赵静推门进来时手里端着一杯没加糖的黑咖啡,眼下的青灰色比天权6号样片评审时又深了一层。她昨晚跑完了预调度模型在追光四期极限温度数据上的第一轮迁移校准,结果不太好看。
「125度环境温度下,天权4号的总线电流尖峰波形和105度下的波形在峰值区域有非线性的偏移。」赵静把笔记本电脑接上会议室的投屏,调出两组波形的对比图。蓝色曲线是105度下的总线电流波形,红色曲线是125度下的波形,两条曲线在低负载区几乎重合,但在负载从空载跳变到满载的那一瞬间,红色曲线的峰值比蓝色曲线高出了整整12%。「预调度模型的训练数据全部来自天权4号在105度以下的量产测试数据,模型在125度下的预测准确率从91.5%掉到了83.7%。」
本书首发找台湾好书上台湾小说网,t??w??k??a??n??.c??o??m??超方便,提供给你无错章节,无乱序章节的阅读体验
张京京盯着那两条曲线之间拉开的喇叭口,心里默默折算了一组数字。预调度模型的削峰逻辑是在总线事务发起前3.2纳秒预测电流尖峰概率,预测值超过阈值就插入一个等待周期。如果预测准确率在125度下掉到83.7%,意味着每六次高峰值预测中就有一次漏报。漏报一次,瞬时电流尖峰就会从削峰后的43瓦跳回未削峰前的58瓦——那1.3瓦的差额是依靠先进封装散热方案覆盖的,但58瓦的尖峰已经远超封装热阻的承受上限。
章宸在八点整准时推门进来,身后跟着林薇和梁志远。梁志远手里拿着一个金属材质的存储硬碟,里面装着追光四期首批国产化试产晶圆的全部工艺数据,以及一套刚从天权4号量产批次中抽取的极限温度测试记录。这套记录是张京京在样片评审时要求的「补课」内容——天权4号原本的规格上限是105度,但为了给天权6号预调度模型提供125度下的真实总线电流数据,追光四期测试团队在过去一周里对二十颗天权4号晶片做了从负40度到125度的全温度梯度扫描。
「二十颗晶片的实测数据全部在这里。」梁志远把硬碟接上会议室的终端,屏幕上跳出一张三维散点图。X轴是温度,从负40度到125度;Y轴是负载档位,从空载到满载八个档;Z轴是总线电流峰值。散点图的颜色从低温区的深蓝渐变到高温区的深红,在125度满载那个角上,散点密集地聚成一个偏离整体趋势的小簇。「这个簇就是非线性区。105度以下,电流峰值和温度的关系基本是线性的,预调度模型用线性外推就能大致覆盖。但从115度往上,峰值和温度的关系开始出现明显的非线性偏离。到了125度,偏差量已经大到不能忽略。」
林薇从梁志远手里接过雷射笔,在散点图的非线性区画了一个圈。「这不是天权4号的个例,也不是羲和架构的特有问题。根本原因在电晶体的阈值电压温度系数上——温度每升高十度,阈值电压下降大约二十毫伏,高温下电晶体更容易导通,关断时的漏电流呈指数级上升。我们在功耗仿真时用的是代工厂标准工艺设计套件里的温度系数模型,那个模型的适用范围标注到了125度,但实际精度在115度以上就已经开始发散。」
「仿真方法论的问题。」张京京说。这句话她在天权6号热功耗攻坚时就说过一次,当时是针对林薇揭示的「用平均功耗代替峰值功耗」的缺陷。现在同样的问题出现在了温度维度上——仿真模型把温度对功耗的影响简化成了一个线性系数,但实际的物理过程在极端温度下是高度非线性的。
赵静把预调度模型的架构图投到屏幕上,开始拆解问题的技术根因。小芯AI预调度模型的本质是一个轻量级神经网络,输入是总线事务队列的长度丶类型丶发起频率和当前温度四个特徵,输出是一个二分类预测——接下来3.2纳秒内是否会出现超过阈值的电流尖峰。模型在天权4号105度以下的数据上训练后,预测准确率达到94%,迁移到天权6号仿真环境后准确率降到91.5%。现在加上125度下的实测数据,准确率进一步降到83.7%。
「下降的原因分两层。」赵静用雷射笔点着模型的特徵重要性排序图,「第一层是温度特徵在高温区的非线性变化,模型