第343章 悟道云端服务的企业级合约

章节报错(免登陆)

91书院(91shuyuan.com)更新快,无弹窗!

笔记本。「许总,你们的方案比我预想的成熟。我今天是带着签约授权来的,如果我们能在数据驻留保证和价格锁定条款上达成一致,今天就可以签。」
    谈判进行了两个小时。最后,双方在数据驻留的具体定义丶价格锁定的期限和范围丶服务等级协议的响应时间丶违约赔偿的计算方式等细节上达成了共识。银行方面承诺首年采购五千万元的算力服务,主要用于风控模型的训练和推理。合同期三年,总金额一亿五千万元。
    这是悟道算力平台第一个企业级合约,也是金额最大的一个。
    送走银行的代表后,第二家客户进入了会议室。这是一家华夏头部的新能源汽车制造商,年产量超过一百万辆,正在全力推进自动驾驶技术的研发。他们的代表是一个三十出头的技术负责人,姓马,穿着公司文化衫,牛仔裤,运动鞋,看起来不像来签约的,倒像来参观的。
    「许总,我们的需求很简单——算力,大量的算力。我们的自动驾驶团队每天要处理超过两百万公里的路测数据,用来训练感知丶决策丶控制三个大模型。目前我们在旧秩序的云上跑了超过一万张GPU卡,每个月的费用超过三千万。这个成本太高了,我们需要降本。」
    许承直接亮出了底牌。
    「悟道算力平台可以给你提供两种方案。方案一,用我们的天权AI加速卡集群,每张卡的算力相当于旧秩序高端卡的一点三倍,价格只有它的百分之六十。同样一万张卡的算力,悟道的成本是旧秩序的百分之四十六。每个月从三千万降到一千四百万,一年省近两亿。」
    「方案二,混合方案。你们的核心模型跑在天权加速卡上,边缘任务跑在国产GPU上。这个方案的性价比更高,但复杂度也更高,需要你们的算法工程师做一些适配工作。」
    马技术负责人听完,没有立刻表态,而是问了一个技术深度的问题。
    「天权AI加速卡的软体栈,支持分布式训练吗?我们的模型参数规模已经超过一千亿,单卡放不下,需要多卡并行。」
    许承调出了悟道算力平台的分布式训练架构图。
    「支持。悟道算力平台内置了分布式训练框架,支持数据并行丶模型并行丶流水线并行三种模式。一千亿参数的模型,我们用两百五十六张天权加速卡,训练时间可以压缩到两周以内。这个性能,和旧秩序的最优方案持平。」
    「另外,我们还有一个独有优势——天权加速卡之间的互联带宽是自研的,每卡三百二十吉字节每秒,比旧秩序的互联快百分之四十。大规模分布式训练的时候,通信瓶颈是我们的优势。」
    马技术负责人的眼睛亮了一下。「互联带宽快百分之四十,这个数据是真的吗?能做现场演示吗?」
    许承笑了笑。「能。我们去实验室,现场跑一个分布式训练的测试给你们看。」
    一行人走进数据中心二楼的实验室,那里有一个小规模的天权加速卡集群,六十四张卡,通过自研的网际网路连接。许承的团队现场启动了一个标准的计算机视觉模型训练,分别在悟道和旧秩序的同等规模集群上跑。十分钟后,结果出来了——悟道的训练速度比旧秩序快了百分之三十七,通信开销低了百分之四十二。
    马技术负责人看着屏幕上的数据,沉默了很久。
    「许总,我要给公司打个电话。」
    他走出实验室,在走廊里打了二十分钟的电话。回来的时候,脸上带着笑容。
     「公司批了。首年采购八千万元的算力服务,主要用于自动驾驶模型的训练。合同期两年,总金额一亿六千万。但我们有一个条件——你们要派一个技术团队常驻我们公司,协助我们的算法工程师完成模型移植。周期不超过八周。」
    许承点头。「可以。天机云的技术支持团队有三十个人,我可以抽调五个人常驻你们公司。八周内完成移植,逾期的话,合同金额打九折。」
    马技术负责人伸出手。「成交。」
    第二份合约签完,已经是下午四点。第三家客户是一家科研机构——华夏科学院的一个国家级实验室,研究方向是气候模拟和气象预测。他们的代表是一个五十多岁的教授,姓吴,头发花白,戴着一副厚厚的眼镜,手里拿着一台老旧的笔记本电脑。
    「许总,我们的需求比较特殊。气候模拟需要的是双精度浮点算力,不是AI训练用的半精度或单精度。天权加速卡的双精度性能怎么样?」
    这个问题,许承让硬体团队的工程师来回答。一个叫小李的年轻人站了出来,调出了天权加速卡的详细规格。
    「吴教授,天权AI加速卡的双精度算力是每秒钟十五万亿次浮点运算,大约是单精度的三十二分之一。这个比例和旧秩序的高端卡差不多。但我们有一款专门为科学计算设计的『天权科学计算版』,双精度算力提升到了
章节报错(免登陆)
验证码: 提交关闭