9月25日云栖大会上,阿里巴巴第一颗自研芯片,“全球最高功能AI推理芯片”含光800发布。
阿里巴巴平头哥半导体公司研究员、含光800芯片负责人骄旸表明,现在芯片现已在和事务方去做适配了,“期望年末左右能够落地”。他还表明,因为方针定得很高,“咱们团队做出了十分十分大的献身。”
含光800的研制速度令人瞩目。据平头哥介绍,平头哥NPU团队用最短的时刻完结了芯片的规划、流片整个进程,7个月完结前端规划,之后仅了3个月就成功流片。骄旸表明,流片仅一次就获得了成功。
在一场媒体群访中,骄旸对记者介绍,“这个NPU咱们团队花了差不多一年的时刻,从团队组成,到规划完结、架构验证,到咱们流片回来,是一次成功。流片回来后就通过了验证。”
芯片规划是一个杂乱的系统工程,单纯完结规划并不意味着就能够流片成功,这是职业的深水区,假设流片失利,就意味着硬件规划需求推倒重来,这比软件出BUG愈加严峻。
一般芯片公司需求做两次工程样品、产品样品或屡次样品才能流片成功。而流片成功后也不代表就能够直接商用,它还需求通过杂乱的测试验证,在各项方针都符合实际场景需求后才到了真实的商用阶段。
针对汹涌新闻记者的问询,骄旸表明,其实这种速度下,保证质量是“十分难的”,他弥补道,“咱们团队做出了十分十分大的献身,好在团队的工作经验是比较丰富的。”
骄旸还说到,“因为定下了一个比较高的方针,咱们乃至有的团队成员第一天参加,当天晚上就去debug(扫除程序毛病)了。”
据平头哥介绍,含光800首要用于云端视觉处理场景,现在已开端应用在阿里巴巴内部中心事务中。
依据云栖大会的现场演示,1个含光800的算力等于10个GPU。以城市大脑中实时处理杭州主城区交通视频为例,需求40颗传统GPU,延时为300ms,运用含光800仅需4颗,延时降至150ms。拍立淘产品库每天新增10亿产品图片,运用传统GPU算力辨认需求1小时,运用含光800后可缩减至5分钟。
有网络说法称,含光800芯片第一次流片时,一群工程师忐忑地在电梯口等成果,当得知流片成功时,有工程师哭了出来。
骄旸介绍,为什么要立下这种时刻紧、任务重的方针,除了背面有核算支撑之外,这与为什么平头哥要做AI芯片的战略也有联系。
骄旸说,AI芯片是一个新的范畴,有开展的时机。老的核算渠道如CPU、GPU等,是为老的核算形状规划的。GPU原本是用于视频烘托,在AI核算没有更好的代替计划时,坐落临界点上的GPU便成为了挑选。而一旦有更好的挑选,GPU很快就会被代替。速度便十分重要。
“咱们看到了人工智能算法需求一个特别的架构,”骄旸表明,“尽管应战很大,但从阿里巴巴的要求来说,咱们是必定要去应战那个‘皇冠上的明珠’。”
“含光800现已量产,只服务阿里内部,暂不计划向第三方企业独立出售。”阿里巴巴研究员、平头哥半导体有限公司IoT芯片研究员孟建熠告知汹涌新闻记者,“量产数量暂不便利对外泄漏。”