特斯拉发布D1 AI芯片：500亿晶体管、400W热设计功耗 - OFweek工控网

首页

资讯

视点

采访

专题

新品

产品试用

技术

市场

财经

报告

白皮书

在线研讨会

直播

视频

会展

行业会议

维科号

更多>> 热门搜索：

当前位置： OFweek 工控网 > 电力电子 > 正文

特斯拉发布D1 AI芯片：500亿晶体管、400W热设计功耗

2021-08-23 10:42

近日的特斯拉AI日活动上，特斯拉公布了最新的AI训练芯片“D1”，规模庞大，令人称奇。

该芯片采用台积电7nm工艺制造，核心面积达645平方毫米，仅次于NVIDIA Ampere架构的超级计算核心A100（826平方毫米）、AMD CDNA2架构的下代计算核心Arcturus（750平方毫米左右），集成了多达500亿个晶体管，相当于Intel Ponte Vecchio计算芯片的一半。

其内部走线，长度超过11英里，也就是大约18公里。

它集成了四个64位超标量CPU核心，拥有多达354个训练节点，特别用于8＆times；8乘法，支持FP32、BFP64、CFP8、INT16、INT8等各种数据指令格式，都是AI训练相关的。

特斯拉称，D1芯片的FP32单精度浮点计算性能达22．6TFlops（每秒22．6万亿次），BF16／CFP8计算性能则可达362TFlops（每秒362万亿次）。

为了支撑AI训练的扩展性，它的互连带宽非常惊人，最高可达10TB／s，由多达576个通道组成，每个通道的带宽都有112Gbps。

而实现这一切，热设计功耗仅为400W。

特斯拉发布D1 AI芯片：500亿晶体管、400W热设计功耗

特斯拉D1芯片可通过DIP（Dojo接口处理器）进行互连，25颗组成一个训练单元（Training Tile），而且多个训练单元可以继续互连，单个对外带宽高达36TB／s，每个方向都是9TB／s。

如此庞然大物，耗电量和发热都是相当可怕的，电流达18000A，覆盖一个长方体散热方案，散热能力高达15kW。

特斯拉发布D1 AI芯片：500亿晶体管、400W热设计功耗

特斯拉发布D1 AI芯片：500亿晶体管、400W热设计功耗

特斯拉展示了实验室内部的一个训练单元，运行频率2GHz，计算性能最高9PFlops（每秒9千万亿次）。

特斯拉发布D1 AI芯片：500亿晶体管、400W热设计功耗

特斯拉还用D1芯片，打造了一台AI超级计算机“ExaPOD”，配备120个训练单元、3000颗D1芯片、1062000个训练节点，FP16／CFP8训练性能峰值1．1EFlops（每秒110亿亿次计算）。

建成后，它将是世界上最快的AI超算，对比特斯拉现在基于NVIDIA方案的超算，成本差不多，但拥有4倍的性能、1．3倍的能效比、1／5的体积。

特斯拉发布D1 AI芯片：500亿晶体管、400W热设计功耗

特斯拉发布D1 AI芯片：500亿晶体管、400W热设计功耗

来源：快科技

本地收藏打印推荐给朋友

声明： 本文系OFweek根据授权转载自其它媒体或授权刊载，目的在于信息传递，并不代表本站赞同其观点和对其真实性负责，如有新闻稿件和图片作品的内容、版权以及其它问题的，请联系我们。

发表评论

共0条评论，0人参与

立即登录即可访问所有OFweek服务

忘记密码

其他方式

请输入评论内容...

请输入评论/评论长度6~500个字

暂无评论

暂无评论

图片新闻

行业报告

最新活动更多

一周热点月点击榜

企业服务广告服务猎头服务薪酬报告

工控猎头职位更多

高级软件工程师广东省/深圳市
自动化高级工程师广东省/深圳市
光器件研发工程师福建省/福州市
销售总监（光器件）北京市/海淀区
激光器高级销售经理上海市/虹口区
光器件物理工程师北京市/海淀区
激光研发工程师北京市/昌平区
技术专家广东省/江门市
封装工程师北京市/海淀区
结构工程师广东省/深圳市

文章纠错

x

_*文字标题：

_*纠错内容：

联系邮箱：

_*验证码：

看不清，点击换一张

粤公网安备 44030502002758号