完全自动驾驶？特斯拉的芯片究竟多强

&#12288;&#12288;近日，马斯克在推特上透露，由于特斯拉V10.0系统和Smart Summon(智能召唤)功能已

　　近日，马斯克在推特上透露，由于特斯拉V10.0系统和Smart Summon(智能召唤)功能已发布，特斯拉全自动驾驶系统(Full Self-Driving，FSD)的价格将于11月1日起上调1000美元。

　　特斯拉的这颗芯片，是一种特殊类型的 AI 处理器，可以支持人工神经网络（ANN），也就是我们常听到的机器学习（ML）或深度学习（DL）。

　　需要指出的是，特斯拉定制开发的这颗 AI 芯片并不意味着特斯拉在 AI 领域取得了反转一切的能力。至于全自动驾驶在现实世界的解决方案，特斯拉也只是刚刚入门。

　　AI 芯片的背景

　　传统的计算机需要 CPU（中央处理器）来执行系统工作，比如加载应用程序。除此之外，大部分现代计算机还要有 GPU（图形芯片）来支撑，它的工作是协助核心处理器完成图形和动画的渲染，让用户能在屏幕上获取有效信息。

　　在机器学习或深度学习上，除了 CPU，GPU 的角色也突然重要了起来。总得来说，GPU 从配角变主角，主要还是因为 ANN（人工神经网络）是个庞大的数值和线性代数问题，而它就是为这样的数字混合而生的。

　　对开发者来说，GPU 简直是上天的恩赐，谁也没想到它能在 ML/DL 领域发挥如此巨大的功效。GPU 的隐藏属性「暴露」后，芯片开发者们开始为潜在的市场扩军备战，就连 GPU 的设计都开始为 ML/DL 任务倾斜。

　　在 FSD 芯片诞生前，特斯拉一直是拿来主义者，它最早与 Mobileye 合作，后又转向英伟达。现在，特斯拉则希望将命运攥在自己手中，用自研的这颗芯片为 Autopilot 撑起一片天地。

　　在今年 4 月份的 Autonomy Day 大会上，特斯拉祭出了大杀器——FSD 芯片。这背后传达的信息很清晰：就是要用自行研发的技术替代现有的英伟达芯片。

　　四个多月后，特斯拉工程师们又在 Hot Chips 大会（IEEE 主办，专注于高性能处理器）上对芯片的一些关键组件提供了更多的解析。这次深度解析也让外界对特斯拉的 FSD 芯片重燃兴趣。

　　需要注意的是，在大多数人眼里，这种处理器可统称为 AI 芯片。这样叫也不为过，但也别对它有太高的期待——AI 芯片目前还无法在预期领域实现全知全能的人工智能。

　　简单来理解的话，这些芯片根本没有任何类人的推理或常识能力，它只是能力暴增的数值计算设备罢了。

　　3.0 硬件的秘密

　　特斯拉官方表示，图像数据处理的流程首先从摄像头的高速数据传输开始——高速指的是25 亿像素/秒，大概是往 21 块 1080P 的全高清屏幕塞 60 帧画面的程度。这个数据传输速度比特斯拉车型现有的8颗摄像头可以产生的数据量多了不止一个维度。

　　如此高的传输速度现在还用不上——因为 FSD 芯片内置的图像处理器ISP最高「只能」处理 10 亿像素的数据量，也就是 8 块 1080P 屏幕每秒 60 帧的程度——这已经追上现在世界上最快的消费级图像传输标准 DisplayPort 1.4 了，而车载芯片「传统上」是要落后消费级起码一个时代的。

　　图像处理器 ISP 的作用主要是将摄像头产生的原始 RGB 三原色数据转化成复杂的图像信息，这些信息的下一站是神经处理单元 NPU，NPU 会根据深度学习模型对图像数据作出处理——但在此之前，这些数据将会存储在 SRAM 内。

　　那什么是 SRAM？

　　SRAM 一般被应用在处理芯片的 1-3 级缓存上，你可以简单地将它理解为比运行内存速度快很多，同时成本也高很多的存储芯片。有多快？特斯拉芯片总工程师 Pete Bannon 表示，处理全自动驾驶的缓存带宽至少要达到 1TB/秒，而 FSD 芯片的 SRAM 实际上能提供 2TB/秒的带宽。

　　那32MB 的缓存又是什么概念？做一个不是十分准确但足够形象的比较，零售价 16999 元的英特尔酷睿 i9-9980XE，SRAM 缓存总量也仅为33.75MB。另一个细节是，2010 年英特尔CPU的最大 SRAM 仅为16MB，2014 年也只是增长到了 24MB。

　　SRAM 的价格之高，特斯拉 SRAM 规格之激进，相信大家也能管中窥豹——而 Pete Bannon 在发布会上也将巨大的 SRAM 容量总结为 FSD 芯片对比市场上同类芯片的最大的优势。

　　芯片内部的所有数据都在浅蓝色标注的主通道上传输，或者叫NOC（Network on Chip），然后才会经过总带宽为 68GB/s的LPDDR4 运行内存——所以特斯拉目前的传感器数据产生量大概率不会超过 68GB/s，甚至不会超过 34GB/s，当然这也已经是一个很吓人的数字了——但内存带宽可能还是自动驾驶的瓶颈。

　　NPU 是 FSD 芯片里面的真正大杀器。但总有一些其他方面的数据处理是NPU 无法完成的，这时候就需要 CPU 和 GPU 共同参与。

　　FSD 芯片内置了主频为 1GHZ 的 GPU，拥有 600TOPS 的运算能力。特斯拉的表述是 GPU 主要负责一些后处理的任务，比如说描绘人类能看得懂的界面和图形——也就是说 2.X 时代特斯拉自动驾驶硬件的 AB 面设计将会大概率被取消。总的来说，按照特斯拉在发布会上对 GPU 的描述，以后的 FSD 芯片里面，GPU 的地位将会被继续削弱。

　　除此之外，一些通用数据只能交给 CPU 处理，特斯拉采用的是 12 个 64 位 ARM Cortex A72 内核，运行频率为 2.2GHZ——准确点说应该是三个四核 CPU 的并联架构。

　　特斯拉对于 CPU 架构的选择有点让人摸不着头脑，因为 A72 是 ARM 在 2015 年推出的架构（虽然 2016 年才正式商用），往后可用的架构包括 A73 和 A75（A76 和 A77 是 2018/2019 年发布的）。

　　不过考虑到 FSD 芯片的研发是从 2016 年开始的，采用再前一年的架构也很正常。因为老架构更便宜，而多个核心叠加的方式也保证了多线程总性能不比如今顶级的 4 核心移动端 CPU 弱，甚至尤有胜之——硬件 3.0 的 CPU 性能是硬件 2.5 的 2.5 倍。

　　马斯克的勇气

　　许多人对马斯克的勇气大加赞赏，认为特斯拉敢走出这样一条路确实值得尊敬。

　　不过，从商业角度来看，这样的选择明智吗？对于车主而言，花大价钱选装真的有那么多的实际意义吗？

免责声明：本站登载此文仅出于信息分享，并不意味着赞同其观点及其描述，不承担侵权行为的连带责任。如涉及版权等问题，请与我们联系（联系QQ：26887486），我们将及时删除处理。
本文链接：https://www.yunlianauto.com/article/10/9417.html

相关文章阅读