
随着人工智能快速重塑各个行业,我们有必要思考:推动这种变革的核心框架是什么,它们需要什么来运行?
从根本上说,这些系统需要计算能力。它们需要特定类型的计算能力,因此需要特定类型的硬件。我们可以大谈这些系统的数字能力,在专家聚集的会议和活动中我们确实这样做,但社区也有责任更好地理解AI模型的实际物理"大脑"。我们的大脑由生物"灰质"构成,而它们的大脑由硅制成。
GeeksforGeeks这样解释AI硬件的作用:
"AI处理器中的并行处理使大语言模型能够加速神经网络操作,让聊天机器人和生成式AI等应用变得更加高效。如果使用通用处理器(如CPU或早期AI芯片)进行这种训练,时间会更长,成本会高出几个数量级。因此,保持在研究和部署前沿是不可能的。"
除此之外,各种先进的逻辑门控、计算协同定位和复杂工程设计让开发者能够在大语言模型系统中融入越来越多的功能。
市场反应
英伟达在过去一年内超越苹果和微软,成为美国科技市场之王,这绝非偶然。该公司在AI硬件革命前沿建立了自己的地位。最近,高通宣布计划与AI芯片生产领域的领跑者竞争,该公司股价上涨了11%。
因此,市场确实认识到AI专用硬件对明天世界的核心重要性。地缘政治界也是如此,台积电几十年来一直掌控着主导权,向世界各地的公司分发晶圆代工生产成果。
专家观点
我听了最近一场专题讨论,福布斯的兰德尔·福布斯采访了四位在芯片设计、瓶颈、机遇和AI芯片未来预测方面经验丰富的创新者。
兰恩提出了一个非常有用的问题:鉴于区块链技术也需要大量计算,创新者如何利用区块链时代的经验来开发AI基础设施?
注意:要回答这个问题,你必须从事这个行业一段时间了。
Auradine公司的拉吉夫·凯马尼这样解释他们公司的核心设计:
"功耗是电压平方的函数,还包括电容和开关等其他因素,"他说。"我们在接近阈值电压下运行这些芯片。典型的AI芯片运行电压约为0.75伏特。我们实际上在低于0.3伏特下运行,所以我们获得了电压平方的优势。现在...这很难做到,因为会有良率问题、可靠性问题,而且频率会急剧下降。唯一的方法是通过定制电路设计。"
这是他们关注的重点之一。
"我们构建自己的库,为此构建算术库,"凯马尼补充道。"我们与代工厂密切合作,并将其应用于AI。"
Cognichip公司的法拉吉·阿拉埃简单地描述了半导体发展的问题。
"芯片设计时间太长,成本太高,"他说,并指出过去大约有200家初创公司从事芯片工作,现在每年只有个位数。那么该怎么办?
"我们在这里要做的是缩短时间,并使其民主化,"阿拉埃说。"所以我们正在开发一个...基础模型,并将其与软件开发能力结合,就像人们在软件行业谈论的那样。"
他补充说,人们在软件行业谈论的是振动编码。
"你不能对芯片进行振动编码,"他指出。"所以我们需要创造一些非常相似但适用于芯片设计师的东西。因此,如果你愿意的话,这是Anthropic构建的东西与专注于垂直半导体领域的交集,也是Cursor为芯片设计师构建的东西。我们希望能够以这种方式带来价值。"
对于Frore Systems公司的专家塞舒·马达瓦佩迪来说,一切都与散热有关。
"如果你没有非常有效的散热方式,那么你就无法真正让数据中心在那种性能水平下运行,"他说。"这个问题不仅存在于数据中心,也存在于边缘。如果你拿任何消费设备,它们都有一定的性能,而这通常取决于你能从设备中实际散发多少热量。"
这促使他的公司研究解决散热问题。
"我们发现,在冷却边缘设备以及数据中心设备方面,有很大的机会引入新思维,"马达瓦佩迪说。"我们公司的所有人都来自硅背景、半导体背景。所以我们实际上看到了半导体行业如何完全改变了格局,在创新速度以及制造流程和技术方面。"
他这样总结自己的叙述:
"我们公司正在引入新思维,创造令人难以置信的颠覆性新技术,但改善边缘和数据中心的冷却。"
至于迪内什·马赫什瓦里,他是多家公司的顾问,也是Groq公司的前首席技术官,他认为有很多改变需要做。
"计算范式是过时的,"他说,建议利益相关者需要最小化开销并改善内存带宽。
市场格局
在讨论所有这些建议的背景时,专家组谈到了市场进入、认同度、需求和供应,以及英伟达在这个领域的主导地位。
"当你看芯片行业时,英伟达作为初创公司进入时,已经有人在做图形芯片,英特尔仍然是丛林之王,对吧?"阿拉埃说。"他们找到了创造那种不连续性的方法。如果你回顾过去,我想说,自2015年以来我一直在关注英伟达,这不是偶然发生的。他们对GPU能做什么以及未来会怎样有一个思考过程。作为一家上市公司,他们在这方面投入了大量资金,他们有勇气去做并坚持到这种地步。但我认为英伟达在训练方面的主导地位将很难被击败,所以我不建议那里的任何初创公司试图取代他们。"
展望未来
最后,兰恩要求每位专家谈论摩尔定律的连续性,这个定律发展于1970年代,认为电路中的晶体管数量每年都会翻倍。
"我从事这个行业40多年了,对你们其他人来说,这意味着我从幼儿园就开始了,"阿拉埃说,指出变化的持续性。"我一直认为,无论我在什么领域,'这就是终点了。'然后,当然,有创新,对吧,持续进行。"
他认为,未来属于更敏捷、更通用、开销要求更少的定制芯片。
"我认为人们需要更快地制造芯片,因此当你能够制造最定制的、低功耗的、更直接针对重点的芯片时,我认为这就是发展方向,"他说。
"摩尔定律的放缓将通过我提到的封装,以及其他类型的计算单元(例如光学)来补偿,"马赫什瓦里说。"摩尔定律是为固定架构范式或固定封装推动事物的暴力方式。它迫使我们看其他维度,有足够的创新空间。"
"摩尔定律并没有放缓,因为你仍然能够在相同的芯片面积内封装两倍于每两年的晶体管数量,"马达瓦佩迪说。"你可以继续。但改变的是你没有获得功耗产出。所以...你可以封装两倍数量的晶体管,但现在它们消耗两倍的功率。以前不是这样的。"
他介绍了一些解决这个问题的想法。
"如何确保你能继续提供更高的性能?"马达瓦佩迪问道。"通过在通用解决方案中创新,使所有由额外功耗产生的额外热量都能有效散发,而不会影响密度。"
"我们已经进行了小芯片接口标准化以扩展...并构建越来越大的芯片来解决我们看到的一些挑战,"凯马尼补充道。"冷却是另一个方面,正如人们所知,我们已经从通用计算转向加速计算,然后针对特定应用的加速是前进的方向,软件必须调整以利用所有这些优势。"
所有这些都向我们展示了人们在幕后的想法,因为我们正朝着硬件和其他一切的又一个突破性年份前进。请继续关注。
Q&A
Q1:AI芯片与普通芯片有什么区别?
A:AI芯片专门为并行处理设计,能够加速神经网络操作,使大语言模型和生成式AI应用更加高效。如果使用通用处理器如CPU进行AI训练,时间会更长,成本会高出几个数量级。
Q2:英伟达为什么能在AI芯片市场占据主导地位?
A:英伟达从2015年开始就有明确的思考过程,知道GPU能做什么以及未来会怎样。作为上市公司,他们投入了大量资金进行研发,有勇气坚持到现在这种地步。他们在AI硬件革命前沿建立了自己的地位。
Q3:摩尔定律在AI时代还适用吗?
A:摩尔定律并未完全失效,晶体管密度仍在增加,但问题是功耗也成倍增长。未来需要通过创新的封装技术、光学计算单元、更好的散热解决方案和针对特定应用的定制芯片来解决这些挑战。