AI芯片初创公司，前景不妙

IC学习 2023-10-30 904

电子说

1.3w人已加入

描述

近期的一些消息显露出AI芯片初创公司的前景，似乎不太妙！Wave Computing破产关闭的还历历在目，现在，AI芯片领域的初创公司似乎正遭遇前所未有的挑战。在英伟达的“阴影”下，一些潜在的投资者对初创公司望而却步。面对全球经济的不稳定性不断增强，投资者因而变得越发审慎，他们对风险的忍受度显著降低，这进一步增加了AI芯片制造商在筹资时的困难。根据 PitchBook 的数据，对专注于人工智能的芯片制造商的风险投资从2021年的90亿美元降至40亿美元。

虽然像Cerebras Systems、Graphcore和SambaNova这样的企业成功筹集了大量资金，并在自己的技术领域取得了一定的成就，但要撼动英伟达这样的行业巨擘仍非易事。尤其是在像ChatGPT这类大型模型应用兴起之际，英伟达的地位愈发稳固，其GPU芯片在众多AI应用中都扮演着不可或缺的角色，这使得任何试图挑战英伟达的初创公司都面临着巨大的压力。这些AI芯片初创企业需要不懈努力，以证明他们的技术不仅能与英伟达媲美，甚至具有超越的潜力和价值。

资金流动性的减少、创新步伐的放缓，以及消费者信心的衰退，都在很大程度上制约了这些初创公司的成长。在这种大环境下，AI芯片初创公司不仅要与技术巨头竞争，还要在经济大潮的冲击下稳住阵脚，这无疑对它们的生存和发展提出了更高的要求。

几近破产、融资困难、裁员，艰难的AI芯片公司

Mythic是模拟AI芯片的一家明星公司，但是据科技网站The Register报道，这家专注于模拟内存计算（CIM）的AI芯片初创公司总共筹集了约1.6亿美元资金，去年现金耗尽，几乎被迫停止运营。好在2023年3月，它成功筹集到了1300万美元投资。Mythic首席执行官Dave Rick表示，英伟达“间接”加剧了整体 AI 芯片融资困境，因为投资者希望投资巨额、回报丰厚的全垒打型投资。

在资金筹集方面，Graphcore堪称欧洲半导体初创企业中的佼佼者。这家公司由Nigel Toon和Simon Knowles在2016年创立，此前他们将自己的硬件公司卖给了英伟达。Graphcore致力于开发IPU（智能处理单元），这一点与目前主流的针对人工智能应用的GPU（图形处理单元）截然不同。Graphcore称，其IPU在满足人工智能的特定需求方面，比GPU更具有优势。据PitchBook的数据显示，截至目前，Graphcore已经成功筹集了超过6亿美元的投资。然而，相比所筹集的资金，Graphcore的收入却相对微薄。

故事在2020年出现了重大转变，当时微软决定停用Graphcore的芯片于其云计算中心，这一举措使得Graphcore失去了一个主要客户，从而面临了更加严峻的挑战。根据金融时报的报道，到2022年，Graphcore的收入骤降了46％，仅为270万美元，同时税前亏损增加了11%，高达2.046亿美元，年终现金余额为1.57亿美元。Graphcore表示，到明年5月份需要进一步融资才能实现收支平衡。公司将这一不利局面归咎于“宏观经济环境的逆境”和“关键战略客户”的硬件采购推迟，尤其是来自“中国的主要客户”。据路透社的消息，Graphcore关闭了在挪威、日本和韩国的业务，并缩减了在其他国家的业务。目前，Graphcore也开始重新调整业务方向，将其IPU芯片从数据中心转向部署在云计算环境中。

Rivos，一家服务器芯片制造商，正面临苹果公司的诉讼，被指控非法挖角其工程师并窃取商业机密。今年八月，Rivos裁减了大约二十名员工，约占公司员工总数的6%，在此过程中，管理层向留下的员工透露，公司获取新资金的可能性正在减少。联合创始人还向部分员工透露，苹果针对该公司及其几位前苹果员工的诉讼，严重阻碍了他们的筹资活动。

芯片公司烧钱是常态，巨额的研发投入、激烈的市场竞争以及对顶尖人才的争夺，都使得这些公司在成长的道路上不得不投入大量的资金。如今，人工智能领域初创公司给予初级工程师的薪酬往往十分可观，这一方面反映了人才市场的供不应求，另一方面也凸显了这些初创公司对技术人才的极度渴求。然而，这种高薪策略是否可持续，却是一个值得深思的问题。对于AI芯片初创公司而言，成功融资是其发展的关键一步，但资金的有效利用同样至关重要——这不仅关乎公司的现阶段运营，更影响到其长远的战略目标和市场地位。

英伟达的一些劲敌?

Cerebras是一家“一鸣惊人”的公司，该公司因为芯片大，而捕获了行业的眼球。英伟达的A100 GPU已经相当大了，差不多826平方毫米。但Cerebras的新型芯片WSE-2 芯片，面积为 45,225平方毫米，几乎覆盖了8英寸硅晶圆的整个表面。自2016年成立以来它已筹集了7.3亿美元。根据CB Insights全球独角兽俱乐部的数据，该公司目前估值为 40 亿美元。目前，Cerebras已经与阿布扎比G42合作建造了九台人工智能超级计算机中的第一台，这台超级计算机的造价超过1亿美元。Cerebras也正在朝着生成式AI领域奋进，虽然它已经证明了其CS-2在GPT模型中训练的速度，但是其仍没有获得大型厂商的采用。

gpu

Cerebras研究人员在AI硬件公司中首次在Andromeda AI 超级计算机上训练了一系列七个 GPT 模型，参数分别为 111M、256M、590M、1.3B、2.7B、6.7B 和 13B

Tenstorrent也是业界很看好的一家初创公司，由顶级芯片设计师Jim Keller于2016年所创立。截止目前，该公司已经融资了近3.35亿美元，最近的一次投资者中包括三星和现代，目前估值约为10亿美元。Tenstorrent将利用RISC-V和Chiplet技术打造AI CPU，以此来挑战英伟达的AI主导地位。最近，Tenstorrent刚与三星达成生产合作的协议，计划使用三星的4nm工艺来生产芯片。

该公司拥有全面的路线图（如下图所示），其中包括基于 RISC-V 的高性能 CPU 小芯片以及先进的 AI 加速器小芯片，有望为机器学习提供强大的解决方案。目前，Tenstorrent有两款产品：一种名为Grayskull的机器学习处理器，可提供约315 INT8 TOPS的性能，可插入PCIe Gen4插槽；另一种是联网Wormhole ML处理器，可提供约350 INT8 TOPS的性能并使用GDDR6内存子系统，一个 PCIe Gen4 x16 接口，并具有与其他机器的 400GbE 连接。今年他们将推出其 Black Hole独立ML计算机芯片。该公司的重头戏"Grendel "将于2024年推出，这是一种高配置、高性能的ML芯片设计，将CPU芯片与专用的 ML/AI 芯片相结合，与英伟达的GH200和 Grace/Hopper超级芯片的实现方式类似。

gpu

Tenstorrent的AI芯片路线图（图片来源：Tenstorrent）

成立于2017年的SambaNova已成为AI芯片创业领域中资金最雄厚的公司之一。截至目前，该公司已成功筹集了高达10亿美元的融资，投资方包括如软银和英特尔等知名机构。这使SambaNova不仅成为融资额最高的AI芯片初创公司，也被视为英伟达最有力的新兴竞争者之一，公司估值达到了50亿美元。

SambaNova最近推出了其最新的第四代SN40L处理器。这款处理器拥有超过1,020亿个晶体管，采用了台积电的5nm工艺，其计算速度高达638 teraflops。独特的三层内存系统（包括片上内存、高带宽内存和高容量内存）旨在处理与AI工作负载相关的庞大数据流。SambaNova宣称，一个只有8个此类芯片组成的节点就能够支持多达50万亿参数的模型，这几乎是OpenAI的GPT-4 LLM报告规模的三倍。该公司的首席执行官Rodrigo Liang表示，使用标准的GPU来执行相同任务将需要数百个芯片，这意味着总成本只有使用标准方法的1/25。然而，SambaNova并不直接将芯片销售给其他公司。相反，它提供对其定制技术栈的访问权限，其中包含了为运行最大型AI模型而专门设计的专有硬件和软件。

避免与之正面竞争，会否是AI芯片初创公司的新出路？

尽管英伟达在人工智能计算领域占据主导地位，但该公司并没有牢牢锁定该领域，市场机会仍然有很多。如果按照英伟达的冯·诺依曼架构+HBM+先进工艺+互联这样的路线，可能将无人能敌英伟达，而且GPU价格和功耗一直在上涨，这对于人工智能行业本身来说是不可持续的。所以一些AI芯片公司选择不与英伟达正面竞争，另辟蹊径，走出一些差异化的路线，试图在市场中分一杯羹。

d-Matrix：存内计算芯片

d-Matrix公司也是一家AI芯片初创公司，该公司认为，随着生成式人工智能的爆发，当前的基础设施无法维持成本和需求，生成式人工智能需要变革性的计算范式。所以d-Matrix

设计的芯片具有数字“内存计算”功能，使人工智能计算机代码能够更有效地运行。d-Matrix 宣称可以将TCO降低十倍，并在性能和延迟方面具有二十倍的优势。

据The Register的报道，这家初创公司的最新芯片名为Jayhawk II，将采用通过高速结构连接的八个小芯片，总共 2GB 的 SRAM，而且只需要350瓦就能提供大约 2,000 TFLOPs 的 FP8 性能和多达 9,600 TOPs 的 Int4 或块浮点数学性能。

gpu

d-Matrix 路线图（来源：d-Matrix）

该芯片可帮助ChatGPT等生成型AI应用提供支持。不过该公司所针对的仅是人工智能的推理部分，训练部分则不涉猎。也就是说他们讲不与英伟达正面竞争，而是发力在3-600亿参数模型领域。对于这种尺寸的模型，在人工智能推理方面，英伟达的H100不一定是最经济的选择。运行这些模型的大部分成本都归结于快速高带宽内存的使用。相比之下，d-Matrix 加速器中使用的SRAM更快、更便宜，但容量也有限。

d-Matrix已经在微软的支持下融资1.1亿美元，微软已承诺在明年推出该芯片时对其自用进行评估。d-Matrix预计两年内年收入将超过 7000 万至 7500 万美元，并实现收支平衡。

Ceremorphic：模拟计算AI芯片

Ceremorphic正在设计一款采用台积电5nm工艺的超低功耗超级计算芯片，利用其自己的专利技术和多线程处理架构ThreadArch。该公司的创始人兼首席执行官Venkat Mattela，此前他所创立的Redpine Signals于2020年3月以3.14亿美元的价格出售给了Silicon Labs。Ceremorphic所研发的芯片的核心在于数字威廉希尔官方网站之下的模拟威廉希尔官方网站，在芯片功能的层次结构的最低层进行模拟计算，更高层次上则不做模拟计算。该公司的创始人兼首席执行官Venkat Mattela认为，模拟乘法将比数字乘法更有效地利用电压，更好的实现低功耗。

该公司的主要技术包括可靠、低能耗和安全的机器学习、图形神经处理器、抗量子和硅高效安全处理器、高性能模拟威廉希尔官方网站、可靠的时序威廉希尔官方网站和系统级互连，使产品能够针对不同的细分市场进行扩展。右图描绘了 Ceremorphic的技术组合，涵盖当前和未来的计算需求。

gpu

Ceremorphic的技术组合

结语

就目前的事实证明，在英伟达所主导的GPU生态中，初创芯片公司想要打入自己的产品不是易事，“替代英伟达”难。强如AMD和英特尔都很难撬动这块大蛋糕。对于这些AI芯片公司而言，机会之窗口很窄，英伟达已经发布了其最新的路线图。而且，大型的云厂商几乎都已经躬身自研芯片了，亚马逊拥有Inferentia芯片，谷歌最近展示了其第五代张量处理单元，微软即将发布其自研芯片，这进一步挤压了希望通过云提供商进入市场的初创企业的机会。

芯片初创企业所承担的风险甚至超越了传统软件初创公司，因为它们不仅需要巨额资金来支持复杂的半导体设计和软件开发，还要承担实物产品的制造成本。随着时间的推移，我们可能会目睹一些此类企业的破产倒闭、被收购，但它们中的每一个都怀揣着成为下一个英伟达的梦想。随着时间的推进，可能会有更多这样的公司失败，但每个公司内心都怀揣着一个共同的梦想——成为下一个英伟达。

打开APP阅读更多精彩内容