AI芯片初创公司:Cerebra
今天给大家介绍一家特别有意思的创业公司 “Cerebra”
很多人都知道,NVIDIA靠卖给AI服务器的GPU赚了很多钱,尤其是在“推理过程”上有很多竞争对手,但NVIDIA的地位依然很强。不过,在“训练过程”这一块,NVIDIA几乎没有对手,所以一直占据着主导地位。
但是,有一家叫Cerebra的创业公司正试图挑战NVIDIA在“训练过程”中的垄断地位。这家公司非常有野心,想从NVIDIA手里抢夺市场份额。Cerebra主要研究大规模语言模型(LLM),这种模型越大,效果越好。然而,当模型的参数变多时,单个GPU的内存就不够用了,编程也变得特别复杂。
NVIDIA的最新H100 GPU内存有80GB,但如果LLM的参数超过这个限制,就必须分散到多个GPU上进行训练,难度也随之增加。为了解决这个问题,Cerebra开发了一种叫做“晶圆级芯片”的巨型芯片,这种芯片有90万个处理器核心,比NVIDIA的芯片通信速度快了3000倍。
而且,Cerebra还开发了一个系统,把这些巨型芯片连接起来,就像一个大芯片一样工作,这让LLM的编程变得简单了24倍。虽然芯片做大了之后生产难度增加,但Cerebra的设计允许90万个核心中有5%是次品也能正常工作。
不过,也有点担心,如果以后NVIDIA也开发出类似的软件,Cerebra的优势可能就没了。
除了训练,Cerebra还在推理过程中表现得非常强大,据说比GPU快20倍,成本只有GPU的五分之一。大家可以去Cerebra官网试试与Llama3的聊天功能,处理文档速度非常快。
现在,像Groq、Tenstorrent、Etched、SambaNova和Cerebra等多家创业公司正在AI芯片领域与NVIDIA竞争。这场竞争让人看到了未来芯片行业的无限可能,真的非常令人兴奋。
本周主要新闻↓↓↓
“OpenAI正在考虑推出ChatGPT的高额的订阅费用版本”
有消息透露,OpenAI正在考虑为ChatGPT的新大规模语言模型(LLM)设置高额的订阅费用。据说他们正在开发新的模型,名叫“Strawberry”和“Orion”,这些模型可能具备更强的推理能力,因此订阅费用可能会高达每月2000美元(最终价格还没确定)。
目前,ChatGPT的付费版本每月收费20美元,预计每年能带来20亿美元的收入。不过,由于免费版的运营成本非常高,收入增长难以赶上支出。而新模型“Strawberry”和“Orion”的运营成本可能更高,为了平衡这些成本,OpenAI可能会提升订阅价格。
https://www.theinformation.com/articles/openai-considers-higher-priced-subscriptions-to-its-chatbot-ai-preview-of-the-informations-ai-summit
“Y Combinator创始人Paul Graham最近发表了一篇关于创业公司管理方式”
Y Combinator创始人Paul Graham最近发表了一篇关于创业公司管理方式的博客文章,虽然篇幅不长,但提到的内容非常重要,在业界引起了广泛讨论。
Paul Graham指出,很多“知识分子”常给创业公司提出建议,认为“雇佣优秀的人,并给他们自由度”是好方法。这在大公司管理中是合理的建议,甚至在MBA课程中也常被教授。
但是,Graham强调,这个思路在创业公司中常常行不通,甚至有可能导致公司失败。他提到,最糟糕的情况是,雇来的那些“假装聪明”的人反而会把公司搞垮。Graham将公司管理分为两种模式:“创始人模式”(Founder Mode)和“经理模式”(Manager Mode),并指出,很多人并不了解为什么“创始人模式”更容易成功。
像Steve Jobs、Bill Gates、Elon Musk、Mark Zuckerberg这样的创始人,使用的管理方法与MBA课上教授的内容差异很大,他们依靠独特的方法取得了成功。“创始人模式”有时会取得巨大成功,有时也会遭遇惨败。而这种独特性让它难以通过传统教育传授。因此,MBA课程更倾向于培养适合“经理模式”的人才。
在开发新产品时,创始人需要具备对技术和市场趋势的高度理解,并通过直觉洞察潜在需求。这种能力很难教授,因此现在的商业教育更专注于“做问卷调查”或“分析竞争对手产品”等容易教和复制的方法。
自从这篇博客文章发布后,网上出现了两种极端声音:一种认为“创始人模式”意味着创业者可以为所欲为,另一种则对此持批评态度。我个人的看法是,这两者都不是绝对正确。创业者必须找到适合自己的方式,而最终“结果才是最重要的”。我个人的做法是,在我擅长的领域,我会亲自做,但在不擅长的方面,我更信任专家来处理。
https://paulgraham.com/foundermode.html
“Canva准备进行IPO”
Canva准备进行IPO(首次公开募股),但有文章指出,自2月份首席财务官(CFO)离职以来,这个职位一直空缺。而在Canva的七名高管中,只有两人有过在上市公司工作的经验。
Canva是一款提供在线设计服务的软件,目前拥有1.7亿免费用户和2000万付费用户。如果按5月份的销售额估算,全年收入将达到23亿美元。
长期以来,设计市场几乎被Adobe垄断,但Figma和Canva等竞争对手的出现,令人感到振奋。之前Adobe试图收购Figma,但因反垄断法没有获得批准,我认为这是一个正确的决定。
顺便提一下,Figma主要为专业设计师提供工具,而Canva的特别之处在于,它让非专业人士,比如工程师,也能利用丰富的模板轻松完成设计工作,而不需要依赖专业设计师。
https://www.theinformation.com/articles/the-people-with-power-at-design-software-firm-canva
“利用神经网络进行3D建模的两项技术”
NeRF和Gaussian Splatting,当时相关研究非常活跃。最近的这篇论文也是其中之一,介绍了利用Gaussian Splatting技术实现3D虚拟角色自由移动的新方法,名为DEGAS。虽然目前还停留在论文阶段,但这类技术能够迅速应用到实际服务中,或许用不了半年。或许我们很快就会进入一个大部分YouTuber都使用3D虚拟角色的时代。
你可以通过以下链接了解更多:https://initialneil.github.io/DEGAS
人工智能(AI)和神经网络的迅猛发展改变了我们的生活,而这一切的分水岭可以追溯到2012年发布的AlexNet。这段视频回顾了AI的发展历史,对于了解整个大趋势来说,是很好的学习资料。以下是Gemini对该视频的总结:视频解释了人工智能(AI)的运作方式,特别是AI模型如何整理数据并理解世界。视频中介绍了AlexNet模型,2012年发布的AlexNet震撼了计算机视觉领域。它通过将传统的AI想法进行扩展,展示了AI的巨大潜力。AlexNet论文的第二作者Ilya Sutskever后来共同创立了OpenAI,在OpenAI中,他与团队将这个想法进一步扩展,最终创造了ChatGPT。
ChatGPT由多个名为Transformer的计算层组成,每个Transformer层对输入数据执行一系列固定的矩阵运算,并返回相同尺寸的输出矩阵。ChatGPT首先将输入的文本分割成单词或词片段,再将每个单词或片段映射为向量,所有这些向量堆叠成矩阵,输入到Transformer层中,生成新的输出矩阵。这个过程在ChatGPT 3.5中重复96次,在ChatGPT 4中重复120次。最终,ChatGPT返回的下一个词或词片段就是将最后的输出矩阵的最后一列映射为文本得到的。这种操作不断重复,直到模型返回一个特定的停止符号。这就是ChatGPT的工作原理。视频中通过对比AlexNet和ChatGPT的运作方式,清晰解释了AI的原理。
“蓄电方法技术”
关于蓄电方法,有很多不同的技术。本文介绍了一种通过对砖块进行特殊处理,使其能够导电,将电能转化为热能并储存的方法。文中提到了利用这些热能熔化铁等应用,但这类热能也可以用于发电,不过文中没有详细说明发电效率如何。
在土地广阔的德克萨斯州,有多个大规模的太阳能发电站,覆盖着大片的太阳能板。然而,这些发电站在处理杂草问题时遇到了一些困难。使用割草机来清理杂草时,容易导致小石子飞溅,损坏太阳能板。为了解决这个问题,现在越来越多的发电站开始采用一种新方法——从农场租借羊群,让羊来吃掉杂草。
文章中提到的公司“Texas Solar Sheep”就是提供这种服务的公司之一,他们用6000只羊管理着超过1万英亩的太阳能发电站的杂草问题。这种在同一块土地上同时进行太阳能发电和农业生产的方式被称为“光伏农业(agrivoltaics)”,预计这种方式在未来将变得更加普遍。
不过在太阳能发电站中,他们更喜欢用羊而不是山羊,因为山羊有时会啃食连接太阳能板的电线。
https://www.enelnorthamerica.com/about-us/newsroom/search-press/press/2024/08/solar-grazing
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有