AI前沿速报0907：预测2030年将出现超越人类智能的AGI_

大家好，欢迎来到本期AI前沿速报。本期内容包括：谷歌研究团队的SayTap方法让机器狗听懂人话、路特斯机器人CEO李博的智能车观点、熠智科技提出的新的隐私计算解决方案——可控计算等。我们希望通过这些资讯，让大家了解到AI技术的前沿进展，并引发对AI接下来发展的思考与讨论。请大家关注、点赞、转发这篇内容，让更多的人了解AI的日新月异变化。

1. 【谷歌研究：使用大型语言模型让机器狗听懂人话】

谷歌研究团队介绍了一种名为SayTap的方法，使用大型语言模型将自然语言指令转译成四足机器人的低层控制信号。这种方法可以让机器狗根据人类的指令进行行动，包括野餐、跑步等。研究者表示，这种交互式系统可以让用户灵活地制定不同的运动行为。该方法在实验中展示了对直接和模糊指令的准确响应能力。未来的研究方向包括测试暗含特定感受的命令和引入多模态输入。这一研究有望为智能助理机器人的开发提供新的思路。

2. 【路特斯机器人CEO李博：智能车是机器人的第一形态】

路特斯机器人CEO李博在2023 WAIC AI开发者论坛上发表演讲，表示智能车是机器人的第一形态。他介绍了路特斯机器人的产品线，包括智能驾驶系统、云端数据工厂、智能驾驶运营系统和规划控制算法比赛平台。李博还介绍了路特斯机器人的智驾云端数据工厂，该工厂提供了一套方法论和工具链，通过大模型加速智驾研发。他表示希望与智驾行业伙伴合作，引入更多AGI技术。

3. 【可控计算：一种新的隐私计算范式】

熠智科技提出了一种新的隐私计算解决方案——可控计算。可控计算要求数据使用方在数据提供方定义的安全域中对数据进行加工和处理，保证数据在使用过程中的安全。该方案使用了可信平台模块和Linux安全模块技术，将数据置于安全域内，并具有较低的性能损失。熠智科技已与国家超级计算中心合作，在超算平台上部署面向AI应用的隐私保护高性能计算平台。此外，熠智科技还推出了DataVault，一种具有模型安全保护功能的大模型一体机。可控计算希望为大模型行业和数据要素流通带来改变。

4. 【OpenAI首届开发者大会将于11月6日召开】

OpenAI宣布将于11月6日在旧金山举办首届开发者大会\OpenAI DevDay\，数百名开发者将参与并预览新工具。尽管CEO Sam Altman表示不会发布GPT-5或类似的大模型，但仍会带来令人高兴的新东西。网友猜测可能会推出GPT-6或多模态GPT-4。自2020年推出API以来，超过200万开发者已将GPT-4、GPT-3.5、DALL.E和Whisper应用于各种用例。

5. 【百川智能开源新模型 Baichuan-2】

百川智能宣布开源微调后的Baichuan-2大模型，包括Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat和4bit量化版本。这次开源不仅公开了模型，还公开了模型训练的Check Point和技术报告，希望帮助学术机构、开发者和企业用户深入了解大模型的训练过程。Baichuan-2在评测中表现优秀，性能超过同等参数量的竞品。百川智能计划在明年发布千亿参数大模型，并推出超级应用。

6. 【大型语言模型是否理解世界？哈佛麻省理工研究人员发表新研究】

哈佛大学和麻省理工学院的研究人员发表了一项新研究，他们使用简单的棋盘游戏奥赛罗验证了大型语言模型的内部表征的有效性。研究人员发现，语言模型能够以高准确率预测合法的移动操作，捕捉棋盘的状态。这表明语言模型的内部建立了一个世界模型，而不仅仅是记忆或统计。这项研究对于理解大型语言模型的工作原理具有重要意义。

7. 【苹果加大投入开发LLM，挖来谷歌工程师】

苹果为了加速开发大语言模型（LLM），每天烧掉数百万美元，并从谷歌挖来了多名工程师。苹果员工认为他们的Apple GPT大模型已超越GPT-3.5。Siri也将升级，能自动执行复杂操作。苹果的Foundational Models团队由谷歌工程师领导，还有其他团队开发语言和图像模型。苹果正在开发多个模型，并进行内部测试。苹果希望将LLM应用到产品中，但具体实现方式尚未确定。苹果加大投入开发LLM，挖来谷歌工程师，意图让苹果更像谷歌。

8. 【Falcon 180B：世界最强开源大模型】

Falcon 180B是一款参数规模为1800亿的开源大模型，通过3.5万亿token的训练，在多项任务中击败了Llama 2和GPT-3.5。该模型在推理、编码、熟练度和知识测试等任务中表现出色。不过，也有人对其质疑，认为其训练数据中代码比例较低，缺乏编码基准数据。Falcon 180B的推出引发了网友的热议，有人对其性能赞赏有加，也有人认为与Llama 2相比并不出色。Falcon 180B的开源版本已经可以在Hugging Face生态中使用和下载。

9. 【OpenAI创始人预测到2030年将出现超越人类智能的AGI】

OpenAI创始人Sam Altman预测，到2030年之前将会出现AGI（人工通用智能），其智商将超过全人类总和。OpenAI的目标是通过开发AGI来提高人类的生产力。OpenAI与微软合作，微软为其提供硬件和算力。OpenAI将举办首届全球开发者大会OpenAI DevDay，展示最新研究成果，并帮助开发人员实现新的创意和想法。OpenAI的开发者社区已经有超过200万名开发者，正在将GPT-4、GPT-3.5、DALL-E和Whisper应用到各个领域。

10. 【谷歌研究：社交推荐系统STUDY算法提升阅读体验】

谷歌研究人员开发了一种名为STUDY的推荐系统算法，可以根据学生的社交关系和阅读历史，为他们推荐合适的阅读材料。该算法使用了机器学习模型，并通过考虑阅读的社会性质来提高推荐的准确性。研究结果显示，STUDY算法在测试中表现优于其他模型，可以有效提升阅读体验。这项研究对于推荐系统的发展具有重要意义。

11. 【研究人员提出AVIS：自主信息获取的突破性AI框架】

加州大学洛杉矶分校（UCLA）和谷歌的研究人员提出了一种新方法，使大型语言模型（LLM）能够访问广泛的资源来处理与视觉相关的知识查询。该方法基于对人类决策的用户研究数据，使用结构化框架，由LLM驱动的规划器选择使用哪些工具以及如何即时构建查询。所选工具的输出将被处理，由9个LLM驱动的推理器提取关键信息。一个视觉问题被分解成较小的部分，规划器和推理器共同使用各种工具来解决每个部分，直到积累足够的数据来回答问题。该方法在信息检索和视觉问题回答方面表现出色。

12. 【武汉AI方案出台六大计划剑指千亿产业规模】

武汉市发布了关于建设国家人工智能创新应用先导区实施方案的通知。该方案要求到2025年，武汉市在人工智能领域形成10项以上首创性技术，打造1个以上通用大模型、10个以上行业模型、5个以上公共数据集，人工智能应用场景超过400项，产业规模达到1000亿元。方案包括六项任务，涉及算力规模、企业发展、园区建设、人才培养等方面。

13. 【软银回购Arm股权，估值为644亿美元】

软银以161亿美元从愿景基金手中回购Arm 25%的股权，估值为644亿美元。这一估值与英伟达相当，但Arm的业绩下滑，无法达到这一估值。分析人士认为，软银回购Arm的目的是为了粉饰愿景基金的业绩。然而，Arm的上市并未获得任何资金，软银仍持有90.6%的股权。此举也进一步搭上孙正义多年来在业界的声誉。愿景基金的投资业绩不佳，孙正义正在酝酿第三期愿景基金的募集。

14. 【联想集团打造“尖峰制造模式”】

联想集团是中国制造业的翘楚，通过数字化手段和智能机器，实现人机合一，提高生产效率和灵活性。中国制造业具备规模效应和创新能力，不仅仅是廉价劳动力的竞争。面对产业迁移和转型，中国制造业需要提高供应链的韧性，包括分散供应链、提高透明度、培育合作伙伴信任等。中国制造业具备强大的竞争力，将继续发展和升级。

15. 【用DUV光刻机制造7nm芯片的“魔法”】

DUV光刻机的波长为193nm，与7nm芯片所需的36nm金属间距相差28倍，看似无法突破。但通过多重曝光技术，使用两组掩膜版，加工出间隔67nm的线条，再进行四重曝光，最终得到36nm的金属间距，符合7nm工艺要求。然而，多重曝光增加了制造成本和时间，且良率受影响。为了突破这一限制，业界开发了计算光刻技术，利用人工智能和机器学习算法进行光刻优化。DUV光刻机制造7nm芯片已成为业界使用的最后一代工艺。

16. 【中国车企亮相2023慕尼黑车展，加速智能化转型】

中国车企在2023慕尼黑车展上亮相，展示了智能化转型的成果。中国车企数量比上一届翻了两倍，达到50多家。这显示出中国车企想要在欧洲新能源车市场占据一席之地。同时，德国豪华品牌宝马和奔驰也在车展上发布了新的电动车型，以应对中国车企的竞争压力。此外，中国车企也在成都车展上加大了销售力度，推出了多种促销政策，以刺激市场销量。中国车企的智能化转型正在加速进行中。

17. 【Open Interpreter：OpenAI代码解释器的开源本地运行实现】

Open Interpreter是一个开源工具，它赋予开发者在本地开发环境中无限制地工作的能力。与OpenAI的Code Interpreter相比，Open Interpreter没有限制，可以让开发者充分利用计算机的潜力。它提供了内容创作、浏览器控制、数据处理和聊天等多种功能，让开发者能够高效灵活地进行软件开发。Open Interpreter代表了本地开发环境的重大进步，让开发者能够自由地工作，摆脱托管服务的限制。

18. 【Google将要求政治广告商明确披露使用AI生成的选举广告】

Google将从11月开始要求政治广告商在使用“合成内容”（即展示“逼真的人物或事件”的合成内容）的选举广告中明确披露。这包括使用AI让某人看起来好像说或做了从未发生过的事情，以及更改真实事件的镜头（或制作一个逼真的虚构事件）来创造一个从未发生过的场景。Google表示，这些类型的广告必须在“明显易见”的位置包含免责声明，并且适用于图像、视频和音频内容。任何“无关紧要”的调整，如增亮图像、背景编辑或使用AI消除红眼，都不需要标注。一些政治竞选活动已经开始利用AI制作广告，这引发了一些立法者的担忧，包括纽约众议员Yvette Clarke，她提出了一项要求政治广告披露使用AI生成内容的法案。

感谢您的关注，AI前沿观察将继续为您带来前沿、全面的人工智能资讯。请大家积极参与互动，点赞、评论、转发，让更多人了解AI的前沿技术和应用。明天的速报，我们不见不散！