AI前沿速报0913:智源用10万美元训出千亿参数模型FLM

AI前沿速报0913:智源用10万美元训出千亿参数模型FLM
2023年09月13日 11:12 AI前沿科技小编

大家好,欢迎来到本期AI前沿速报。本期内容包括智源研究院成功训练出千亿参数大模型,深圳公司共生矩阵挑战AGI,苹果发布全球首款3nm芯片A17 Pro,以及AI模型使用图像到图像翻译技术将古代化石复活等。我们希望通过这些资讯,让大家了解到AI技术的前沿进展,并引发对AI接下来发展的思考与讨论。请大家关注、点赞、转发这篇内容,让更多的人了解AI的日新月异变化。

1. 【智源成功用10万美元训练出千亿参数大模型FLM】

智源研究院与多所高校合作,用10万美元训练出了一个拥有1010亿参数的大模型FLM,比肩GPT-3的效果。他们采用了一种“成长策略”,先训练小规模模型,再逐步扩大参数量,降低了训练成本。此外,FLM还通过改善并行策略提高了吞吐量。FLM在测试中表现出色,成绩接近GLM-120B和Llama-7B,但训练成本显著低于二者。FLM团队还提出了一项大模型“智商测试”,在多个维度上展开评估,成绩优秀。

2. 【深圳公司共生矩阵挑战AGI】

深圳一家不到10人的公司共生矩阵,近一年在顶会上发表16篇大模型相关论文,成立两个月后在C-Eval榜单上排名前三。他们的目标是自研AGI技术,打造行业数据精炼工厂。共生矩阵依托自研大模型GS-LLM,参数规模从7B-130B不等,能根据用户需求量体裁衣。团队构建了独立的训练框架,重视数据质量,清洗出20T的高质量文本数据。他们计划将训练好的参数数据进行共享和交易,以实现大模型的多样性和高效率。团队规模小但高效,不打算扩大团队规模。

3. 【苹果发布全球首款3nm芯片A17 Pro,支持硬件加速光线追踪】

苹果推出业界首款3nm芯片A17 Pro,搭载全新GPU设计和硬件加速光线追踪,提供快速、高效的性能。A17 Pro将用于iPhone 15 Pro系列,而A16芯片将用于iPhone 15系列。此外,苹果还发布了手表芯片S9 SiP,支持本地运行Siri。苹果的自研芯片已经遍布各产品线,但仍依赖于Arm、台积电和高通等关键芯片供应商。未来,苹果将继续丰富芯片版图,减轻对供应商的依赖。

4. 【全球AI芯片行业发展迅猛】

美国的AT&T贝尔实验室推出了世界上第一颗专门针对CNN训练优化的AI芯片ANNA。英伟达、谷歌、华为、苹果、百度等公司也进入了AI芯片领域。创新派公司探索新型计算架构,如光子计算和类脑计算。中国的大算力芯片行业获得大量融资,清华大学校友创办了许多创新的AI芯片公司。大模型的推动促进了AI芯片行业的发展,坚持和创新是取得成功的关键。

5. 【AI模型使用图像到图像翻译技术将古代化石复活】

研究人员开发了一种名为Revive-2I的AI模型,可以将古代化石转化为活体动物的图像。该模型利用文本提示来指导图像的转化过程,生成逼真的结果。这项技术在法律执法、野生动物保护和古生物学等领域具有重要意义。通过将素描转化为嫌疑人的真实图像,可以帮助警方进行识别;通过将濒危物种的图像转化为活体图像,可以展示气候变化对生态系统和栖息地的影响;另外,古生物学家可以通过将古代化石转化为活体图像,将古代生物复活。

6. 【苹果发布iPhone 15 Pro,搭载3nm芯片,多项创新功能】

苹果发布了搭载全球首款3nm芯片A17 Pro的iPhone 15 Pro,采用航空级钛合金设计,性能和能效大幅提升。新款iPhone支持硬件加速的光线追踪,提供更真实的游戏和AR体验。拥有最好的摄像头系统,包括多个镜头和创新功能。采用钛合金外壳和超瓷晶面板,轻巧耐用。新增可自定义的操作按钮,提供更多的镜头选择和光学变焦。支持USB-C连接和快速传输功能。

7. 【白盒CRATE模型实现自监督分割能力】

研究人员设计了一种基于Transformer架构的白盒CRATE模型,通过自监督学习实现了分割语义的涌现。实验结果显示,CRATE模型可以捕捉到图像中物体的边界和纹理级别的细节,具有较好的分割性能。与普通ViT模型相比,CRATE模型在分割任务上表现更好。研究人员还发现,CRATE模型的深层表征可以逐渐更关注前景对象,并且能够捕捉到不同语义的部分特征。这一研究为设计白盒基础模型提供了新的思路,同时具有高性能和数学上的可解释性。

8. 【Delphi推出AI数字克隆服务,用户可上传通信内容创建个性化聊天机器人】

美国初创公司Delphi宣布推出AI数字克隆服务,用户只需上传至少四个包含自己通信内容的文档和数千个音频文件,Delphi将为其创建一个AI聊天机器人,模仿用户的个性和写作方式。用户可将克隆部署到网站、Slack甚至绑定到手机号,代表用户接听电话。Delphi还尝试在克隆中重新创建用户的思维过程。Delphi创始人表示,该服务可帮助教练、创造者、专家等扩大影响力。目前已有超过100人创建了数字克隆。

9. 【华南理工大学和A*STAR团队首次提出开放世界测试段训练的设定】

研究人员首次提出了开放世界测试段训练(OWTTT)的问题和设定,并提出了一种基于动态原型扩展的自训练方法来解决这个问题。该方法可以有效识别强域外数据(Strong OOD)样本,并减小其对弱域外数据(Weak OOD)分类的影响。实验结果表明,该方法在多个基准数据集上相较于目前最优秀的方法有较大的提升,可以实现更加鲁棒的测试段训练。

10. 【研究团队提出新方法扩展语言模型上下文窗口】

研究团队提出了一种名为YaRN的方法,可以扩展基于Transformer的大型语言模型(LLM)的上下文窗口。该方法通过插值和动态缩放的方式,使模型能够处理更长的序列,提高了模型的性能。实验结果显示,YaRN方法在扩展上下文窗口和困惑度方面优于其他方法。这一研究成果有望提升语言模型的能力,进一步推动自然语言处理领域的发展。

11. 【苹果发布iPhone 15系列和Apple Watch S9】

苹果在秋季发布会上推出了iPhone 15、iPhone 15 Plus、iPhone 15 Pro、iPhone 15 Pro Max和Apple Watch S9、Apple Watch Ultra。iPhone 15系列采用了全新设计,屏幕尺寸增大,摄像头升级,搭载A16仿生芯片。Apple Watch S9配备了S9 SiP芯片,性能提升30%。此外,苹果还推出了卫星道路救援功能和USB-C接口。

12. 【蚂蚁保推出AI技术改善保险服务体验】

蚂蚁保平台推出了金选AIMM模型,利用AI技术帮助用户筛选优质保险产品。该模型通过解析保险产品条款和自动量化评估,提供全方位的选购保险产品帮助。此外,蚂蚁保还利用生成式AI技术解决保险领域的问题,如提供明确的保险产品信息和智能对话服务。同时,蚂蚁保还通过分层风控模型和宠物身份识别技术提升风控能力,并推出安心赔服务改善理赔体验。蚂蚁保的AI技术在保险行业中取得了显著成果,为用户提供更好的保险服务体验。

13. 【第二届机器学习算法与自然语言处理大会将于2023年9月23日-24日举行】

中国人工智能学会和中南大学将联合主办第二届机器学习算法与自然语言处理大会(MLNLP2023)。大会旨在为学者提供学术交流平台,内容涵盖大模型构建与微调、大模型与推荐系统、大模型评估与安全、多模态多语言大模型、大模型与知识图谱以及大模型技术与应用等6个论坛。大会免费注册,通过官网线上交流专区深度参与学者讨论。

14. 【AI芯片创企Enfabrica获1.25亿美元B轮融资】

AI芯片创企Enfabrica宣布完成1.25亿美元的B轮融资,由Atreides Management领投,英伟达等多家投资者跟投。新资金将用于推进加速计算设备Fabric Switch(ACF-S)和解决方案的生产,该设备可降低数据中心的计算成本并扩展内存。Enfabrica将在AI硬件和边缘AI峰会上展示其ACF-S解决方案。

15. 【苹果发布iPhone 15系列,全系拥抱USB-C,价格不涨】

苹果发布了全新的iPhone 15系列,其中iPhone 15 Pro搭载了全新的3nm芯片A17 Pro,成为业界首款采用这一制程的手机。此外,iPhone 15全系拥抱USB-C接口,告别了闪电接口。iPhone 15 Pro取消了实体静音键,改用Action Button,可以自定义快捷功能。摄影能力方面,iPhone 15 Pro相当于拥有7个专业相机镜头。此次发布的iPhone 15系列价格不涨,基础款起售价为5999元,Pro起售价为7999元。

16. 【研究发现GPT-4通过密度链提示可以提升摘要质量】

研究人员使用GPT-4进行了一项研究,通过密度链提示逐步提高了摘要的实体密度。研究结果显示,相比传统的GPT-4提示生成的摘要,使用密度链提示生成的摘要更具抽象性、信息整合性更高,并且更接近人类撰写的摘要的密度。人类评估者更喜欢使用密度链提示生成的摘要,这表明在摘要中实现信息量和可读性的理想平衡至关重要。研究人员还提供了5000个未注释的密度链摘要,供公众在HuggingFace网站上使用。

17. 【GPT对创业公司价值的辩论】

朱啸虎和傅盛在朋友圈就GPT对创业公司的价值进行了辩论。朱啸虎认为99%的价值都是GPT创造的,创业公司本身的价值不大;而傅盛认为GPT是一个平台,创业者可以基于这个平台衍生出不同的价值。数据质量和获取数据的机会是AI创业者的核心壁垒。C端市场的数据掌握在大公司手中,小型初创企业难以与之竞争;而B端市场的大企业需要与初创企业合作分享数据。硅谷投资人更看重B端机会,中国的大型互联网公司拥有大量C端用户数据。医疗行业是AI创业者的首选行业。

18. 【高通与苹果延长合同,为iPhone继续提供5G基带芯片至2026年】

苹果与高通签订协议,将继续获得5G基带芯片供应权,合同延长至2026年。这意味着苹果自研芯片计划进展缓慢。

感谢您的关注,AI前沿观察将继续为您带来前沿、全面的人工智能资讯。请大家积极参与互动,点赞、评论、转发,让更多人了解AI的前沿技术和应用。明天的速报,我们不见不散!

0条评论|0人参与网友评论
最热评论

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部