大家好,欢迎来到本期AI前沿速报。本期内容包括:微软研究人员发布的PromptTTS 2、伊利诺伊理工学院研究者提出的新方法加速扩散模型生成、大型语言模型在数据分析中的应用等。我们希望通过这些资讯,让大家了解到AI技术的前沿进展,并引发对AI接下来发展的思考与讨论。请大家关注、点赞、转发这篇内容,让更多的人了解AI的日新月异变化。
1. 【微软研究人员发布PromptTTS 2:通过增强语音变异性和成本效益的提示生成,革新了文本转语音技术】
微软研究人员发布了PromptTTS 2,该技术通过使用大型语言模型自动生成高质量的文本提示,解决了文本提示型文本转语音系统面临的困难。PromptTTS 2利用扩散模型的变异网络来描述文本提示未涵盖的语音变异性,通过在推理过程中从高斯噪声中选择样本来管理语音变异性。实验结果表明,PromptTTS 2在生成更符合文本提示的语音的同时,支持通过从高斯噪声中采样来限制语音变异性。
2. 【伊利诺伊理工学院研究者提出新方法加速扩散模型生成】
伊利诺伊理工学院的研究者提出了一种新的方法,可以加速扩散模型的生成过程。他们使用后训练量化(PTQ)来压缩噪声估计网络,实验结果表明,这种方法可以将全精度的扩散模型量化为8位模型,并且在性能上保持甚至提高。这项研究对于加速人工智能前沿研究具有重要意义。
3. 【大型语言模型(LLMs)在数据分析中的应用】
大型语言模型(LLMs)是强大的神经网络,可以通过处理大量文本数据提供有价值的商业洞察。它们可以进行情感分析、命名实体识别和文本生成等任务,对于分析客户反馈、欺诈检测和客户参与等任务非常有用。然而,LLMs的使用也存在一些挑战,包括高昂的训练和运行成本、缺乏透明度和可能存在的偏见。在数据分析中,平衡LLMs的好处和道德挑战对于负责任和有效的利用至关重要。
4. 【作家起诉OpenAI侵犯版权】
一组作家起诉OpenAI,声称该公司非法使用他们的作品训练AI ChatGPT聊天机器人。起诉书称,OpenAI的GPT大型语言模型只有在使用他们的作品进行训练后才能够总结和分析内容,这些输出实际上是侵犯他们版权的“派生作品”。此次诉讼要求法院停止OpenAI的非法商业行为,并赔偿作家因版权侵犯所受的损失。
5. 【研究人员发布PhysObjects数据集,用于改进视觉语言模型的物理推理能力】
斯坦福、普林斯顿和谷歌DeepMind的研究人员发布了一个名为PhysObjects的数据集,用于改进视觉语言模型(VLM)的物理推理能力。该数据集包含了36.9K个众包和417K个自动化的常见家居物品的物理概念注释。研究人员通过对PhysObjects进行微调,显著提高了VLM在物理推理任务上的预测准确性。这一研究为将VLM应用于机器人领域的更复杂推理打下了基础。
6. 【MLPerf 3.1发布大型语言模型推理基准测试】
MLCommons发布了MLPerf AI基准测试的新成员,包括大型语言模型(LLM)的推理测试和用于机器学习工作负载的存储系统性能测试。MLPerf 3.1基准测试包含超过13500个性能结果,许多参与者在3.0基准测试的基础上提高了20%以上的性能。此外,MLPerf还新增了LLM基准测试,反映了生成式AI大型语言模型的快速发展。英特尔和NVIDIA等公司在推理基准测试中表现突出。
7. 【科技小说《Exadelic》将硅谷与《头号玩家》相结合】
《Exadelic》是一部由TechCrunch的撰稿人Jon Evans创作的科幻小说,它将硅谷科技社区与《头号玩家》的参考密度相结合,但目标更高。故事讲述了一群朋友发现自己卷入了一个可能决定地球命运的人工智能驱动的深度科技阴谋。故事情节扣人心弦,涉及到失控的人工智能、不道德的风险投资和对现实本质的质疑。尽管小说过于依赖硅谷科技的时代精神,但它依然是一次有趣的阅读体验。
8. 【美国联邦贸易委员会将对生成式人工智能进行监管】
美国联邦贸易委员会(FTC)正在提出积极的反垄断执法案。他们指出,一些做法可能引发政府干预。在涉及生成式人工智能的市场竞争中,企业应了解几种常见的反垄断伤害理论的参数和限制。其中,独家交易是一个潜在的问题,如果一家公司通过独家交易来控制关键资源、分销渠道或客户群体,可能引发担忧。此外,与市场份额超过30%的公司进行独家交易更加危险。
9. 【AI芯片短缺推动创业公司d-Matrix筹集1.1亿美元】
AI芯片初创公司d-Matrix筹集了1.1亿美元,用于商业化其被称为“首创”的推理计算平台。d-Matrix声称其技术能够以比基于GPU的替代品更低的拥有成本进行推理,即运行AI模型。由于生成式AI的采用加速,像Nvidia这样运行这些模型的芯片供应商正难以满足需求。因此,像d-Matrix这样的初创公司的硬件可能成为其他公司的替代选择。
10. 【AI应用Character.ai在美国迎头赶上ChatGPT】
根据市场情报公司Similarweb的最新分析,由a16z支持的AI应用开发商Character.ai的iOS和Android应用在美国的月活跃用户已经达到420万,接近ChatGPT的600万。尽管Character.ai在网页上的使用量仍然落后于ChatGPT,但它吸引了比较年轻的用户群体,其中近60%的用户年龄在18到24岁之间。Character.ai的网页流量在夏季有所下降,但移动应用的用户增长弥补了这一损失。ChatGPT的网站访问量在8月份出现了0.4%的增长,与学年开始有关。Character.ai还有很大的增长空间,因为该公司今年早些时候宣布获得1.5亿美元的A轮融资,估值达到10亿美元。
11. 【AI监管引发各方争议,专家提出不同意见】
美国参议院将就AI监管展开讨论,但ChatGPT却对此一无所知。与此同时,AI界的其他人士纷纷发表意见,其中包括DeepMind联合创始人、Inflection AI首席执行官穆斯塔法·苏莱曼,他主张设立AI等新兴技术的内阁级职位。此外,一项Axios调查发现,领先大学的AI专家更倾向于建立联邦“AI部门”或全球监管机构来管理人工智能。国会议员泰德·刘还提议成立“蓝丝带委员会”研究AI并为立法者提供建议。此次AI监管讨论引发了广泛关注,各方意见不一。
12. 【19位科学家提出14条科学指标判断AI是否具有意识】
一篇发表在Nature上的论文由19位神经科学家、哲学家和计算机科学家组成的团队提出了一个判断AI是否具有意识的指标属性清单。该清单基于6种科学理论,提取出了14条意识判断指标。作者认为,一个系统符合的指标条数越多,就表明其具有意识的可能性越高。然而,目前的大型AI系统还没有满足所有指标。作者还警告说,低估或高估AI的意识都存在风险,需要更好地了解意识科学来应对未来可能的AI意识。
13. 【Unistellar推出AI望远镜,让你在城市中观测星系】
法国公司Unistellar推出了一款AI望远镜,让人们在城市中也能观测星系。这款望远镜利用机器学习和人工智能技术,去除光污染,使图像更清晰。用户可以通过智能手机连接望远镜,控制望远镜的方向,并在手机屏幕上观看图像。这款望远镜售价为2500美元,内置了3700万颗星星的数据库,可以观测5000多个天体。这是人工智能改变日常产品的又一个例子。
14. 【Meta首次披露新AI大模型开发计划】
Meta公司首席执行官马克·扎克伯格透露,Meta正在开发一种新的、更强大的AI大语言模型,预计于2024年开始训练。该模型的功能将与OpenAI提供的最先进模型相媲美。Meta计划建立数据中心并购置英伟达芯片,以训练新模型。然而,Meta开源AI大语言模型面临版权风险、滥用担忧与可控性未知等问题。Meta希望通过开源模型免费提供构建AI驱动工具给其他公司。Meta的新AI大语言模型将与OpenAI的GPT-4相媲美,并可能在谷歌的Gemini之后发布。
15. 【Scala Biodesign利用AI改进药物】
Scala Biodesign获得550万美元的新融资,利用人工智能和其他工具改进现有或有潜力的药物。该公司通过结合AlphaFold和RoseTTAfold等技术,加速工程治疗分子的过程。目前,药物开发过程主要依靠试错,但Scala Biodesign利用蛋白质结构预测和临床数据,能够找到改进药物稳定性、增强效果和便于生产的方法。该公司已与一些制药公司和实验室合作,并计划进一步扩大合作和研究。
16. 【Google.org推出2000万美元的AI专项资助计划】
Google.org宣布推出Digital Futures Project,旨在支持AI研究和公共政策解决方案。Google.org将设立一个2000万美元的基金,为开展AI专业研究的智库和学术机构提供资助。该基金将支持独立思考者研究AI对全球安全的影响、如何利用AI增强机构和企业的安全性、AI对劳动力的影响以及如何将劳动力转向未来的AI工作等问题。首批获得资助的机构包括Aspen Institute、Brookings Institution、Carnegie Endowment for International Peace等。Google表示,该基金将支持全球范围内的组织,并将很快公布更多细节。
17. 【AI语音技术进步迅猛,引发伦理和法律问题】
人工智能语音系统在各种应用中变得越来越逼真,但也引发了一系列伦理和法律问题。AI可以模仿任何人的声音,包括名人和普通人,这可能导致深度伪造和隐私侵犯。人们需要思考如何使用这些工具,以及如何应对相关的伦理和法律挑战。AI技术的进步速度很快,我们需要尽快解决这些问题。
18. 【生成式人工智能在生产中的应用:重新思考开发并采纳最佳实践】
生成式人工智能正在改变企业与客户互动、提升规模化的客户体验和推动业务增长。专家们分享了实际应用案例,讨论了挑战,并提供了可行的见解,以帮助组织制定生成式人工智能战略。使用生成式人工智能构建生产应用需要重新思考软件开发过程,并需要新一代基础设施工具来帮助开发团队了解大规模应用中的性能表现。此外,对生成式人工智能的误解包括将其视为类似于谷歌搜索的数据库,以及认为它会自动化一切。实际上,生成式人工智能只能自动化某些机械任务,并且与人类合作可以提高生产力和改善用户体验。在应用生成式人工智能时,关键是有明确的策略、测试基础设施和量化评估框架,并选择适合应用生成式人工智能的问题。
19. 【普林斯顿研究人员提出CoALA:一个系统性理解和构建语言代理的概念性AI框架】
普林斯顿大学的研究人员提出了一种名为CoALA的概念性AI框架,用于系统性地理解和构建语言代理。这个创新性框架通过对语言代理的内部机制、记忆模块、行动空间和决策过程进行分类,为语言代理的开发提供了结构和清晰度。其中一个重要应用是LegoNN方法,它可以用于构建编码器-解码器模型,实现序列生成任务。LegoNN的模块化设计使得解码器模块可以在不同任务中重复使用,从而节省了时间和计算资源。这一创新方法为开发更高效、多功能和节省成本的语言代理铺平了道路。
20. 【深圳市发布2024年芯片资助计划,最高资助3000万元】
深圳市科技创新委员会发布了2024年度集成电路专项资助计划项目申请指南。申请时间为今日开始,截止日期为10月29日。最高资助总额为3000万元。资助内容包括对集成电路设计企业流片支持、购买IP支持和EDA设计工具研发支持。申请单位需在深圳注册,具备研发条件,并符合专项条件。详细信息可查看申请指南。
感谢您的关注,AI前沿观察将继续为您带来前沿、全面的人工智能资讯。请大家积极参与互动,点赞、评论、转发,让更多人了解AI的前沿技术和应用。明天的速报,我们不见不散!


财经自媒体联盟

4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有