RTX AI大算力为AI PC提供标准,为“真正的AI PC”带来生产力革命

RTX AI大算力为AI PC提供标准,为“真正的AI PC”带来生产力革命
2024年04月26日 17:36 电脑报

Nvidia于4月19日在北京举行了RTX AI媒体品鉴会,会上宣布了大量与AI相关的最新重磅信息,为真正的AI PC时代生态圈带来了无与伦比的领军级动力。其中包括NVIDIA与火星时代教育联合发布《NVIDIA TensorRT Stable Diffusion创作加速指南》和使用案例;NVIDIA与吐司/Tensor.Art联合发布《个人用户玩转Stable Diffusion的GPU配置推荐》;在智谱AI端云一体大模型解决方案中,NVIDIA TensorRT-LLM 助力智谱AI ChatGLM 模型推理加速等等。此外,现场还展示了大量基于RTX AI技术的Demo,包括NVIDIA ACE、ChatRTX、Stable Diffusion、DLSS 3.5、NVIDIA app以及来自土豆人tudou_man、Simon阿文、海辛、言萧等AI艺术家基于RTX 40系列AI PC创作的AIGC作品。

01AI的真正领军者,RTX AI为AI PC提供无限动力

要说NVIDIA是AI PC的领军者和第一推动者相信大家是没有任何异议的,RTX AI PC目前已拥有超过1亿用户和500款AI应用,生态环境遥遥领先。实际上早在2018年,NVIDIA就推出了RTX技术和首款专为AI打造的消费级GPU(GeForce RTX),而目前RTX GPU已经升级到了最新的RTX 40系列。在RTX GPU上,这些专用的 AI 加速器被称为 Tensor Core,在运行要求极为严苛的工作和娱乐应用时,Tensor Core 能够提供强大的AI加速性能,并为PC用户带来了以前在云端才能运行的强大功能。

衡量 AI 性能的一种方法是以 teraops 为单位。teraops 即“万亿次运算/秒”(TOPS),可作为指标让用户了解PC的AI性能,GeForce RTX 40系列GPU可提供从200 AI TOPS到1300 AI TOPS的算力选择,全面涵盖笔记本电脑和台式电脑产品。而目前没有独立GPU的轻量级AI PC算力仅为10~45 TOPS,完全不能与拥有RTX 40 GPU的AI PC相提并论。

此外,NVIDIA TensorRT软件开发者套件还可进一步大幅度提升深度学习推理性能。TensorRT还可以加速非常热门的生成式AI模型,例如Stable Diffusion 1.5和SDXL等等。全新的UL Procyon AI图像生成基准测试现已支持TensorRT加速,内部测试表明该基准测试可以比较准确地反映目前AI PC的实际性能。将拥有Tensor Core的RTX GPU与TensorRT结合后,本地AI PC的生成式AI性能可以得到巨幅的提升,堪称为AI PC带来了新的生产力革命。

02RTX AI生态圈成长迅猛,行业支持度遥遥领先

在本次AI鉴赏会上,NVIDIA邀请了火星时代教育、吐司/Tensor.Art等合作伙伴来发布了AI相关内容,在精彩的分享内容中,可以看到基于RTX AI的AI PC解决方案已经在行业中遥遥领先,成为行业与用户的首选。

火星时代教育发布《NVIDIA TensorRT Stable Diffusion创作加速指南》

《NVIDIA TensorRT Stable Diffusion创作加速指南》是火星时代教育为AI设计爱好者和创作者基于RTX 40 系GPU提升Stable Diffusion创作效率的实操性教程。指南包括安装与设置,加速引擎构建,加速效果对比以及NVIDIA TensorRT在实际商业创作场景的应用(海报设计、电商设计、室内效果图设计、插画设计),帮助使用者在创作过程中借助详细教程和加速工具实现商业创意落地,提升创作效率。指南由火星时代教育AI设计教研团队主要研发,NVIDIA 技术团队提供技术支持,未来将根据应用软件版本优化并迭代升级。

在演讲中,火星时代教育AI设计教研总监吴大吉展示了使用GeForce RTX 40 GPU系列运行SD的性能数据,可以看到在开启TensorRT支持之后,RTX 40 GPU的AI计算效率得到了巨幅的提升,其中RTX 4060甚至得到了接近翻倍的提升。由此可见,对于希望学习AIGC的朋友来讲,选择RTX 40 系列GPU并启用TensorRT支持无疑是最高效的选择。

火星时代教育创始人王琦示:“火星时代是NVIDIA Studio中国区生态合作伙伴,双方共同探索AI软件在设计流程中的辅助作用,并在火星影视学院部分专业引入NVIDIA Studio AI应用做教学试点,在2023年共同开发AI设计方向创作加速的公开课,此次联合发布《NVIDIA TensorRT加速Stable Diffusion创作加速指南》是火星时代和NVIDIA聚焦‘科技+教育’在设计领域的积极实践,充分激发学习者对于科技发展的关注,拥抱AI前沿技术,为个人效率加速,为商业创作赋能

吐司/Tensor.Art发布《个人用户玩转Stable Diffusion 的GPU配置推荐》

吐司/Tensor.Art是行业第一家实现在线生图的AI模型社区(Tensor.Art是吐司的国际版)。致力于紧跟最前沿的AI技术和国际视角帮助AI创作者降低创作门槛。在《个人用户玩转Stable Diffusion 的GPU配置推荐》中,吐司/Tensor.Art聚焦SD 1.5和SDXL 1.0,使用UL Procyon AI完整测试RTX 40 系列多款型号的显卡、笔记本电脑GPU在Stable Diffusion的推理性能表现,其中在UL Benchmark SD1.5 TRT vs. OpenVINO的对比测试中RTX 4090笔记本电脑GPU相对于iGPU(Arc Graphics)有超过27倍的性能提升。 

此外,吐司基准测试中还包括完整LoRA模型在Stable Diffusion中的训练性能,对不同型号RTX 40系显卡和笔记本电脑GPU在Stable Diffusion任务中的性能进行全面评估,旨在为AIGC爱好者在后期LoRA模型训练和设备选择时给予参考。

AI模型平台吐司/Tensor.Art 创始人沈振宇表示:“目前吐司和Tensor.Art上已经有超过16w+的模型数量。此次与NVIDIA联合发布《个人用户玩转Stable Diffusion 的GPU配置推荐》旨在让关注AIGC领域的入门用户以及不同垂类场景的用户在选择RTX AI PC设备进行模型训练和应用时提供客观、公正的配置参考,提升用户使用AIGC的生产效率。”

智谱AI:端云一体大模型助力 AI PC 生产力变革

智谱AI于2021年研发了GLM(General Language Model通用语言模型),同时解决了语言理解和生成方面的挑战,让大模型适用更多任务和场景,也更适应中文语言环境。GLM-130B是一个开放的双语(中文和英文)模型,拥有1300亿参数。据斯坦福大学大模型中心发布的全球主流大模型测评(2022年11月)显示,在超过4000亿个文本标识符上进行了训练的GLM-130B在准确性、公正性上与GPT-3(davinci)持平,鲁棒性和校准误差在所有模型中表现最佳。ChatGLM是基于GLM预训练框架的双语对话模型,采用了独创的多阶段增强预训练方法,包括6B、12B、32B、66B等多种尺寸。同时ChatGLM3 支持多样的加速工具,包括英伟达TRT-LLM框架,使模型性能在合理的精度损失下实现推理加速提升。自2023年3月14日开源后,ChatGLM-6B及其后续版本已获得广泛应用。

在会上,智谱 AI 副总裁吴玮杰就“端云一体大模型助力 AI PC 生产力变革”主题进行了演讲。吴玮杰表示:“大模型加持的AI PC将带来生产力范式革命,让AI生产力普惠每个人。随着端侧算力和大模型能力的演进,支撑AI PC的大模型解决方案应该是端云一体的混合AI。端侧和云侧大模型无缝协同,共同为用户提供智力强大、随时在线、极速响应、安全可信、个性化的AI PC应用。我们的大语言模型 ChatGLM3-6B 支持 NVIDIA TensorRT-LLM 等加速框架,使模型推理性能实现加速提升,让用户在AI PC上可以获得更加流畅的体验。”

同时,吴玮杰也介绍了智谱AI全新推出的GLM-4模型,整体性能再度提升60%,接近GPT-4的表现。具体性能方面,GLM-4英文基础能力平均达到GPT-4大约98.5%的水平,中英文指令跟随能力平均达到GPT-4大约89.5%的水平,中文对齐能力整体水平甚至超过了GPT-4。此外,上下文长度达到了20万字,总结、信息抽取、复杂推理、代码等应用场景得分非常接近GPT-4,128K以内可以做到100%精准召回。同时,GLM-4正式融合了Agent能力,实现代码增强、网络搜索增强、文生图与功能调用四大功能,做到用自然语言定制专属大模型应用。    

AIGC艺术家分享RTX AI解决方案的实战应用体验

在会上,NVIDIA还邀请了业界知名AIGC艺术家来分享RTX AI在实战应用中的案例与应用体验。

数字艺术家 & 策展人土豆人Tudou_Man 表示:“每天有大量AIGC内容涌现,宛如微小的青苔连续改写当下。不久,我们的文明也将被数字所覆盖。通过RTX 40系列AI PC平台的运算加持,震惊之余,我使用RTX 40系列 RTX AI PC创作了《复写苔原》系列作品,RTX 平台为像我这样的数字艺术家提供高效的AI算力加速。我将AIGC作品注入人的思考与灵魂,在不可逆的数据洪流中保持本真。”

Blender 艺术家、AI创作者Simon阿文表示:“AI 如何塑造我们的工作与生活’ 这个在过去听起来是少数大公司才有资格讨论的问题,但在如今这个问题的答案由AI社区和创作者塑造。包括央视春晚AI动画等作品在内,从文字、图像到影像,我的许多探索是基于本地 RTX 4090 完成的。AIGC的可能性是一片蓝海,AI PC是我的帆船。”

AIGC行业资深顾问、艾哎集瑟科技联合创始人言萧表示:“作为一名经常使用AI工具的建筑师,我对RTX平台的加速优势深有体会。它极大提高了AI图形生成软件的性能,特别是如Stable Diffusion等工具,在建筑设计的方案概念阶段尤为重要。通过RTX平台,我们能够快速获得高质量的渲染图像,有效加速设计过程,增强视觉表现力,极大促进了创意的快速迭代和方案的优化。这种技术进步不仅提升了设计效率,也为建筑师提供更广阔的创作空间。”

Morph Studio产品经理、上海国际电影节创投评委海辛表示:“我最开始进入到这个行业,就是从有一块自己的RTX显卡开始的。RTX 40 系显卡给了我探索 AI 在文字、图像、影像可能性的机会。”    

由此可见,NVIDIA RTX AI已经完全深入到了AIGC行业的方方面面,在带来出色的计算能力、强大的AI功能的同时,也推动了整个创意设计行业的快速发展,引领了真正的AIGC革命。

03NVIDIA ACE加持,真正可以嘴炮通关的游戏来了!

还记得“NVIDIA拉面店(KAIROS demo)”吗?这款可以和AI打造的NPC自由聊天互动的展示DEMO在玩家中引起了巨大的反响,可以说它已经掀开了游戏进入AI时代的序幕。

NVIDIA KAIROS demo利用NVIDIA Riva完成语音转文本和文本转语音功能,利用NVIDIA NeMo 为其对话式 AI 提供支持,并利用 Audio2Face在AI助力下通过语音驱动面部动画。这些模组无缝集成到Convai服务平台中,并反馈到UE 5和MetaHuman中,从而让拉面店老板Jin变得栩栩如生。

在本次AI鉴赏会上,NVIDIA展示了更为强大的NVIDIA ACE Covert Protocol DEMO。Covert Protocol 是Inworld AI公司与NVIDIA合作开发的一项全新技术Demo,在AI方面的应用更胜KAIROS demo。Inworld AI引擎集成NVIDIA Riva和NVIDIA Audio2Face,前者可实现精确的语音转换文字,后者可提供逼真的面部表情。Inworld AI引擎采用多模态方法来展示非玩家角色,将认知、感知和行为系统集成在一起,在精心制作的环境中呈现令人惊叹的 RTX 渲染角色,以实现身临其境的叙事效果。

这次AI NPC的数量达到了3名,并加入了对话通关的剧情目标,玩家需要通过和DEMO中三名AI NPC自由对话来解开任务并通关(通过和三名NPC“套话”来获得Martin Laine的房间号就算通关)。AI NPC基于GPT-3.5模型(需要联网),目前支持英文语音对话(也可以手动输入文字)。当然,你就是不打算通关,也可以和NPC一直自由聊天,天南海北他都可以陪你无限地聊下去,而且聊天内容完全符合NPC的人设。此外,由于整个过程都是完全开放的,所以每次和NPC“套话”的内容可能都不一样,这次能够成功的话术,下一次就不一定可以了,这也赋予了游戏无限的可能。如此一来,Covert Protocol DEMO可能成为了历史上第一个真正意义上靠玩家纯“嘴炮”通关的游戏,而在NVIDIA ACE的支持下,这样的游戏方式在未来会成为“常规操作”。

04现场DEMO区体验

在会议现场,NVIDIA还准备了丰富的DEMO机用来实机体验RTX AI的强大功能。

ChatRTX

ChatRTX 使用检索增强生成、NVIDIA TensorRT-LLM 软件和 NVIDIA RTX 加速,将本地生成式AI功能引入到支持RTX的Windows系统中。用户可快速、轻松地将本地文件作为数据集连接到开放式大语言模型(如:智谱AI的ChatGLM3),快速查询与上下文相关的答案。

ChatGLM是基于GLM预训练框架的双语对话模型,采用了独创的多阶段增强预训练方法,包括6B、12B、32B、66B等多种尺寸。同时ChatGLM3 支持多样的加速工具,包括NVIDIA TRT-LLM框架,使模型性能在合理的精度损失下实现推理加速提升。此外,ChatRTX 还将很快增加对语音、图像和新模型的支持。

创作中的AI应用

SD专业工作流:RTX 4090笔记本电脑GPU在复杂的控制工作流和出图质量中表现出真正的生产力,通过人像生成控制模型InstantID,让用户足不出户就能快速通过搭载RTX 40系列GPU的RTX AI PC上由普通摄像头的自拍照生成高质量影棚肖像照。

SD一秒生成8张图:

作为市面上最快的Stable Diffusion计算出图方案,用户开箱即用就能在RTX 4090 D GPU享受到高达每秒8张图的生成速度。使用当前最快的Stable Diffusion加上TensorRT,再配合开发者进一步的性能优化,目前RTX 4090 D GPU最高能实现每秒超过100张图的生成速度,因此Stable Diffusion用户也能像游戏玩家一样通过高帧率享受丝滑的创作体验。

声音克隆:基于 RTX GPU 加速的声音克隆可仅用5秒录音来克隆声音,实现无需训练的个性化声音生成。基于开源的GPT-SoVITS项目,声音克隆快速使用5秒声音样本,根据其发音特征由文本生成个性化语音片段,实现高质量的声音克隆;在RTX AI的加速下,仅仅五分钟就能完成;而基于更多样本(1分钟)的微调训练实现更高质量接近1:1复刻的声音克隆。

实时建筑渲染:在建筑设计领域,通过RTX GPU的加速,实现了秒级的AI实时绘画。结合即致AI自研的全网下载量超50W国内建筑行业大模型,帮助建筑设计师享受AI实时渲染划时代的快捷、便利的同时,依然可以保证极高的出图效果。通过RTX GPU的强大AI性能,用户仅需提供一张清水房照片,就能快速看到AI生成的装修效果。

DLSS 3.5:NVIDIA DLSS 是一项突破性图形技术,可在 GeForce RTX GPU 上利用AI提高帧率并改善图像质量。DLSS 3.5通过AI增强光线追踪表现,尤其是光线重建(Ray Reconstruction),为玩家带来了更加还原真实场景的光线效果。备受期待的《黑神话:悟空》和《永劫无间》也即将支持DLSS 3.5光线重建和全景光线追踪技术,实现画质和性能的大幅提升,为 GeForce 玩家带来极致体验。

05总结:RTX AI引领AI PC技术发展,推动AI应用革命

毫无疑问,NVIDIA在AI领域拥有领军者的地位,RTX AI更是推动了AI在各类设计流程中的应用和发展,大幅提高了设计效率和创意迭代。同时,NVIDIA的AI技术也在游戏领域大放异彩,如DLSS 3.5 技术和NVIDIA ACE Demo则为玩家带来了更高质量和更真实的游戏体验。

此外,NVIDIA与火星时代教育、吐司/Tensor.Art等机构的合作,为AI设计爱好者和创作者提供了实操教程和GPU配置推荐,降低了创作门槛。   

NVIDIA RTX GPU和RTX AI解决方案不但推动了AI PC的进化,为各行业带来了生产力革命,同时也为创作者和玩家带来了当下无与伦比的高效率、高质量的使用体验。而对于希望体验生成式AI,或进入AI行业的用户来讲,NVIDIA RTX 40 系 GPU无疑是当下最佳的选择。   

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部