轻量大模型开发资源门槛大降 英特尔至强6携火山引擎夯实智能底座

轻量大模型开发资源门槛大降 英特尔至强6携火山引擎夯实智能底座
2024年12月27日 13:32 IT时报

IT时报记者 贾天荣

在近日举办的火山引擎2024 FORCE原动力大会上,英特尔与火山引擎共同发布搭载英特尔至强6性能核处理器的第四代通用计算型实例g4il,为传统企业级应用、AI应用和未来更复杂的应用构建坚实算力基石。

《IT时报》记者了解到,同样在英特尔至强6处理器的加持下,对于轻量级大模型应用开发场景,在火山引擎上为开发者提供了g4il云实例,相较于GPU实例,资源门槛直降50%。

在应用层,英特尔也携手扣子Coze推出支持端云协同的智能体开发平台——Coze-AIPC,并围绕与火山引擎在AI时代云计算的多领域生态合作成果进行展示。

“近两年,我们见证了基础通用大模型的能力上限不断被刷新,但随之而来的算力成本、功耗、技术门槛、行业落地等问题与挑战也越来越突出。”英特尔市场营销集团副总裁、中国区云与行业解决方案和数据中心销售部总经理梁雅莉表示,英特尔将持续与火山引擎携手打造高性能异构算力。

底层算力是推动AI技术释放巨大潜能的关键要素之一。得益于至强6性能核处理器的领先性能,本次英特尔与火山引擎共同发布的第四代通用计算型实例g4il,提供了丰富的功能,实现I/O能力提升,也创新地进行架构升级。其在使单机CPU核心数翻倍的同时,实现计算密度大幅提升,并通过双单路架构,大幅降低爆炸半径,实现高稳定性。

现阶段,其在视频转码、Web应用、和数据库应用方面分别实现了17%、19%和20%的性能提升。

对此,火山引擎云基础产品负责人罗浩指出,“得益于英特尔至强6性能核处理器的强大性能,火山引擎全新第四代通用计算型实例g4il显著提高了计算效率和系统稳定性,为用户提供一个功能全面、性能卓越、可靠且具有高可扩展性的计算平台。”

值得一提的是,该全新实例不仅能够实现镜像平台的分钟级部署能力,极大地降低了开发门槛,为AI应用的快速开发和部署提供了强有力的支持;而且其通过火山引擎的深度优化,显著提升了LLM的性能。

此外,英特尔至强处理器也为火山引擎带来了更高的数据存储效率和可靠性。火山引擎云存储引入了至强处理器的英特尔数据保护与压缩加速技术,以提升数据压缩和解压缩效率,实现优于软件LZ4算法的压缩率和更低时延。QAT硬件加速生成CRC32校验码,确保数据完整性,并支持AES-XTS模式的对称加密,增强数据可靠性。此外,火山引擎推出面向云上AI场景的端到端机密计算安全方案,通过优化系统底层支持英特尔可信域拓展和GPU机密计算,保障数据处理安全同时保障性能。

对AI技术而言,落地既是其生命力的体现,也是推动行业和社会发展的关键所在。其中,在当下关注度颇高的智能体应用领域,英特尔与全球领先的智能体开发平台“扣子”合作,推出增强版的扣子智能体开发平台——Coze-AIPC。其引入一款基于英特尔PC端平台的扣子App,并通过创新的“端插件”机制,使如PC操控、本地知识库等AIPC的端侧能力可以被无缝嵌入扣子大模型与工作流,从而为开发者提供便捷、低时延和具备成本效益的端云协同智能体新体验。

现阶段,英特尔正凭借涵盖算力基础设施、平台基础设施、数智基础平台在内的企业数据和AI架构的解决方案,为多元应用注入全新动力。在大语言模型方面,英特尔推出基于其全栈硬件产品和软件优化的AI推理解决方案,在优化AI推理性能的同时,满足不同行业需求。在生命科学领域,英特尔至强处理器凭借显著提升的内存带宽及一系列软硬件优化举措,延展了AlphaFold2的应用场景,使科研机构和企业能够以更经济、高效的方式进行蛋白质结构预测,推动了基于AI的药物研发探索。

在视频云领域,英特尔锐炫显卡提供高性价比解决方案,覆盖视频编解码、分析、游戏渲染、LLM和AIGC等应用。在企业知识库方面,英特尔通过技术支持,在简化数据管理的同时,用先进的检索技术理解查询的深层含义,并快速提供准确的答案,提高服务的效率和精准度。

如今,数字世界的AI力量正深刻改变着物理世界的面貌。英特尔表示,在此过程中,英特尔也将持续与火山引擎展开深度合作,为广大行业用户带来更强大的算力和更丰富的解决方案,从而助力AI应用落地。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部