日前AI初创公司百川智能方面宣布推出“1+3”产品矩阵,即包含全链路优质通用训练数据、Baichuan4-Turbo和Baichuan4-Air两款模型,以及全链路领域增强工具链在内的一站式大模型商业化解决方案。据官方透露,该方案能够帮助企业以最低的成本实现效果最佳的私有化部署。
据悉,由于直接应用通用模型无法达到理想效果,因此企业往往必须对模型进行定制化优化、使其适应特定领域和场景需求。为了解决企业难以获得与原模型高度匹配的通用训练数据这一关键问题,百川智能方面将自用的优质预训练数据、SFT微调数据、强化学习中的通用训练数据,以及自研的超参自动化搜索和调优技术、数据动态自适应配比技术等统一封装,打造了一套全链路优质通用训练数据方案。
根据百川智能方面公布的信息显示,这一通用训练数据不仅与Baichuan4-Turbo、Baichuan4-Air的数据分布高度一致,还能够与企业私有数据混合微调,使得模型在多场景下的可用率得到极大提升,其中在金融、教育、医疗等场景的专业细分任务平均可用率高达96%。
而在成本方面,Baichuan4-Turbo部署成本和Baichuan4-Air推理成本均为行业同梯队最低,其中Baichuan4-Turbo在文本生成、知识问答、多语言处理、数据分聚类等核心能力上均有显著提升,只需2卡RTX4090的算力即可部署,并且在实现首Token速度较Baichuan 4提升51%、Token流速提升73%的同时,推理成本也只有后者的15%,而Baichuan4-Air的推理成本更是仅有Baichuan 4的1%、百万Token仅需0.98元。
此外为了解决部分企业稀缺专业人才、模型调优技术门槛高等痛点,百川智能还推出了简单易用的全链路领域增强工具链。据了解,这一工具链集成了数据抓取、数据清洗、数据增强、模型训练、模型评测、模型压缩和模型部署等诸多工具,企业可直接根据需求自由选择相应工具,对模型进行加密部署和训练。
此外值得一提的是,该工具链还通过大量适配工作解决了不同硬件的适配问题,目前能够高效适配英伟达RTX4090、A、H系列、华为昇腾、寒武纪、高通、MTK、天数等多种主流算力芯片。
【本文图片来自网络】
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有