头部人工智能训练数据专业提供商海天瑞声即将启动申购

头部人工智能训练数据专业提供商海天瑞声即将启动申购
2021年07月30日 18:34 人民资讯

    本报讯 8月3日,北京海天瑞声科技股份有限公司(以下简称“海天瑞声”)将进行网上网下申购。此次发行1,070万股,占发行后总股本的比例25%。申购价格36.94元/股。

    在AI产业链中,算法、算力和数据共同构成技术发展的三大核心要素。在当前人工智能行业发展进程中,有监督的深度学习算法是推动人工智能技术取得突破性发展的关键技术理论,而大量训练数据的支撑则是有监督的深度学习算法实现的基础,训练数据已成为算法模型发展和演进的“燃料”。

    全球基础数据服务行业处于快速成长期,市场规模具有较大的增长空间。当前我国人工智能产业加速发展,2019年,中国人工智能行业的融资总额约为166亿美元,占全球的44.39%,位居全球首位。应用场景的创新和机器学习算法的流行直接带动了训练数据需求的大幅增长。

    针对AI产业对训练数据的需求,自2005年成立以来,海天瑞声始终致力于为AI产业链上的各类机构提供算法模型开发训练所需的专业数据集。在多年的行业实践过程中,海天瑞声始终注重充分挖掘和培养自身的核心技术优势,自主开发了一体化数据处理平台,在基础研究、平台工具、训练数据生产三个维度均积累下核心技术。除拥有先进的算法与数据处理技术和自主开发一体化数据处理平台外,海天瑞声还在语音语言学基础研究方面有深厚积累。通过多年经营积累,公司已具备全球160余个语种/方言的训练数据设计开发能力,并掌握了N元语言模型训练与优化技术、文本正则化技术、基于语言模型的文本易读性评测技术等算法技术,可结合音素均衡、语料主题、覆盖领域、发音人属性、设备特征等因素综合设计满足算法模型开发、训练、拓展需要的训练数据集。

    海天瑞声高度重视并坚持科技创新,且十分重视研发团队的知识结构和梯队建设,现有团队皆为相关专业硕士与博士以上成员构成,专业扎实、技术先进、经验丰富。截至目前,海天瑞声已获得24项发明专利授权、1项实用新型专利授权及1项外观设计专利授权,涉及基础算法研究领域、数据处理领域等,技术储备充足。截至2020年12月31日,公司拥有760余个类型丰富的自有知识产权的高品质工程化训练数据集,能够为我国AI自主技术研发提供高质量的训练数据保障。

    基于丰富的技术积累和行业经验,海天瑞声提供的训练数据产品及相关服务已覆盖三大技术领域、多个语种/方言和多项应用场景,赢得了阿里巴巴、腾讯、百度、微软、三星、亚马逊、科大讯飞、商汤科技、中国科学院、清华大学等众多大型优质客户的认可,核心技术、产品资源、优质客户等竞争优势逐步凸显。

    凭借优秀的产品品质、先进的技术和周到的服务,海天瑞声已经成为中国基础数据服务行业的头部企业,市场份额位居行业前五,同时在中国语音类基础数据服务领域排名第一。在持续多年的研发投入和努力下,海天瑞声荣膺多项资质荣誉,先后获得国家重点软件企业、国家高新技术企业、中关村高新技术企业等资质,参与了国家、行业标准的起草工作。2020年,获评工信部国家专精特新“小巨人”企业;2021年,获评工信部“新一代人工智能产业创新重点任务揭榜优胜单位”,系全国唯一一家获此殊荣的AI数据企业。

    海天瑞声将以本次IPO为全新的起点,未来将继续以数据为核心稳步发展,持续依靠自身技术积累,通过引入资本和人才等手段升级技术水平、扩大公司业务规模,持续建设、优化、创新训练数据服务,完善公司的产品体系,提升通用训练数据产品、训练数据定制服务等主线业务的领先优势,增强数据驱动人工智能行业发展的能力。(记者/李乔宇)

(编辑 李波)

来源:证券日报网

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部