世界互联网大会|美创数据认知与分类分级系统重磅发布

世界互联网大会|美创数据认知与分类分级系统重磅发布
2024年11月20日 10:11 杭州美创科技股份有限公司

11月19日至22日,2024年世界互联网大会乌镇峰会在浙江乌镇盛大召开,浙江省网络空间安全协会连续第三年成功举办“网络空间安全治理”主题的新产品新技术发布活动。美创科技携新产品-数据认知与分类分级系统(AICogniSort)惊艳亮相,成为现场焦点。

AICogniSort

当今,数据被视为新型生产力,国家层面的《数据安全法》与《个人信息保护法》等法律法规均强调了数据安全分类分级的重要性。金融、政务以及工业等领域的监管机构也相继发布了各自行业的数据分类分级指南或指导意见,旨在推动这些措施的有效实施。然而在企事业单位实际落地数据分类分级过程中,仍面临着诸如行业数据辨识困难、分类标准不易掌握、实施周期较长及成本较高等挑战,这导致高质量的数据分类分级成果的实现仍具有一定的门槛。

“AI+数据安全分类分级”为上述问题提供有效解决方法。美创科技数据认知与分类分级系统(AICogniSort)是一款致力于通过AI智能化技术,安全、高效、准确发现并识别国家、个人和组织安全所必须的各类分级数据的产品,通过精准打标,形成符合行业诉求的资产目录,满足安全合规、以及数据流动的安全防护需求。

核心功能之元数据梳理

传统的元数据梳理流程是数据源的添加、扫描、采集、语义识别。通过引入大模型,美创数据认知与分类分级系统(AICogniSort)在元数据梳理上做到了三个增强:

一、增强支持非结构化数据的分类分级:大模型基于自然语言理解能力,有非常好的上下文、切词、分词能力,可识别出区中的文本,判断数据的标签。

二、增强数据关系的梳理能力:对海量表、字段、样本数据进行摸底梳理后,大模型可以更好的关联到字段之间的关系,以知识拓扑的方式进行呈现

三、增强识别语义的精准性:不管字段是拼音的、还是拼音首字母缩写的,大模型都可通过样本数据、表名、表注释、字段之间的上下文更精准的识别语义。

核心功能之分类分级标准梳理

尽管此前已有国标、行标指导,但是仍然面临数据分类的划分较粗略,或定义了共性的业务分类,无法完全直接应用。而且根据常规数据分类分级项目经验:分类分级标准基本都需要进行个性化调整会占1/3实施周期。大模型加持后,标准的输出可以缩短到1天完成,大量节省数据分类分级标准梳理时间。

核心功能之自动化分类分级

传统模式下,通过一个字段含义绑定一个分类和分级,实现自动分类分级的方式有两个弊端。一是横向的可复用能力比较少,二是字段含义的数量已达千万级,无法通过人工维护。

而数据认知与分类分级系统(AICogniSort)基于大语言模型的自动化分类分级,对于标准没有分类说明的,首先会对每个分类含义的补充和识别,然后进行字段的分类和分级。通过传入行业信息、业务系统、表说明、字段含义等表,基于对语义和上下文的理解,高效匹配分类,同时还可通过分类依据和置信度,让结果具有可解释性和可信任性。

核心功能之分类分级

美创科技数据认知与分类分级系统(AICogniSort)在完成分类分级后会输出3个重要清单:

一、重要/核心数据清单,基于合规需求,满足数据上报要求。

二、分类分级结果清单,有助于精细化数据安全管控。

三、数据资产清单,基于业务层面数据目录,方便取数、用数,释放数据价值。整体帮助用户构建可视化、可检索、可管理的数据目录。

通过数据认知与分类分级系统(AICogniSort)的分类分级结果可以用于数据安全治理、数据安全防护、数据上报、数据运维等多个层面,真正赋能数据应用百态。

此外,数据认知与分类分级系统(AICogniSort)形态是基于高算力的一体机,日均处理字段高达45万个。例如,对30万字段的医疗数据进行分类分级应用,整个实施周期包括分类分级确认仅需4天即可完成,而一般分类分级工具最少需要花费60天。

部署、应用美创科技数据认知与分类分级系统(AICogniSort),低成本、高精度、高效能完成分类分级任务。我们希望在AI的赋能下,分类分级工作能够以常态化和可持续的方式,不断为业务数据安全赋能。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部