金融界 2024 年 12 月 2 日消息,国家知识产权局信息显示,辽宁奇点教育科技有限公司申请一项名为“用于经济大数据中文本数据的泛化处理保护方法”的专利,公开号 CN 119046469 A,申请日期为 2024 年 11 月。
专利摘要显示,本申请涉及数据泛化技术领域,具体涉及用于经济大数据中文本数据的泛化处理保护方法,该方法包括:获取文本数据;利用文本属性向量训练孤立森林,基于特征向量之间的类内差异确定特征向量的类内偏差值;基于类内偏差值的分布离散程度确定聚类簇的内容复杂度,结合聚类簇内特征向量的相似程度确定聚类簇之间的内容可转换度;基于内容可转换度确定孤立树的投票权重,得到文本属性向量的异常得分;基于异常得分筛选需要泛化处理的文本数据,得到泛化处理结果。本申请通过对同类内容下文本数据内容差异以及可互换组合出现在不同数据源经济大数据中特点的分析,优化孤立森林算法,提高泛化处理的效果,降低经济大数据中文本数据被攻击的风险。
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有