金融界2024年12月2日消息,国家知识产权局信息显示,中电信人工智能科技(北京)有限公司申请一项名为“文本聚类分析方法、系统、电子设备及存储介质”的专利,公开号 CN 119046462 A,申请日期为2024年7月。
专利摘要显示,本发明公开了文本聚类分析方法、系统、电子设备及存储介质,包括:获取待处理的第一文本数据,基于Transformer和TF‑IDF分别对各第一文本数据进行向量化处理得到对应的第一文本向量和第二文本向量;根据第文本向量和第二文本向量确定两个第一文本数据之间的文本距离;根据文本距离对第一文本数据进行层次聚类,得到多个目标文本簇;确定大模型的最大token长度,根据最大token长度筛选得到各目标文本簇的目标聚类子层,根据目标聚类子层确定各目标文本簇的目标文本内容,根据目标文本内容提炼得到文本总结信息。本发明提高了文本聚类分析的准确性和全面性,也提高了文本聚类分析的效率,可应用于文本处理技术领域。
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有