独家专访:全面进化AI,激发数据要素价值

独家专访:全面进化AI,激发数据要素价值
2023年12月12日 17:55 清博智能

【访谈对象】何俊,北京清博智能科技有限公司副总裁

随着社会进入到了数字化时代,世界瞬息万变,想要快速掌握人们的需求变化,了解发生了什么,是我们大多数人的需求之一。

本期我们采访到了北京清博智能科技有限公司副总裁何俊,跟他聊了聊清博智能在大数据分析能力上的最新进展,走进数据智能的世界。

01

清博智能主要依照怎样的逻辑?

A:我们大数据的特点在清博舆情和清博指数两大产品上就集中体现了。

清博指数:精确性与公平性的典范清博智能的核心产品之一,清博指数,代表了基础数据的精确性与公平性。清博指数利用“纵向数据”,为媒体账号的传播力和影响力提供全面评估。这些数据不仅基于大量学术论证,而且通过精确的指数评估模型,提供对自媒体账号内容传播力的深入分析。

清博舆情:宽广度与时效性的完美结合清博智能的另一核心产品,清博舆情,则优秀地展现了数据的宽广度和时效性,即“横向数据”。这部分数据涵盖了大量平台上全账号的发布数据,还能够跨平台收集信息,力求避免数据遗漏。平台覆盖率的广泛性和数据获取的快速反应,构成了清博舆情的竞争优势。我们在追求数据分析的卓越同时,始终坚守数据隐私协议,保障数据安全。

02

清博对于庞大的数据

如何进行数据的分类界定?

A:在清博,通过数据量级和更新频率,我们将数据分为“静态数据”和“动态数据”两个关键维度;通过数据可检索性与存储特性,我们又将数据分为“热数据”和“冷数据”。我们不仅注重数据的存量,更注重其可检索性,针对不同的使用频率和时效性需求,优化了存储效率的同时,确保了成本效益。这反映了清博在大数据分析方面的高端策略和精确度静态数据:庞大数据存储的标杆静态数据量级代表了公司分析数据的基座,目前已达到令人瞩目的4000亿条记录。这个数字不仅展示了清博智能在数据积累方面的雄厚实力,更是其分析能力的坚实基石。动态数据:日增数据的动态监控动态数据量级则关注日常新增数据的规模,清博智能每天新增分析约5亿条数据。这一数据流动性的高速度体现了公司在实时数据分析方面的前沿技术。冷数据:长期存储的核心资源冷数据,在清博的数据管理体系中,扮演着至关重要的角色。这类数据通常具有较长的时间跨度和较低的检索频率,代表了公司长期积累的宝贵资产。清博智能针对这些冷数据制定了专门的存储策略,确保它们即便在较长时间内不被频繁访问,仍然能够得到安全、稳定的保存。冷数据的管理策略不仅反映了清博智能在数据保护方面的深度思考,也显示出公司对于长期数据价值的重视和深挖潜力。热数据:高效分析的关键要素与冷数据形成鲜明对比的是热数据。这类数据在清博智能的日常运营中占据了中心地位,其特点是时效性强和检索频率高。热数据的管理和分析要求极高的反应速度和灵活性。为此,清博智能采用了先进的技术和算法,确保这些数据能够迅速被检索和分析,以支持公司的即时决策和响应。热数据的高效分析,不仅展示了清博智能在实时数据分析领域的技术实力,也是公司能够在激烈的市场竞争中保持领先地位的关键因素。

这种对数据量级的细致区分和智能化的存储策略,充分展现了清博智能在大数据领域的高级质感和领先技术。通过精准的数据管理和创新的存储方法,清博智能正为行业树立新的标杆。

03

清博相较于其他大数据公司的

优势和特色是什么?

使用了哪些数据分析工具和技术?

A:从数据行业流水线来看,我们将数据分为三类,原始数据(粗数据)、基数据、分析数据。原始数据的价值是比较低的,我们对这部分数据进行分析处理、打标它就变成了基数据,而从市场角度来看,用户需要的数据产品提供的是分析数据。洞察用户的需求是提高数据产品竞争力的关键,因此我们的竞争力其实更集中的体现在对于数据的分析能力上。在数据行业里,清博和头部几家竞争企业也是不分伯仲的。

我们强大的数据分析能力关键在于分析师团队与AI结合,以及我们对数据长年的经验积累。清博在武汉的研究院规模是比较大的,里面不乏有很多资深数据分析师。大量的数据通过机器学习并分析后,当出现报错或出现新的匹配规则时,再由人工巡检验证,最后给出分析研判,保障每一条数据的准确性。

此外,AIGC的接入极大提升了我们数据分析的效率。最大的帮助体现在两方面,首先底层代码这块,AI可以帮助程序员转译不同的语言,因为不同程序员擅长的代码语言不一样,例如AI就可以帮助他们把Java语言、C语言变成Python语言,且这个准确度甚至比简单的外语翻译还高。另外,在在短时间内分析非常量大的数据时,AI批量分析的能力确实减少了很大一部分人员消耗。

清博大数据板块历经9年积累,将无数非结构化的数据结构化后,纳入我们的数据库。对历史规律的经验总结是需要时间来不断完善的,在这个过程中我们成立了攻坚组攻克了很多难题,9年积淀的数据和经验也是我们的核心优势

04

清博清博未来的数据技术面临的

挑战与发展目标是什么?

会在哪些方面取得突破?

A:在未来的数据技术领域,我们团队已经做好了颇具信心的准备,致力于在以下几个关键领域实现突破。

提升数据广度和时效性:持续的领先追求首要任务是进一步提升数据的广度和时效性。这一目标没有尽头,要求我们持续改善和创新,以确保在整个行业中保持领先地位。我们深深认识到,一旦落伍,便难以再次领先。因此,不断增强数据分析能力和更新技术,是保持竞争力的基本策略。海量数据噪音净化:深化分析能力第二个挑战是海量数据中的噪音净化。在庞大的数据海洋中发现问题、识别关键信号,提供给用户真正需要的答案——这个目标,对于整个行业都是巨大的挑战。清博智能致力于解决这一问题,以提供更加精准和高效的数据服务。AIGC与大数据深度融合:技术融合的前沿第三个发展目标是AIGC和大数据的深度融合。今年被视为AIGC发展的元年,而清博智能将AIGC与大数据的结合作为终极目标。我们的目标是,当用户表达哪怕模糊的需求时,我们的产品,也能直接从底层数据中提取分析,提供清晰直观的答案,而不必从海量数据中筛选。我们团队已经从学术和技术角度进行了大量研究,确保在这一领域保持领先地位,成为业界的标杆。

0条评论|0人参与网友评论
最热评论

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部