联通沃卡惠:研究人员使用AI研究反射与原始图像有何不同

联通沃卡惠:研究人员使用AI研究反射与原始图像有何不同
2022年10月07日 10:16 沃卡惠

康奈尔大学的研究人员最近利用机器学习系统来研究图像的反射与原始图像的不同之处。正如《科学日报》报道的那样,研究人员团队创建的算法发现存在明显的迹象,与原始图像不同,图像被翻转或反射。

康奈尔科技大学计算机科学副教授Noah Snavely是该研究的资深作者。根据Snavely的说法,该研究项目始于研究人员对图像在反射时的明显和微妙方式的不同之处产生了兴趣。Snavely解释说,即使是乍看之下非常对称的事物,在研究时通常也可以区分为反射。据《科学日报》报道,Snavely说,您可以通过收集信息的新方法获得的发现让我很感兴趣。

研究人员专注于人的图像,用它们来训练他们的算法。这样做是因为面部看起来并不明显不对称。据报道,当对将翻转图像与原始图像区分开来的数据进行训练时,人工智能在各种类型的图像中实现了60%到90%的准确率。

AI学习到的翻转图像的许多视觉特征非常微妙,人类在查看翻转图像时很难辨别。为了更好地解释人工智能用来区分翻转图像和原始图像的特征,研究人员创建了一个热图。热图显示了AI倾向于关注的图像区域。据研究人员称,人工智能用来区分翻转图像的最常见线索之一是文本。这并不令人惊讶,研究人员从他们的训练数据中删除了包含文本的图像,以便更好地了解翻转图像和原始图像之间更细微的差异。

从训练集中删除包含文本的图像后,研究人员发现人工智能分类器专注于图像的特征,如衬衫来电者、手机、手表和面部。其中一些特征具有明显、可靠的模式,人工智能可以对其进行磨练,例如人们经常用右手拿着手机,衬衫领子上的纽扣通常在左边。然而,面部特征通常是高度对称的,差异很小,人类观察者很难察觉。

研究人员创建了另一个热图,突出了人工智能倾向于关注的面部区域。AI经常使用人的眼睛、头发和胡须来检测翻转的图像。由于不清楚的原因,人们在拍摄照片时通常会稍微向左看。至于为什么头发和胡须是翻转图像的指标,研究人员不确定,但他们推测,一个人的惯用手可以通过刮胡子或梳头的方式来揭示。虽然这些指标可能不可靠,但通过将多个指标组合在一起,研究人员可以获得更大的信心和准确性。

需要在这些方面进行更多的研究,但如果研究结果一致且可靠,那么它可以帮助研究人员找到更有效的方法来训练机器学习算法。计算机视觉AI通常使用图像的反射进行训练,因为它是增加可用训练数据量的一种有效且快速的方法。分析反射图像的不同之处可能有助于机器学习研究人员更好地了解机器学习模型中存在的偏差,这些偏差可能导致他们对图像进行不准确的分类。

正如Science Daily引用的Snavely:

“这为计算机视觉社区带来了一个悬而未决的问题,即,什么时候可以进行翻转以增强数据集,什么时候不可以?我希望这能让人们更多地思考这些问题,并开始开发工具来了解它是如何影响算法的。”

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部