机器学习到底是个什么鬼?为什么都用猫的图像来做训练呢?

机器学习到底是个什么鬼?为什么都用猫的图像来做训练呢?
2020年07月24日 12:03 梦想心视角

现在在IT圈里有很多的专业技术名词,有些躺在地上被IT宅男、技术大牛们不断的细化、具体化,有些被外界的风越吹越高,迷惑了众生。其中近些年被不断的提出的热词中,机器学习就是其中一个比较热的专业名词。

那么机器学习到底是个什么鬼?

机器学习

机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。是专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能的一门知识。它是人工智能的核心,是使计算机具有智能的根本途径。

这个定义说明是不是相当的专业,但是,对于大部分人来说都看不懂啊。实际上对于有教育孩子经验的人应该更容易理解,因为所谓的机器学习,简单来说,就是使用计算机模拟人对世界认识的过程。

相信大家都见过,或经历过看图识字(物)的场景。一张张写着某个字或词的小卡片,或者画着某类物品的图片,被家长或老师拿出来在孩子们的眼前晃来晃去,同时用声音告知孩子们发音……长期重复的这种训练,教会了孩子们在下次见到此类字或物品的时候可以直接在脑海中识别出来,同时用语言进行表达。

而机器学习就是通过计算机,在一些软件上,使用一系列算法,模拟人类的这一教育场景,从而达到将相似的物品信息输入计算机后,可以正确识别其内容。也就是说,通过“看图识字”的训练,让机器获得对外部世界的认知能力。

机器学习的“看图识字”,就是需要从大量的样本数据中获取知识,包括具体的规律和特征,从而用来进行实际的推断和决策。而其获取的知识被称为模型,这个过程被称为模型训练。比如对于“猫”的图像的识别,把各种各样的猫的图像作为样本数据进行机器学习,最后得到一个比较好的知识模型后,用来对新的猫的图像做出识别,给出“是”或“否”的答案。

机器学习的发展过程主要是各种相关的算法的发展,直到1980年起机器学习成为一个独立的方向开始算起,到现在已经过去了40年。总体上,机器学习算法可以分为有监督学习,无监督学习,强化学习三种类型,这里不细说了。

机器学习是人工智能的一个分支,同时也是人工智能的一种实现方法,但机器学习并不是人工智能一开始就采用的方法。从人工智能的角度来说,经历了逻辑推理、知识工程、机器学习三个阶段。如此,这些年随着人工智能的热潮,机器学习也就开始广为人知了。

为什么是猫

翻遍了相关资料,也没有找到对这个问题的权威解释,充分说明了提出这个问题的人的角度的刁钻(哈哈)。好吧,那我就大胆猜测一下。

据称现在全世界范围内,人们养猫的数量已经三倍于“人类最好的朋友”狗了。美国大约三分之一的家庭拥有一只或更多的猫咪,而在英国有四分之一多的家庭。这充分说明了在机器学习的领域,猫的被选择几率就是狗的三倍了。

另外,猫的体型相对要比狗合适,随时可以进行拍照;据说还具有“九条命”的特性哦,可以作为长期的训练数据来源。而选用植物,花开花落,季节更替,照顾不周就要枯萎,太花心思了。有那时间还不如撸撸猫呢,那还是算了吧。

机器学习中诞生于1967年的kNN算法,是一种基于模板匹配思想的算法,简单有效,至今仍在被使用。而kNN算法中有一个非常著名的试验——kNN猫狗分类试验,估计很多学习机器学习相关算法的人都接触过。其中猫狗的原始数据很容易就可以从网络上进行下载,而且微软就提供相应的下载包哦。

总之,大家都用“猫”的图像来说明自己的算法、模型的识别率有多高,你拿“狗”的图像来说明,是不是不太具有可比性呢?再加上猫的各种萌态,吸引着人们不断的去拍照留存;而且其大小合适、可随时抓取的特性,还有现成的数据源,你不选猫选哪个。要知道,搞研究的人在生活上来说还是比较懒的啊。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部