作者|© 王颖
编辑|©蛋总
我被大数据杀熟了,怎么办?
“我和朋友一起买同一款项链,要一起下单时才发现她那边显示的价格居然比我便宜三十块!”
“在网上买水果,同事那边显示火龙果0.99元,然而同一时间我的显示6.9元。询问客服先是说限购,又说同事是新人,最后官方也没有解释清楚,我去投诉也被以凭证不充分取消了。”
“在淘宝买口罩,同样的独立包装20个,我这显示68元,朋友那显示98元,价格差距大。”
“大数据杀熟”的话题已经不是第一次引起争议了,被投诉最多的就是电商、外卖和打车。在黑猫投诉上,至今还有2019年1月网友提交的投诉没有被处理。今年3月,复旦大学孙金云教授花费近50000元打车800次,实锤大数据杀熟的新闻又一次把这个话题推上了风口浪尖。
在网民对“大数据杀熟”现象发出不满与谴责后,终于有官方回应了。4月8日,唯品会、京东、美团、饿了么、每日优鲜、盒马鲜生、携程、去哪儿网、如祺出行和滴滴出行共10家互联网平台签署承诺书称:“不价格欺诈、不利用数据优势杀熟。”
“我们的推荐算法和其他内容平台不同,我们是根据不同人的出行方式推荐最优的出行路径和最省钱的方式,推荐系统是不断迭代的,不可能一下子解决所有的问题。”出行领域的大数据算法工程师告诉探客「Tanker」。
那么,这些算法如何一步步融入了我们的日常生活?“推荐算法”对商家和用户来说又存在哪些优势和弊端?作为互联网用户,我们又该如何最大程度的保护自己的数据隐私?
1、算法让你无所遁形
企业是如何用数据算法让你“一览无余”的?
“(企业)通过算法和行为和猜测出用户隐秘的、没有和平台明确说明的,比如购物兴趣和其他行为兴趣。通过行为去猜一个人的兴趣或者购物倾向的概念本身并不新鲜,过去算卦的就会通过与对方的交谈和穿着猜测出信息,他们把这个叫做‘把黄’。”《计算广告》作者刘鹏在科普视频中形象地解释了推荐算法的基本逻辑,他的另一个身份是知乎大V“北冥乘海升”,他曾在某科技公司负责大数据变现相关业务。
除了科技圈的专业人士现身说法外,学术圈的科研团队也进一步验证了推荐算法的“神机妙算”。
2020年,孙金云教授带领20多人的团队在北京、上海、深圳、成都和重庆做了800多次实地调查,花费了近50000元打车费得出了一个惊人的结论,那就是用户的手机被打车软件分为三六九等,手机越贵打车越贵。
大数据通过你用什么品牌的手机就判断了你的消费能力,甚至为你量身定制了收费标准。这就是千人千面的互联网吗?
你觉得手机还有多少电量是隐私吗?大多数人可能都会说不。但其实,电量反映了一个非常重要的信息——如果手机电量一直是满的或者一直在增加,那就说明手机处于充电状态,那用户大概率是在室内。
此外,手机里用来测量我们步速、判断运动姿势的传感器陀螺仪,则可以判断用户的运动状态,你是在走路、跑步、开车还是坐地铁都逃不过它的“法眼”。
“如果一部手机的电量总是满的,就可以判断它插在充电线上,从速度上又可以判断出是在开车,而且这个状态每天可以持续十个小时之久,那么就可以判断这个人的职业是出租车司机。”
“再比如,你觉得手机的系统有没有可能知道你的工作地点和家庭地址?如果想知道你在哪里上班,系统只要每天早上十点钟对你进行一次采样,如果发现一个月中有20天你都在同一个地点,那么基本就可以断定你的工作地点了。同样的,如果把采样时间放在晚上十二点,就可以得出你家在哪里的结论。”刘鹏通过两个简单的例子阐明了大数据是如何对个人信息了如指掌的。
在某种意义上讲,今天的移动设备已经成为了你的一个“器官”,除了睡觉外,你几乎想象不出哪个场景可以不带手机。既然是一个器官,它就有可能泄露你大量的隐私,毕竟手机上有大量的传感器,可以了解很多个人信息,有些信息的获取途径是非专业人士根本设想不到的。
“我想让人们知道的是,他们在网上做的一切都被监控着、追踪着、评估着。你所做出的每一个行为都被小心翼翼地监控着、记录着,具体到你停在哪一张图片上看了多久可能都被记录了下来。”Twitter前高管Jeff Seibert在纪录片《监视资本主义:智能陷阱》中说。
算法可能比你还了解你自己,它知道你的喜怒哀乐,了解你是内向还是外向,掌握着你的所有个人信息,还有什么比这更让人胆战心惊的事?
2、陷入“算法陷阱”
诚然,有人说算法推荐的东西更合自己的心意,节省了挑选的时间;但也有人说,我们不过是掉进了一个“算法陷阱”。
我们不妨先来看看,算法是如何更聪明地了解我们的偏好,并作出相应的推荐。
“通过数据可以判断你是不是价格敏感的人,以电商为例,很多卖家会在一个平台开十几家店,同样的商品在每家店铺售价都不同,然后根据你的消费能力,算法就会把你能承受的价格推荐给你。价格歧视是不可能消除的,这违反了商业的本质,只是说在互联网的条件下实现它变得更容易了。”刘鹏告诉探客「Tanker」。
技术公司收集了用户的数据后,会做出预判用户行为的模型,数据越多这个模型就会越来越精确。每个人在屏幕上点击的每一下,无论是点赞、不感兴趣或是喜欢等等,这些数据都会成为塑造那个为你量身定做的模型的资料库。
毕竟在市场竞争中,一旦拿到了更多的用户数据,做出了更精确的模型,公司就有机会占领更大的市场空间。
“互联网的推荐逻辑主要看你的目标函数是什么,比如内容推荐,是要让点击率更高还是浏览时长更长,或者是让用户的满意度更高,目标函数不同各家的推荐逻辑会有所不同。在不断的正向反馈后,算法的精度会越来越高,推荐的也就会越来越精准。”刘鹏对探客「Tanker」介绍到。
互联网的出现让很多人感受到了便利,但技术是把双刃剑,系统对你的了解越多,大数据推荐给你的东西就会越精准,也就会让你把更多时间花在他们的应用上,让你越来越沉迷手机。
在这一方面,目前流行的社交软件也多使用推荐算法来吸引用户的注意力,最终让用户陷入“越刷越久”的状态里。
例如,在社交平台中的点赞、评论这些短期信号能让人得到心理上的满足,这种满足的感觉对人来说是一种“奖赏”,得到了奖赏后人们就会期待下一次能有更大的满足感。这就是人们沉迷于社交网络的重要原因之一。
“美国青少年群体中出现了大幅增长的抑郁和焦虑,出现自残甚至自杀入院的青少年人数急剧上升,10岁到14岁女孩中出现自残行为的比例甚至增加了151%。这个增长模式指向了社交媒体。”纽约大学斯特恩商学院社会心理学家Jonathan Haidt博士表示。这是整个社会落入“算法陷阱”的另一个方面。
1996年之后出生的孩子从初中阶段便开始使用社交媒体,00后更是被称为“互联网土著”,这些年轻人对互联网生活更熟悉,也更加容易因网络环境而产生焦虑、脆弱或抑郁的情绪。此前已有调查表明,不少年轻人有“手机焦虑症”,一旦手机不在手边便会陷入焦虑之中,觉得无所适从。
从一定程度上看,这种新式症状出现的原因之一,便是算法更吸引人们沉浸于手机应用中,让人产生“玩手机很快乐”的感受,手机让人的生活更便利,算法让人更沉浸其中,最终人们就离不开手机上的虚拟世界了。
3、正确认识推荐算法
客观来说,任何一项技术创新,都难逃利弊共存的局面,推荐算法也如此。
“首先我们不能把它妖魔化,如果今天不能通过数据来了解你的偏好,那你接收到的信息流会非常混乱,使用体验也会更差。人们担心隐私被利用,但其实使用数据的目的只是为了给你提供个性化的内容和广告,用户其实没有任何损失,平台也不会把你的数据拿出去交换或者卖掉,从经济利益的角度也不值得他们做这些事,这个投入产出比是不平衡的。”刘鹏从企业的角度向探客「Tanker」解释道。
事实上,我们国家对于数据的使用是有一定规范标准的,有些边界是不能触碰的,比如用户的电话号码、E-mail和身份证号等。对很多人来说,其实数据泄露的风险不是来自这些大平台,而有可能会发生在一些小平台,或者公司中的个人,比如某个能看到数据的员工把你的快递地址偷偷从数据库里倒出来卖掉。
“通过法规不可能彻底解决数据保护的问题,更多的还是要靠技术手段。比如对核心的字段加密,保证内部的工程师也看不到数据信息。”刘鹏告诉探客「Tanker」想真正解决数据保护问题,还是要依靠技术手段。目前,在数据安全保护的问题上,BAT等企业都有团队在做相关加密技术的研发。
此外,还有一个问题困扰了大家很久——应用程序真的会监听我们吗?这是推荐算法的一种手段吗?
“这件事原理上是可能的,但实操性很差。如果软件要全天候地侦听就需要在App内部打开录音功能,这种情况耗电是非常高的,你的手机很快就会没电,我个人认为是不可能的,如果是文字和输入法还有可能。”刘鹏从专业的角度为我们解答了这个问题。若用户依然对这个问题担忧,或许可考虑在手机设置中关闭某些软件的麦克风权限。
另外,很多用户还对电商平台的推荐算法存在一个疑问——为什么我们买过的东西还会一直推荐?难道算法不知道我们已经买了这个商品吗?这是它还不够智能的表现吗?
“其实,这是因为很多用户的重复购买率很高,从技术角度讲,平台让算法不再推荐用户已购买的东西很容易,但从盈利的角度讲,重复的推荐是非常有效的。”刘鹏对探客「Tanker」表示。
从本质上来说,数据和算法本身是为了让平台能更精准地向目标用户推送,让使用者有更好的体验,但技术发展的过程中一定会遇到各种各样的情况,不同企业也会根据需求的不同而制定不一样的推荐逻辑。
也许一个算法会导致社会的两极分化,甚至让你被操纵,无法从算法为你创建的模型中逃离,掉进“信息茧房”。但在一定程度上看,算法也在为我们的生活提供便利。
我们真正需要的是,科技行业研发出更好的技术手段规避现存的问题,同时制定和运行算法的人对自己的行为有更高的道德要求,政策法规有更严密的条例对人们的数据安全进行保护,用户能有更广阔的视野和独立思考的能力。
由此可见,这仍然是一个全社会的问题,需要所有人共同努力,一边探索一边改进。正如大数据杀熟的问题被人们提出来,才有了被解决和被优化的可能性。归根结底,在未来我们想看到的无非是——推荐算法不仅更聪明,也更有德。
*文中题图来自:摄图网,基于VRF协议。
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有