之所以能精准推荐,其实和输入法软件有关。查询各大主流输入法软件,安装时均提示或默认可以收集用户打字的内容。这些内容再与其他软件相结合,“用户画像”跃然纸上。这是怎样的过程?
互联网科技博主“EPC”的职业是某央企程序员,他在和一位网友研究输入法传输信息时,通过抓取文件发现,某手机自带输入法明文传输用户输入的信息,为此他还专门录了一段视频。作为一个根本不养宠物的人,通过输入法在聊天软件对话框打出多个有关“猫”的关键词,但并不点击发送。不一会儿,在某二手平台上,相关推送出现了。
视频中,这位博主说:“我们做一个实验,使用某品牌手机的内置输入法输入‘猫咪很可爱,我想买一只猫,温顺的猫咪’然后再次切换到该购物App,我们刷新一下,稍微往下拉,看到了吗?猫咪出来了!而且此时默认搜索词已经赫然出现“宠物”二字。可以看到,输入法已经默默地把他的兴趣爱好,共享给其他App了。”
随后,他们逆向分析了手机里的代码,通过抓包程序抓取了该输入法的传输数据,发现用户通过输入法打的字,被明文传输到了输入法公司的服务器。
仔细看使用条款,写着“文本信息”为用户主动提供,为的是在用户使用搜索功能、快捷翻译功能、云输入及联想功能、智能回复功能、搜索候选功能时,提供更方便、快捷的输入服务。
这就意味着,无论是加密还是明文传输,用户在输入法中所打的字,都会被分享给该输入法的30多个合作伙伴,而这还是用户自己同意的。科技博主“EPC”告诉记者,他进行过一次调研,绝大多数用户都不会仔细去看那份冗长的《使用条款》,基本都会直接点击同意。
他说:“我这次做视频的这款手机的隐私条款有上万字,非常长,一般用户根本不会点进去看,点了同意就算了,等于说你接受了它把你的个人隐私上传到他们服务器的《彩民之家61888.cσn开码2022年5月份必出特码表》行为。”
查询几款输入法的《使用条款》,不少软件会默认用户同意将自己的数据共享给多个SDK,也就是各个软件企业的软件开发工具包,这些企业之间会形成广告联盟,共享同一ID的数据,这就是为什么你明明在A软件里输入了文字,打开B软件也有相关推荐,因为只要是用同一手机号注册的账户,就能识别成同一个人的操作。
这位博主介绍说:“现在有个广告联盟的概念,它会共享你的手机ID,你手机里的输入法正好也绑定了这个ID。比如你输入文字‘我喜欢猫咪’,‘猫咪’就是个特征,会传到云端,云端会匹配到这个ID。当你打开一个购物软件,购物软件也匹配到这个ID,它就可以通过这个ID去锁定你这个人,就可以知道你喜欢什么内容,这是一种推荐算法。哪怕你换了一台手机,只要ID能匹配到,它认为你还是同一个人。”
博主EPC建议,消费者可以选择把输入法App的联网功能关闭,一些App也提供了关闭数据上传的功能。但只要在网上浏览信息,相关搜索记录、商品购买记录甚至是点击记录,都会成为用户画像的一部分。
他说:“这个是真没办法,你只要去搜索,它就会把搜索结果记录到它的服务器上,这个是被动的。比如订外卖,你也没办法不输入,你只要有输入行为,它都会记录下来,除非你不用。”
输入法开发者岁寒告诉记者,从技术上将用户打字的内容上传后分析,没有任何障碍,这些软件免费开发给用户使用,还能越做越大,靠的就是分析用户数据来赚钱,将海量数据汇集在一起后,就形成了当下这种“软件比你还懂你”的情况。
岁寒说:“如果很多人这段时间都在输入某一个词,它(算法)就知道大家对什么东西比较关心,在检索什么东西,或者在讨论什么东西,这本身就很有价值了。你都不知道你想要什么,它(算法)就知道你想要什么。比如说,你们两个人有好几个关键词重合了,然后这个人今天买了某个东西,我就把他买的东西尝试推荐给你,看你感不感兴趣,这都是可以关联的。实际上,每一个人不是独一无二的,其实是一个群体,如果都对A感兴趣,你大概率对B也感兴趣,从这个‘口味群体’里可以分析出很多你可能感兴趣的东西,这种技术是很成熟的,只能寄希望法律阻止他们去做更过分的东西。”
2021年,个人信息保护法和数据安全法施行。个人数据安全、隐私保护等群众关心的问题已经有了法律保障,监管部门也经常对各类软件进行检查,2021年还公布过33款主流App违法违规收集使用个人信息的情况。
中国科学院大学密码学院院长荆继武告诉记者,由于市场过于庞大,A软件合法收集的信息,可能会被B软件违法使用。用户面对复杂的软件,只能“怀疑”自己的隐私被窃取,经常苦于没有技术手段证实,也给执法带来了难题。