当用户浏览了150个或更多不同的域名时,可重新识别性上升到了80%以上。”他们指出。
这也证实了浏览历史档案是稳定的-第二个先决条件是这些档案被反复绑定到特定的用户,并且还可以对这些用户在线跟踪。
“在1,766个站点中,我们的可识别率在100个站点中低于10%,尽管跨数据集的配置具有90%的唯一性,但当我们考虑10,000个站点时,可识别率增加到80%,”他们补充道。
最后,与进行2012年论文研究时相比,Alphabet(Google)和Facebook等一些公司实体能够更大程度地观察网络,这可能让他们获得深可见性浏览活动和使用可见性的有效在线跟踪,即使用户使用不同的设备来浏览互联网。
最近的其他研究表明,通过泛化对浏览模式/配置文件进行匿名化并不能充分保护用户的隐私性。
背后最需要的是管控:隐私研究人员Lukasz Olejnik是2012年论文的作者之一,他指出,这项最新研究的发现能带来更深远的影响,因为这证实了网络浏览历史是可以揭示用户的数据被用于牟利,或这些用户的个人数据被暗中被人最大程度挖掘。
他评论说:“在某些方面,浏览历史类似于生物特征数据,因为它们的独特性和稳定性。”他指出,由于这些数据能使得个体数据从众多数据中分离,因它自动属于一般数据保护条例(GDPR)的管辖范围。