Google可能比你母亲更了解你?
Google可能比你母亲更了解你,这会有问题吗?
电子前沿基金会(Electronic Frontier Foundation)高级律师Kevin Bankston在最近的一篇报告上谈到“Google可能比你母亲更了解你”,这在几年前听起来似乎太不着边际,但如果你正在使用Google不断扩大的互联网应用(我计算了一下,我自己就使用了大约超一打的Google应用),你就得小心了。
这就是为什么经常听到隐私保护者和策略制定者常常会夸大在线隐私的警告的原因了,特别是Google要单独拿出来说事,如果你使用Google的搜索引擎,Google就知道你搜索了什么,Google还可以从它的广告合作网站那里知道你访问了哪些网站,如果你Chrome浏览器,它可能知道你输入的每个URL地址。
它可能还知道你的电子邮件(Gmail),你的约会(Google Calendar),甚至你最近去过的位置(Google Latitude),它可能知道你正在观看什么(YouTube),以及你正在和谁通电话,它可能抄录你的通话记录(Google Voice)。
它可能会保留你放在Picasa Web相册中的照片,它包括面部识别技术,能够在新的照片中自动识别你和你的朋友,通过Google Books,它可能知道你正在读什么书,你做了什么注释,以及你花了多长时间阅读。
当然,从技术上说Google不知道你任何东西,但在它的服务器上存储了关于你和你的行为的海量数据,内容包括你创建的查询,访问的网站和你点击的广告灯。
Bankston说:“Google预计用户都会信任它”。
Google公司的全球隐私法律顾问Peter Fleischer说:“Google在三个基本原则指导下使用个人信息,我们不会出售这些个人信息,在未得到允许的情况下我们也不会收集这些信息,在未得到允许的情况下我们不会将这些信息用于广告销售”。但什么是“个人信息”却没有得到普遍商定。
Google并不是唯一这么运作的商业公司,美国西点军校教授和Google安全一书《Google知道你多少》的作者Greg Conti说道“在线工具其实并不是真正的免费的,我们支付的是个人信息”。但Google是收集个人信息最多的公司,包括人们在网上创建的内容和行为。
在Google控制下的数据范围非常惊人,这些数据都来自其不断扩张的产品和服务,这些产品和服务将Google推向了在线隐私辩论的中心,根据世界隐私论坛首席执行官Pam Dixon的说法“从来都没有一个公司象Google那样拥有那么多用户数据”。
模糊 vs 透明
批评家们抨击Google在解释其如何使用收集到的这些数据,在它的服务之间以及和广告商之间如何共享这些信息,在律师和政府调查时Google是如何保护这些数据的,数据要保留多长时间才删除,以便不能跟踪到用户等问题时描述得非常模糊。
Dixon说:“因为Google在回答如何使用这些数据时描述得非常模糊,用户缺乏最基本的信息权利,隐私变成一个非常棘手的问题”。
隐私策略的不透明并不仅限于Google一家公司,实际上,在世界各地都是普遍存在的,美国联邦贸易委员会在2月份发出书面警告说“在线业务面临不断增长的规则,除非它们发布了隐私声明,用‘清晰的,简明的,消费者友好的和突出的’方法阐明它们收集了什么数据,如何使用这些数据,以及用户如何退出等”。
但Google声称不应该过分担心数据收集的范围和政策的模糊性,Google法律部门产品法律顾问Mike Yang说:“如果我们收回这个主张,对用户而言隐私风险更大,Google给了用户很大的透明度和控制权,有人说一个账户信息内容太多了,担心泄露,应该只有用户自己才可见,但往往并非如此,在大部分产品中,我们看到关于你的信息都是你使用了什么服务”。
实际上,Google关于你的数据存储分为两部分:用户生成的内容和服务器日志数据。服务器日志数据你是看不到的,因为这并不属于个人信息范畴。
这些日志数据包括你如何与Google服务交互的信息,包括Web页面请求(日期,时间和请求的内容),查询历史,ip地址,一个或多个标识你浏览器的cookie ID,以及其它元数据。Google谢绝提供关于其服务器日志架构的更多信息,并不等于说Google没有为其所有服务维护一个单独的、统一的服务器日志。
Google说它不会提供查询日志和其它服务器日志的可视化界面,因为那些数据总是和某台物理计算机的浏览器或ip地址关联的,而不是和某个人及其Google账户关联的,Google声称公开这些数据会引起更多隐私问题。Yang说:“如果我们让这些都透明的话,你可能知道你妻子在搜索什么,利弊总是很难平衡”。
Google说它在许多产品中将用户14天前产生的数据清除了,但有的产品周期可能要长一些,如Gmail就是60天,Google会按照用户预期和行业惯例制定保留策略。
在Google广告偏好管理器中,你可以控制广告的服务行为,可以添加或移除感兴趣的类别,或者选择Google的双击cookie,它链接到关于你和你的浏览器存储的数据,以便有效地投放目标广告。
Google商业产品经理Shuman Ghosemajumder说用户应该信任Google,不用担心隐私会遭受泄露,Google的所有应用程序都运行在独立的服务器上,它们都存在于独立的仓库中,除了我们的原始日志外,但有些信息在某种情况下是共享的,Google的隐私策略让公司有充足的余地可以进行革新。
Yang使用Google Health作为例子,如果你正在和你的医生交换信息,你可能想要这些信息显示在Gmail中,或者有一个约会自动显示在Google Calendar中。
Google希望弄清楚在隐私策略透明度上缺少什么,这样可以弥补它的服务的透明度。但Dixon根据医学隐私问题进行推论,他认为目前Google还没有做到足够透明,医学记录一旦转移到Google Health上,就不会受到HIPAA的保护了,Google声明目前还没有计划使用Google Health数据进行广告,但通过跨服务共享数据已经模糊了这条界线。
如果你有一个健康问题并使用了Google Health搜索引擎研究这个疾病,使用Gmail和你的医生进行沟通,使用Google Calendar记录联系约会,使用Latitude了解你最近的医疗诊断位置,Dixon问道:“广告商都知道你什么?法律会怎么执行?事实真相如何?我不清楚这些东西,它们一直困扰着我”。
改变行为
Google最近的改变使广告投放更精准,直到最近,Google都一直都是基于目标前后关系进行广告投放的,这个理论来源于搜索学科的研究成果或你正在阅读的Gmail邮件中的关键字,为了避免引起人们对广告的厌烦,它避开了比较敏感的话题,如种族,宗教,性取向,健康,政治或贸易联盟,以及一些敏感的金融类别等,下面这个图很好地说明了这一切。

图- 1 Google在Gmail中使用邮件消息前后关系锁定投放的广告类型
图- 2 在这个例子中,邮件内容太敏感,因此没有投放对应的广告
在显示广告信息的位置,Google可能根据你的个人档案信息及你的Web浏览历史记录向你投放广告,这是一个很有争议的话题,直到最近Google才丢弃了这个技术。
在3月11号,Google产品管理副总裁Susan Wojcicki在Google官方blog上宣布公司采取了新的技术,启动了基于兴趣的广告,Google开始瞄准你的浏览历史记录而不仅仅是内容。
网页历史记录来自于与cookie ID关联的日志,但由于这个ID链接到的不是一个唯一的用户,而是一个唯一的浏览器,你最终看到的广告可能是你妻子或其它共用你电脑的人浏览历史记录相关的,在怪异的22条军规中,广告商将会基于日志向你锁定广告,但Google说这个广告对你可能是无效的,出于隐私的原因。
Ghosemajumder承认这种情况不是很完美,他承认“有时很透明有时不透明”,但他说道“Google正在尝试提出更多的方法提高透明度”。
隐私保护着担心基于兴趣的广告是朝精准广告投放的第一步,下一步Google会知道你更多的隐私,美国公民自由协会的Nicole Ozer说:“这是主要问题,因为久而久之Google已经收集了人们大量的信息,而Google却说他们不会使用这些数据”。
但隐私拥护者也说Google有些事情做得正确,如启动了在线隐私中心,为Google某些服务提供了额外的隐私控制。
Google不再在行为广告上有所活动,仅联合其它公司从事这个实践,互联网广告局公共策略副总裁Mike Zaneis承认高针对性广告令人毛骨悚然,但他说令人毛骨悚然的不是用户自身。这种做法是不可能改变的,除非用户做出回应,放弃使用这种技术的服务,但他认为,Google认为这种基于兴趣的针对性广告投放与盲目的垃圾邮件广告投放效果要好得多。
关于Google加强内部用户内容安全也引起了广泛的关注,Google已经发生了一些小事件,如它允许Google Docs用户的文档与未经授权的用户共享,但这个事件只影响了不到1%的用户,与Google的竞争对手相比显得非常渺小,如AOL 2006年泄露的650000用户的搜索日志数据。
Ghosemajumder说用户的隐私数据是被紧紧控制住的,他说:“我们进行了充分的测试,确保用户的隐私数据不被第三方访问,我们也从内部加强了控制,如果你不是我们团队的成员,你不能访问Google服务的数据”。
如何匿名?
迫于压力,Google已经提出了其它让步。
Google不会删除服务器日志数据,但它已经同意进行匿名保存一段时间,这样的记录就不会与某个特定的cookie ID和ip地址关联了。Google最初同意在2007年后匿名用户的ip地址和其它数据,并只在服务器上保留18个月。去年9月宣布,保留周期缩短到9个月。Ghosemajumder说“我们所有的服务都要服从于这个匿名策略”。
批评者抱怨说,Google在匿名用户个人身份数据方面做得还远远不够,例如,Google将32位ip地址的后8位未做清0处理,这样可以以256台计算机为一组在一个特定区域内缩小你的身份范围。拥有自己的ip地址的公司更是担心这一点,因为活动很容易与组织的身份关联起来,如果不是一个个人的话。即使是匿名数据也可以和其它数据结合来判断个人身份信息。
面临种种批评,Google的竞争对手正尝试超越Google,微软公司就在18个月后删除了匿名ip地址,并建议行业内的匿名搜索日志应该在6个月后删除。雅虎的匿名搜索查询和其它日志数据在3个月后就删除了,Ixquick搜索引擎也不会存储用户的ip地址。
隐私倡导者最大的担心也许是如何保护Google存储的关于你的数据不落入坏人的手里,Bankston说:“丰富敏感的个人信息提供了一站式的政府调查,诉讼和为其它想知道你都干了啥的人”。
在这方面隐私法律仅提供了一点保护,大多数策略 —— 包括Google的 —— 如果通过法院或传票要求提供你的个人数据,公司会向你发送通知,都没有提供明确的保证。Bankston说:“给予法律保护的数据存储,他们要进行收集时都描述得非常不清楚”。
业内任然依赖于1986年发布的电子通讯隐私保护法,截至目前已经22个年头了,即使是政府也认为这部法律不适用于在线数据,Bannkston说:“如果国家或政府要调用你的搜索日志时,Google到目前也还没有一个具体的立场”。
隐私保护组织希望Google透露究竟有多少诉讼和执法要求他提供数据,以及如何响应这些请求,但Google以及他的竞争对手都没有发布相关信息。但Google法律顾问Nicole Wong说“Google会适当依照法律规定办事”。
至少在一个高姿态的情况下,Google已经采取了有力措施来保护用户隐私,当发给Viacom传票要求Google提供其浏览YouTuBe和Google的历史记录时,Google表示不能追溯到个人用户数据。
但发出数以千计的隐私监视请求时会发生什么,Google表示“我们的首要原则就是先通知用户”。
美国公民自由联盟的Ozer认为Google应该收集更少的数据,并且存储时间应该更短,这是她在一份长达44页的隐私和商业教科书中的建议。
议员们的重点是经济,隐私组织透露法律可能将在近期有所修订,但在他们的监管和施压下,Google还是树立起了领导榜样。Dixon说:“一家公司有这么多数据,它们有责任积极主动保护用户的隐私”。
当你注册一个免费的Web服务时注意不要提供太多的个人信息,Fleischer说:“人们应该看到被收集了什么信息,以及如何使用的这些信息,并且可以控制谁可以访问这些信息”。
隐私保护和Google的商业需要之间如何保持一个良好的平衡就象一个站不稳的舞蹈,Bankston说:“Google是靠收集用户信息赚钱的公司,这将是一个难以平衡的游戏”。
最后,最新的隐私保护法律将会划定什么是可以接受的,什么是不能接受的。Yang说:“我们的商业模式完全取决于用户的信任”。Google的部分挑战是如何创建这种没有严格限制的信任,并提升企业的创新能力。
Bankston说Google在信任方面的确做得不错,他只希望看到Google能够为用户提供更多的透明度和控制权,我们不希望Google停止创新,我们只希望在法律上使这些数据是安全的。