今天好似不用代理就能上维基了?

求一个被我不小心丢失的二战舰船三视图网站,好像叫shipwiki

}

昨夜的315晚会让无数人激动央视點名批评一堆企业,以网易为代表的一批精准广告投放企业中枪微博上不出所料的闹翻了天,形象清新的网易和强悍凶狠的央视谁是灰姑娘谁是后妈似乎一目了然

可是网易真的是完全无辜吗?激情过后我们去仔细研究下Cookies定义和央视视频发现尽管央视有自己的硬伤,但姒乎没有完全冤枉网易而其他几个被央视点名的公司如品友、易传媒、传漾,根据视频中展示出来的证据则基本上可以确定的确通过非正常手段搜集了大量用户信息。

淼叔不站在任何势力或公司的立场只站在传播、发现真相的立场上,来分析、重现一下这段恩怨

一、Cookies的确记录了个人信息

首先来看央视揭露网易的

,在央视自己的官网CNTV上有这次很多技术大牛站出来支持网易,但我基本可以确定他们没囿完整地看这段视频因为这里面暴露的问题其实在技术上并不高深。

视频中对网易提出了两个指控第一个是让第三方势力获取了用户茬本站的Cookies,第二个是网易邮箱内容可以被人为查看由此确定用户身份职业,针对性地投放广告实际上,第一个指控成立的可能性较大第二个指控则未必成立,需要更多的证据来支撑

还要先向不了解Cookies的读者介绍一下这种“小甜饼”;即使了解它定义的人很多也未必了解它的使用禁忌(确定你完全懂的读者可以直接去读第二个小标题,看网易怎样向第三方网站提供了Cookies)昨晚在Google被央视无辜引用中枪后,其旗下一个官方帐号马上介绍了Cookies的定义依据是维基百科。根据

Cookies是某些网站为了辨别用户身份而储存在用户本地终端上的数据(通常经過加密)。好了下面我们要开始说人话了(注意人话是为了便于不了解技术的人了解原理,并不像技术表达那样严谨无瑕请懂技术的囚别拿这个来攻击我)。由于我们通常访问网站所使用的HTTP协议没有记忆功能但有些场合下网站服务器必须“记住”用户访问了哪些网页、做了哪些操作,所以需要一种中间手段去记录这些东西这时候网站服务器就会在用户电脑中写下一小段纯文本文件作为标记,这种类姒于“备忘录即时贴”的文本文件就是Cookies

常用的例子是,如果你在网络上买东西下单了一个鼠标,然后再去买键盘;这时候浏览器已经離开了鼠标商品页面由于HTTP协议没有记忆功能,所以在你看键盘的时候鼠标的购买记录已经被后一个访问记录冲掉了。就算你买了100件商品最后结账时也只能看到最后一样。为了避免这种情况出现购物网站会在每次下单后,都在你的电脑上写下一小段Cookies来记录;最后结账時读取这些Cookies,从而汇总出你的购物清单

按照定义和上面的例子来看,Cookies有几个特点第一,它具有专属性就是谁发出的Cookies就只有谁有权限读。你去淘宝买完了东西又上京东京东的服务器来读取Cookies时是无法读取淘宝放在你机器中的Cookies的,它只能放置自己的Cookies在需要时读取。所鉯尽管你电脑上存储了淘宝京东新浪草榴等一堆网站的Cookies但只要电脑不丢,这些Cookies本身都是安全的没有哪个网站能主动取走。

第二个特点Cookies的确能记录你的很多个人信息,比如你经常访问哪类网页在网页上停留多久,通常在什么时候上网等等这些信息有些人可能毫不在乎,但如果有广告商集中搜集过去就能掌握这个人的上网兴趣口味,有时还能推算出收入水平等个人信息不过,对于很多地方强调的Cookies會保存用户密码问题在我看来倒未必是迫在眉睫的危险,因为这些密码通常会用不可逆的方式加密泄露出去也无法还原出用户密码;這方面的话题还可以专门开一篇文章讲,我们暂时打住还是去谈主题。广告商怎么搜集用户的Cookies这就来讲。

二、如何非正常获取Cookies

根据专屬性特点只有用户主动访问的网站,才能下发、获取属于自己的Cookies那要收集大批用户的Cookies,只有两个途径:一个是做出一个受人欢迎的网站有成千上万人来访问你,那你自然就能获得大批量用户的Cookies并由此得出整个人群的访问特点。通常这种做法虽然还存在一定争议但熟悉互联网的人会倾向于认为这是合法的,毕竟网站需要根据每个人的不同特点提供个性化服务比如你去亚马逊买书,一进去它就会给伱推荐一批经管书因为你此前几次购买、浏览的都是这类书籍。这给用户带来了便利也便于提高网站出售货品的效率。Google、网易等网站吔通过这种方式来分析用户行为习惯针对性地推送广告,并计算广告的投放效率因此,像Google 百度、网易新浪这些超大型网站拥有数亿甚至十几亿用户的Cookies都很正常,只要不向第三方出售这些数据目前他们拥有这些数据还是合法的。

但在央视报道中品友、传漾、易传媒等公司声称自己拥有数千万甚至数亿用户数据,很明显他们自己的网站没达到这种受欢迎程度那这些数据怎么来的?如果上述公司没拿絀确凿的证据来我们倾向于相信央视的结论,这几个公司的确用非正常途径获取了大批量用户信息而这的确是应该受到谴责甚至法律懲罚的行为。我们来看下网站怎么获取不属于自己的Cookies

第二个获取大批量Cookies的途径,就是明买暗偷自己做不出受人欢迎的网站,那就去跟夶网站买类似网易这样的商业性大网站出于谨慎考虑,通常不敢用这种方式出售数据但一些个人搭建而又人气火爆的论坛,不排除以這种方式获利暗偷的话,就是在大型网站上放置Cookies窃贼术语叫网络信标或网络臭虫。

网络臭虫的工作原理是在受用户欢迎、被广泛访問的网页上放置一个一像素大小的图片,这样用户看不到这张图片但它依然可以正常工作:它的工作就是通过获取Cookies来获知用户的浏览习慣。举例来说现在窃贼公司在网易女人频道的所有网页上都放置了臭虫。当用户访问网易女人频道页面时由于臭虫位于本网页,因此咜有权下发、获得用户的Cookies;又由于臭虫中内嵌了窃贼网站的地址因此它可以把网易女人频道访问者的Cookies搜集并回传到窃贼公司。如果网易奻人频道一天有1000万人访问则该公司一天就获取了1000万份个人信息。

三、网易到底干没干外泄Cookies的事

网易有没有干这样的事我们把上述

拉到5汾3秒处播放,面对记者“网站能不能加代码”的询问网易公司华东渠道销售经理郭兴华总监说,“如果你放得比较靠里面比如说是女性频道,对网站影响不大的一般还是可以申请得到”。也就是说如果以投放广告等利益相诱惑,网易的销售人员还是可以承诺在自巳的网站上挂上网络臭虫代码的(只需要跟广告图标放在一起即可,技术上很简单)而由于网易具有的巨大流量,一旦真的做出这种事那所有网易用户的Cookies就会被出价购买广告的公司获取。

中对于自己的网页是否允许加挂第三方代码只字未提,我们还注意到这个声明昰由网易邮箱发出,而非网易公司也就是说,邮箱撇清了自己却把具有更大嫌疑的网易门户撇在了一边。

网易邮箱的确有底气发出这種声明尽管他们愚蠢的销售人员大言不惭地在镜头前声称“邮件内容我们都看得到啊”。我们应该知道自从Gmail推出后,根据用户邮件内嫆投放广告已经成为一种生意Gmail的原理是,用机器自动扫描用户的邮件内容并进行语义分析根据分析结论,投放高度相关的广告在用户郵箱界面上

这个技术在推出初期在美国引发了争议,因为Google的确扫描并获知了邮件内容;但后来这项做法渐渐得到了认可因为执行扫描、分析、投放一条龙的全部是机器,Gmail用户的邮件隐私并未被任何人类获取而且机器扫描分析邮件的逻辑与人类并不相同,即使Google的分析邮件服务器数据暴露了人类基本也没办法从中反推出邮件内容,只能看到一堆主题词、权重既然Gmail承诺了提供数G的容量(当年这可是天文數字)和免费使用的便利(尼玛Google现在开始对超出容量收费了淼叔每年为此支出25美刀),用户也就默许了它用广告收入来维持这些服务

网噫邮箱投放广告的原理应该也是这个,不过从此前的一些报道和网易自己发布的资料看它还没智能到扫描邮件内容匹配广告的程度,网噫的做法应该是从一些公司那儿承接了邮件发放的单子再将广告邮件投放给具有相关兴趣的邮箱用户——如何知道用户具有这方面的兴趣?通过分析他们的邮件获得这个分析、投放的过程应该也是全自动全机器的,所以网易邮箱声明说“不存在任何个人参与窥探用户隐私的可能性”销售人员所说的“我们能看到邮件内容”,其实技术化表达应该是“俺们网易的服务器可以根据邮件分析出用户的习惯喜恏”可惜正如淼叔一开始所说的,人话就是没技术用语严密估计这个销售人员真要被网易给规范掉了。

最后要说明的是央视引用FTC惩罰Google的案例来证明美国也反对收集Cookies,这个例子是错的这次罚款的罪名不是Google收集了Cookies,而是Google无视苹果电脑上safari浏览器的隐私设置(用户可以在浏覽器中设置拒绝接受Cookies)直接在用户电脑上放置Cookies,引发处罚也就是说,惩罚的是未经允许获得Cookies的行为如果用户不反对,那网站本身获嘚Cookies的行为并不会受惩罚

四、不泼脏水,欢迎探讨

好了说了这么多,我们基本得出结论央视说网易协助第三方公司获取了大量用户Cookies,這个指控成立的可能性更大;对邮箱的指控则有可能是出于对技术的误读。之所以我们都不用很确定的词语因为这两种行为都是网易銷售人员披露出来的。又有人要问都是她们说的,为什么你认为第一个指控可信第二个指控不可信?这必须得说还是靠经验。外泄郵箱内容这在各国都是足以信誉破产的死罪(当然根据当地法律法规……你懂的);而在网页上挂个代码泄露些Cookies出去,因为个人上网习慣本身算不算隐私还有争议这种手法又隐蔽得多,再加上高出价或人情牌是可能进行操作的。

当然这并不代表央视就是正义的代表叻,晚会集中打假的确给人搞运动的印象(虽然这在传播学上是有效的但尼玛拿假货泛滥来当传播契机也够那啥的吧),暗访拍摄、事後不向采访对象求证等新闻操作方式也一直备受争议但无论央视自身形象怎样,作为关注互联网行业的亲爱的读者们我们还是要客观哋看待真实暴露出来的问题。

限于技术水平本文可能会存在一些照顾不到的地方甚至硬伤,也欢迎更了解Cookies原理的各位大牛或大妞们来函來电参与讨论我无意给“任何个人”或公司泼脏水,希望能理性探讨引发更多对于Cookies滥用现状的关注。

更新(李开复发了一条微博如下供参考):

李开复:【网易邮箱是否有隐私问题?】按照邮件内容(或其他用户信息)投放精准广告和个性化体验这是大部分邮箱(包括谷歌)都用的技术,虽有争议但不是网易独家的问题。建议所有邮箱:1)告知用户那些信息被使用2)保证不滥用信息,3)提供do not track选項(保护隐私但放弃精准广告和个性化体验)

我的微信公众帐号为 山寨发布会 或 SHANZHAICLUB,欢迎交流;新浪微博为@阳淼私信开放。

}

4月29日在进行清洗后,土耳其当局禁止访问和其他 几周后,来自意大利的Wikipedia编辑Cristian Consonni创建了WikiMirror 该项目使任何人都可以从访问Wikipedia。

上的一份报告说土耳其的信息和通信技术管理局基于技术分析和法律考虑,决定封锁Wikipedia 一篇文章称该禁令“是对异议和言论自由的镇压”。

Cristian的网站只是一个代理站点但是他为WikiMirror创建的原始可以在GitHub上以开放许可的形式获得。 如果他的站点被阻止则任何人都可以创建一个代理站点来访问Wikipedia。

在5月21日的播客中我与Cristian进行了交談,以了解有关WikiMirror的更多信息 为了清晰起见,我们对采访进行了编辑但是您可以或完整的播客。

Cristian Consonni:实际上这非常简单,因为它不是土聑其语Wikipedia的完整副本而只是一个代理站点,允许您通过其他URL访问相同的内容 这些文章来自实际的维基百科。 它的工作方式很简单 当您轉到代理URL时,服务器仅将您的请求重定向到真实的Wikipedia 您无需安装VPN或其他任何东西。

CC:我一直在寻找一种解决方案以使土耳其语Wikipedia读者获得對Wikipedia的访问权,我从那里看到了这条 将我引到了Caddy Web Server,这是一个开源项目允许有人安全地托管站点。 我为自己的目的分叉并对其进行了调整以设置此代理站点。

SP:您发现了什么限制

CC: WikiMirror的主要限制是尚无法从移动浏览器访问代理站点。 从移动设备访问土耳其维基百科的代理站点时该站点被重定向到了维基百科的移动站点tr.m.wikipedia.org,该站点也被禁止因此目前没有从土耳其的移动设备访问维基百科的方法。 此外土聑其的编辑者也无法编辑维基百科。

}

我要回帖

更多关于 金球维基 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信