如何看待近期互联网上掀起的反百度浪潮?

感谢各位答主对此问题的关注,虽然之前网上也不乏针对百度的各种做法口诛笔伐,但近期(尤指2016年年初”卖吧事件“)犹如井喷式爆发。提此问无非是想看看各…
关注者
7,142
被浏览
349,169
登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏

===========被顶这么多答主深感惶恐,百度会不会封杀我啊呜呜呜(滚,我想多了=========

_______________________________1月18日更新_____________________________

我开始就是为了来吐槽泄愤的,后来

@海角的鱼

提醒了我,现在仔细梳理了原文,把“戾气”的部分都统统过滤掉了。

题外话:看在羊年快过去了,又是我本家的份儿上,大家把

@林小羊

放了吧

我觉得既然这个回答被顶上来了(很意外)控诉与否已经不那么重要了,我想借机把一些问题讲清楚,因此跑题见谅。

我平时工作忙,因此回复可能不太及时,初次写的时候结构很乱,错别字也多,现在在努力整理

我写这个煞费苦心,但是不是为了引导大家用什么,不用什么,我之所以夹带了各种私货是因为我通篇都在“讲自己的故事”,所以请大家自己用眼观察、动脑思考,千万别偏听我一面之词!

—————————————————以下是正文—————————————————————

我定向来黑百度百科

全局声明:

百科:以下如无特殊说明,均指代「百度百科」

维基百科:以下如无特殊说明,均指代「wikipedia.org

冰火维基

指的是由冰火贴吧用户Reasno于2012年2月创建于全球最大维基托管平台「Wikia」上的独立维基农场,旨在分析、整理和演绎由乔治·R·R·马丁创作的奇幻小说『冰与火之歌』与HBO 所拍摄的『Game of Thrones』电视剧相关的资料与信息。由社区粉丝共管共治、共同编辑。于2015年初与wikia和平分手,内容搬迁到「huiji.wiki」上,原wikia网站已经停更。


冰火维基≠维基百科,目前服务器在国内,有ICP备案,未被墙。请勿混淆

摆事实部分:

我们被百度百科的用户抄袭了四年了(既然是用户抄,锅为什么要甩给百度我下面会展开说明)

起初我们还傻不拉几的学维基百科搞了个页面叫“被百度百科抄袭的页面列表”

百度百科抄袭冰与火之歌中文维基的词条列表

后来一看还整理个p啊,改名叫“没被百度百科抄袭的列表”得了

凡是长一点的,重要人物、地点、事件的页面,都被抄袭了,有一次抄的,还有追着我们更新抄的,最重要的特点是,都是不带注明来源的

看图说话:

我没精力一个一个整理,以上这几个就是例子

您要是有功夫,可以去冰与火之歌中文维基 找随机页面,然后去百度百科对着看,只要百科有的,基本上都是抄我们的。毛估一下千条以上。(我对这句话负责)

我们一个条目几万字,要陆续搞俩月,还配图,百科编辑小手一抖几分钟就抄走了,还不注明来源。且不说什么版权法律法规,我们从道德上来评判,合适么?中国五千年前的文化礼教哪去了,人与人之间最基本的信任和尊重哪去了?

————————————分隔线—————————————————

以下为讲道理部分:为什么反对百度百科“搬运”?

【一】百度百科任何形式的搬运都是对原创维基内容的无情伤害

我补充一张维基类产品(不是特指wikipedia)的原理示意图:


可以看到,维基用户的工作量是超出大多数人想象的,他们做的是现阶段机器爬虫取代不了的工作:将互联网世界内纷乱、复杂的一手信息(raw data) 用自己的智慧整理成一篇篇维基文章,然后串联成结构化的维基知识。

以冰火维基为例,我们写一个维基条目是非常辛苦的,工作方式大体分为:
  • 从外文维基(我们的姊妹项目)上翻译来的(经过授权,我们这有英、法、俄、意、荷、葡、泰、土耳其、波斯姊妹站点,需要大量的协作工作)
  • 自己撰写的大量原创内容。
  • 除此之外还有很多令人发指的后勤维护工作
这个和你去百科上码字有本质的区别,以冰火维基为例,你看到的内容页面(就是文章页)是5680多个,你看不到的模板页面(代码、程序模块、css样式页面)有10000多个,4年前后在wikia和huiji两个平台上合计有800+的用户参与编写,但是最最核心的代码、样式维护和在百废待兴时拓荒的编辑人数总共也就不超过50个。历史总计发生20万次编辑,文字内容+各种代码合计约5000万的文字量(冰火五卷加起来才300万字),其中编辑量top10的用户占了总编辑量的一半约合10多万次。10个人,4年10万次编辑,平均每人每天6.8次编辑,然后这些人都是无偿义务劳动,没人因为这个维基赚过1分钱。可以说很多人是牺牲了陪家人、自己娱乐的时间来编纂维基,这不是贱,是真爱。

我们不妨想想,为什么墙外的网络中,有wikipedia、有wikia,有这么多用户一直参与编写维基,他们为什么动力十足

  1. 参照上图,分享、传播知识是动机,然后伴随着遵照创用CC的分享流动使得成果广为人知,编辑者成就感满足,继续编辑,同时激励了更多维基编辑者参与其中;
  2. 另一方面,其他引述维基内容的站点无外乎是一些blog、新闻、即时性的社交平台,不会对维基类产品进行结构性复制,因此在互联网和SEO中也不会威胁到维基产品的江湖地位和搜索权重。实现了一种UGC参与互动分享的良性循环。

再来看百度百科和他的用户们都干了什么:

百度百科相当于是直接剽窃走了维基产品的劳动成果,我不是看不起百科编辑,大部分的百科编辑根本就是不求甚解的东摘西抄,某些所谓的蝌蚪团(我能吐槽这个名字吗?小蝌蚪找麻麻?)不过是有组织有纪律有目的的结伙抄袭而已,节操略多那么一点。那点ctrl C+ctrl V的能量消耗和维基编辑者的辛苦付出相比根本毫无可比性。说他们是坐享其成的知识窃贼毫不为过。

整个这件事情像什么呢?我打个比方:

十个学者花了十年时间辛辛苦苦编纂了一本百科全书,然后一个窃贼用了一个月把百科全书照抄了一遍,在其中插入广告页,然后以免费的方式白送给路人,借助自家遍布全国的书报亭送出去了几千万份。然后美其名曰“造福大众,福泽苍生

咦!好不伟大,原作者出来抗议,然后他说“我是白送的,没赚一分钱,你凭什么骂我?”

百科搬运,通过自家搜索引擎占据第一位置,等于直接结构化克隆维基内容,又夺取搜索引擎自然入口,如果不加来源链接的话,相当于给原网站一点搜索权重都没加,简直就是敲骨吸髓,抄几万字留一条注释,也就是勉强等于给你留了个全尸而已。对原创内容的伤害是毁灭性的

结果就是抄袭的成了正统大道,耀武扬威,原创的石沉大海无人知晓,裸死街头。

以知乎上这一个热帖为例:
《权力的游戏》各大家族之间的关系是怎么样的? - 权力的游戏(美剧)
下面被顶5k次的答案,内容图片大多来自百度百科,百科的内容呢?都是从我们维基抄的
这5k次都是顶在百度百科的抄袭者身上的,有谁知道这些内容是谁写的?
里面的图都是百度百科的水印,我找谁说理去?

而放诸整个网络来看,长此以往,原创贡献者会越来越少,维基站点只有死路一条,而抄袭者抄无可抄,整个互联网知识网络只能充斥着虚假、凌乱的知识垃圾,进入一种恶性循环

抄维基百科的,你可以说维基百科被墙了,多少还算干了点有益社会的事情

抄我们冰火维基的,我们可没被墙,你就为了百度那几点积分,昧着良心伤害辛苦耕耘的编辑,真是一点脸都不要了。你真喜欢冰火,热衷分享,你·丫·自·己·去·写·啊!


【二】百度百科的用户协议是假CC,充满陷阱,蒙骗引诱用户为其抄袭

“创用CC”协议

最初互联网文字大多是基于一种叫做GNU的分享协议,这种协议规定了分享过程中什么是可以做的,导致非常龟毛繁琐,不利于知识和文字的自由流动,于是近年来被创用CC逐渐取代,创用CC和一些法理上的概念类似,他以组合方式规定什么是不能做的,比如绝大多数维基站点所采用的CC BY-SA,他只要求你:

  • 以相同方式分享(SA)
  • 署名(BY)

除了这两个选项外,常用的还有:

  • NC(禁止商用,可选项,缺省则表示不介意商业用途使用)
  • ND(禁止演绎,缺省表示不介意被修改演绎)

更多选项和组合可以参考

知识共享@中国大陆

这样可以促进知识之间的平等流动,尽可能的惠及所有人

注意:维基和我们网站中的cc by-sa默认适用于文字内容,图像、影音内容的协议一般是另算的(遵循原作者本人的声明、意愿和解释权),也就是说,文字可以遵循此协议随便搬,图和视频是绝壁不能的!(这一点很重要,因为图片、画作一般来说分享协议更加苛刻,会有“ND”即禁止演绎条款,百科除了不署名之外还要打水印,相当于同时侵犯了BY与ND,有些时候还会侵犯NC条款)

那我们再来看百科究竟是怎样的?

————————————————1月17本部分更新——————————————————

百科的分享方式之前与CC BY-SA不兼容,我1月17号上去又看了一眼,很搞笑,他们现在的协议是这样的:

part I:

part II:

part III:

简直滑稽,把CC协议、GNU协议和自己的旧协议都写在了一起。我混迹互联网多年第一次看到一个平台用三种分享协议的,逻辑规则根本是一团浆糊,简单来说

  • 百度百科在“拿”的一端宽于律己,CC来源的能抄,GNU来源的也能抄
  • “发”的一端严以待人。甭管你是CC还是GNU,反正只要不署名,全部援引上述Part III部分变成他们自己的。就算抄袭维基的编辑幡然醒悟,他能把内容改回去吗?否!一般用户是没法随意撤销、修改已经侵权的内容的。

维权?的确协议里有维权方法,我就不赘述了,取证、举证、申诉环节都极尽刁难之能事,您可以设想一下,跟流氓讲道理轻松的了吗?

总之这是一个“天马行空”、东拼西凑、处处陷阱、毫不讲理的流氓条款

百度耍流氓最大的资本就是百度搜索引擎的市场保有率,权力太大,这是原罪。
同样的内容,他抄你的,然后在自家搜索引擎中永远排第一

如同我在评论里说的:

本来一个条目我们30000字,百科500字,
搜索引擎中我们在google排第一,百度排第二,(这已经很扯淡了
然后百科编辑把30000字抄走,结果我们在所以搜索引擎都是第二

这只是我们一个,百科用户抄维基百科(wikipedia)的页面内容呢?

那才叫真正的罄竹难书

【三】百度百科的先天“缺陷”使其成为了盗图侵权与抄袭的温床

我在这说“缺陷”,也是不想把话说死了,谁能保证不是蓄意而为之?

互联网从业者都知道,需求决定产品逻辑,一个百科类产品软件,从功能设计上就体现出了你是要保护版权,还是要侵权的,维基类产品大多使用的软件是MediaWiki,MediaWiki许多交互细节看似非常龟毛,比如你上传图片时一定要你填写描述,还支持用模板导入授权文件,再加上infobox中和图片thumb的功能,一般情况下,一幅图在维基里有多处能够体现作者和版权信息

我以文件名为例:mediawiki所有图片的路径文件名都是源文件名,

我举个栗子,这幅图作者是Jean-lotus,作品名称是“the Queen”

在维基网站中,这幅图的文件名不会被转译成乱码字符串,为的是尽可能在下载、二次分享后还能保证原作者的署名权

再看百度百科:

你说这是技术问题?壁垒?显然不是,我司4个程序员都能做出来的功能,你国狼厂整不出来?正如大家现在都在说的那样,你真心没法叫醒一个装睡的人。

下面逐条细说:

①百科没有任何页面显示图片的版权来源

相反的,还要打上“百度百科”的水印(这已经违反了上述CC中图像作品“禁止演绎”的分享协议),我们可以看看MediaWiki软件是怎么设计的:我以魔戒中文维基为例,任何图像都可以通过鼠标左键点进去查看详细版权说明(维基百科也都是这样的,当然被墙了,各位看不到,我拿我们的站点做例子):

还能点进去看作者的个人信息:

英文站还有保留IM聊天授权凭证的,更是严谨。我们在看看百度呢?点进去直接就是水印:来源永远是百度百科

画手花了几十个小时画一幅原画发维基上,顺手就被抄到百科(没人署名,也没人附上您的DA blog)通过百度图片,天知道会被二次抄袭多少遍。至于那些国外的画手,一辈子不上百度的,永远也不知道自己的图被盗了。游戏、奇幻、科幻条目是盗图重灾区,那些游戏的原画、小说插图,就没几张是署了名的,这么明目张胆的盗图百科,全中国也是没谁了

②缺少对引用来源的强制性约束

百科从功能和制度上双重鼓励用户不加注释,我举个栗子,百科丹妮莉丝·坦格利安条目洋洋洒洒半米长,注释象征性的就一条:

而且您看这来源,到底是抄的冰火维基,还是抄的维基百科?冰火维基百科是啥鬼?

我们来看看我们站的丹妮莉丝条目

大家自行感受吧,这都是手加的,肯定累,您说麻不麻烦,麻烦!

为了尽快积累内容,忽悠小白也能编辑百科,你问我怎么办?那自然是鼓励不加注释的啦!

而且最让人迷醉的是无论是百科官方还是洗地者都喜欢这样来开脱:抄袭是用户行为

所以我说百度之恶恰恰在于面对抄袭行径的不作为,甚至是诱导用户抄袭,践踏知识版权。

在这一点上,百科与百度文库的恶是一样的:打着“分享”精神,用一点点积分/金币做诱饵,鼓励煽动用户抄袭他人的东西,这部分人里面很多都是涉世未深的学生。可以说中国网络上的版权意识淡薄,跟百度脱不开干系。这种罪行隐蔽,狡猾,贻害无穷。作为一个这种级别的互联网公司,百度根本尽到没有教育网民的责任与义务。

所以各位看官您看,的确用户可能是无辜的,但是百科规则是谁制定的?百科产品是谁开发的?百科协议是谁书写的?搜索引擎又是谁家的?

看到这里,您还会认为百度对百科抄袭没有责任吗?

就百度百科这一个妖孽这几年就快把我气死了,还用说百度贴吧?百度搜索?百度图片?百度文库?百度APP?百度全家桶?

但凡你是个正常点的互联网用户,都没少受百度的鸟气

最可气的是你永远拧不过这条大毛腿,现在贴吧门引爆了舆论,大家都是憋了好久的气,能不是浪潮吗?

=========================P.S.===============================

不要将维基简单等同于wikipedia,维基最宝贵的地方是一种严谨求知的治学精神和普世惠民的情怀,无关乎zz立场,意识形态。

维基在整个社会分工和文化普及的过程中是有着自己的使命的,叫什么并不重要,百度百科本该在wikipedia离开后继承这一重担,很可惜他并没有,反而站到了维基的对立面,对我们和其他人造成了无穷无尽的伤害。

wikipedia在国内的遭遇我无需多言,但是我想说的是维基不是只有wikipedia,“维基”是一种范式,一种哲学,我们工作和生活中接触到的一些SaaS工具、Github、buglist软件等等都流着维基的血脉。知乎也是秉承维基精神的一款优秀互联网产品。

也许就是你一次次不经意的搬运维基内容到百科,一次次的对百度的行径面麻木不仁,造就了今天的困局

答主希望各位高抬贵手

的确我是利益相关者,但是我想你们每个人,作为互联网用户一样都是利益相关者。

此时说“睁开眼”、“猛回头”似乎有些过火了,维基类产品在国内非常稚嫩和脆弱,经不起抄袭压榨,如果冰火维基的遭遇在魔戒维基、其他维基身上重演,早晚死路一条。至于说我掺水写软文的。我们网站没有半个广告,您就算受累点进来了这一点PV对我来说也换不成钱。不是谁都像你国狼厂一样钻到钱眼儿里出不来,勿以小人之心度君子之腹谢谢。

此文中部分内容和截图原载于微博

weibo.com/p/10016039309

系本人所写,本回答中略有删减修改

————————————————扩展链接———————————————

  1. 你所不了解的维基 :详细介绍了什么是维基、wikipedia、wikia
  2. 冰与火之歌中文维基百科是个什么组织? - 林家闻的回答
  3. 国内为何没有wikia这种专题型的自建wiki平台? - 林家闻的回答
  4. 百度百科:游荡在中国的窃贼 by月光博客

———————————1月16日补充一条百度卖贴吧的爆料————————————————

这是我之前在冰火贴吧的朋友整理的爆料,与百科抄袭无关,有兴趣的朋友可以看看。

百度除了医疗类的贴吧之外,还卖过美剧类的,这篇文章里提的是原《权力的游戏》贴吧吧主被不明来路的“妹子”宫心连环计骗走贴吧管理权然后各种买卖广告的详细经历,还有一些其他美剧吧也搜集过类似的证据,大家有的可以一起补充:

黑城堡154期.从兴盛到平庸——论权力的游戏贴吧的失守