
Metacritic 于 2001 年上线,由马克・多伊尔、其姐姐朱莉・多伊尔・罗伯茨以及多伊尔的法学院老同学杰森・迪茨共同创立。没错,这个网站竟是由律师团队打造的。
“我只做了很短时间律师,” 多伊尔解释道,“杰森和我大概都没打算在法律行业长期发展。当时觉得,法律背景对未来想做的事或许能打下基础。”
“我在律所工作几年后,辗转进入教育和非营利领域,最终参与创办了 Metacritic。但我很早就发现,杰森是那种只要他提出商业想法,我就一定想合作的人 —— 他太有才华了。”
作为早期互联网爱好者,迪茨曾向多伊尔介绍过电子邮件和网景浏览器,正是他构思出 Metacritic 的创意。多伊尔表示,网站创立初衷是帮用户省钱:将知名评论家的所有评价汇总,或许能成为衡量作品质量的可靠参考。
“随着年龄增长,我现在意识到这本质上是‘时间管理’—— 比如,你是否愿意把时间投入到一部可能第三季就烂尾的电视剧上?”

图:2001 年的 Metacritic 网站
2005 年,网站被 CNET 收购,此后几经易主。2022 年,它与 GameSpot、GameFAQs 等平台一同被 Fandom 收入麾下。但幕后运作几乎未变,至今仍是小团队运营。
“产品人员要兼顾多个网站,工程师和销售也是如此,” 多伊尔说,“单论编辑团队,我手下只有五个人。”
奖金争议:评分与生计的博弈
多年来,Metacritic 在游戏行业的角色一直争议不断。最受关注的是部分公司将游戏评分与奖金挂钩 —— 例如《辐射:新维加斯》开发团队就因 84 分(距目标 85 分仅一分之差)错失奖金。
多伊尔强调,Metacritic 从不参与此类决策:“早期得知有人如此信任我们的评分体系,甚至用它评估开发者能力,我们多少有些受宠若惊。但我们始终只专注于用户,想帮他们获得更好的游戏体验。”
当被问及是否因评分影响从业者生计而感到责任重大时,他直言:“完全不会。只要我们诚实可信地做事,就能心安理得。”
综合评分(Metascore)的演进
24 年间,评分系统经历过多次调整。多伊尔回忆,最初 PC 版与主机版游戏评分会被合并,直到 PC 玩家社区抗议后,才改为按平台拆分:“不同平台版本差异明显,分开评分很有必要 —— 事实证明这个决定非常成功。”

Metacritic 将所有评分统一转换为 100 分制:“比如五星制中的 2.5 星,我们会换算成 50 分。” 唯一争议点在于字母评分的转换,“比如‘F’该算 0 分还是美国学校的 58 分?” 他透露,收录字母评分的媒体时,必须明确规则:C=50 分,F=0 分,AA+=100 分,“我们尽可能让换算逻辑直观易懂”。
评分权重:藏在幕后的 “秘方”
尽管最终评分基于平均分,但会对部分媒体 “轻微加权”。多伊尔解释:“资深评论家团队的媒体,评分在整体占比中会略高。” 但他强调权重影响很小,“未加权分数与最终评分最多相差一两分,不会颠覆结果”。
至于哪些媒体和评论家会被加权,他守口如瓶:“这是我们的商业机密。” 他还特别澄清,某篇声称揭秘评分系统的研究 “完全错误”—— 例如该研究将 Giant Bomb 列为最低权重媒体时,他不得不亲自致电创始人杰夫・格斯特曼辟谣。
“一评定终身”:抵制评分操纵的铁律
Metacritic 严格规定只采纳媒体的首次评分,绝不接受修改。多伊尔透露,这源于 2010 年代初的频繁施压:“曾有公关团队连续发来十几封邮件,要求删除差评、拉黑评论家甚至修改分数。”
“2005-2007 年左右,这种情况很常见,” 他举例,“某大发行商的新作首评拿了 C+,三小时后就被撤下,理由是‘不符合编辑标准’,两天后重新上线时评分已改成 B+。” 直到接到 “告密者” 爆料,他才决定捍卫原始评分:“媒体发布的第一个最终评分就是 Metacritic 采用的唯一标准,绝不更改。”
重新评分争议:当游戏脱胎换骨
在游戏持续更新的时代,部分媒体开始重新评估大幅进化的作品。例如 IGN 自 2014 年起规定,若原评分不再准确,就会启动重评。但 Metacritic 的政策可能让游戏 “困在” 旧评分里 ——《无人深空》用八年时间将 Steam 评价从 “差评如潮” 逆转成 “特别好评”,PC 版 Metascore 却始终停留在 61 分。
是否考虑纳入重评?多伊尔表示:“我们探讨过很多次。如果游戏以包含所有 DLC 的特别版重新发布(如《彩虹六号:围攻X》),我们会新建页面收录新评分,同时保留首发评分页面。” 他认为保留原始评价记录至关重要:“我想知道游戏刚推出时,顶级评论家如何看待它。”

图:彩虹六号:围攻X的M站网页
他还指出重评的现实困境:“如今媒体团队规模缩水,很多平台濒临停更,连靠搜索引擎引流都越来越难。让大家专门重评老游戏,根本不现实。” 不过他不排斥在游戏页面添加重评链接:“作为信息库,我们可以收录后续评价,但官方评分绝不会修改。”
评论家准入:37 道问题的筛选机制
多伊尔每年 1 月开启媒体评估期,通过 37 道问题的问卷筛选新成员:“会询问网站历史、评论频率、主编背景、评分逻辑等。收到回复后,我会整理成表格,通读他们的评论,再判断是否纳入。”
问卷中一道关键问题是:“上一次给游戏打 30 分(百分制)或更低是什么时候?” 若对方回答 “从未有过”,多伊尔会质疑:“要么是评论量太少,要么只挑热门作品评。不了解低分作品,怎能定义高分标准?” 他强调,只要媒体内部评分标准一致,且覆盖足够多类型的游戏,就符合纳入条件。
谁有资格加入?
有些决策显而易见 —— 当 GameSpot 前主编杰夫・格斯特曼创立 Giant Bomb 时,多伊尔第一时间收录了其首篇评论:“他是行业权威,必须纳入。” 但个人博客很难通过审核:“如果是 19 岁新人的第一篇评论,肯定不会直接收录。”
尽管最终决策权在多伊尔手中,他也会咨询资深评论家顾问团:“原以为他们会排斥同行,但建立信任后,他们反而会坦诚建议 —— 毕竟都想维护自身公信力。” 问卷中 “你认为 Metacritic 目前最该收录的媒体是哪家?” 一题,就帮他发现了多家优质平台。

图:M站的游戏主页
如今 Metacritic 正加速国际化 —— 早期仅收录英美媒体,2000 年代末起纳入海外平台。但他格外警惕利益冲突:“近年发现有些游戏爱好者同时经营公关公司,又想以媒体身份评游戏,这种情况需要谨慎处理。” 若媒体核心团队大换血,权重也可能下调:“就像复仇者联盟突然全换成临时工,影响力自然会变。”
未来:当 AI 遇上 “人类判断”
面对 YouTube 主播、播客等新兴评论形式,多伊尔持开放态度:“像 Easy Allies、GameTrailers 这类以视频为主的平台,我会要求提供文字稿或字幕,确保符合正式评论格式。” 他解释,这源于法律和文学背景:“我始终相信评论需要论点、证据和结论,哪怕是视频形式也得有逻辑框架。”
谈及 AI 是否会取代 Metacritic,他认为:“至少现在,AI 仍需要人类输入数据。我们会继续力挺那些辛勤产出的评论家和媒体,为他们引流、提升品牌 —— 这是互惠共赢的生态。” 尽管 AI 可能给出 “玩《GTA4》还是其他游戏” 的建议,但他坚信:“我们的核心使命从未改变 —— 汇聚全球顶级评论,形成值得信赖的共识。至于 AI 能否复制这一点?拭目以待。”
“这些年总有人想‘用技术取代人类判断’,但我知道这行不通。整个评分体系中,始终需要‘人的判断’。” 在 AI 浪潮中,多伊尔依然坚守 “以人为本” 的理念:“毕竟,没有‘人’的参与,一切评分都失去了灵魂。”
原文:Metacritic co-founder Marc Doyle lifts the veil on how the site works | GamesIndustry.biz