最新消息:Telegram频道:@lewuxiancom

World vs Model:用 2026 世界杯检验模型能否打败预测市场

佳软 lewuxian 16浏览 0评论

 

Polymarket 这样的预测市场在2024年美国大选大出风头,随后在各种全球重大事件上吸引大量资金和关注。2026年世界杯即将于6月11日开幕,自然也少不了大量资金涌入预测市场。而AI大模型也被广泛在各种概率竞猜游戏中广泛应用。

在量化投资和预测市场领域,有一个长盛不衰的经典辩题:一个精心设计的数学模型,究竟能不能战胜流动性充裕的预测市场?

最近一位名为Marcus Liew的开发者开源了一个旨在验证“模型能不能打败市场”的项目 World vs Model 。

World vs Model 中的“World”为预测市场,也就是很多参与者用真金白银或市场交易行为共同形成的概率;“Model”为一套公开、可复现、可评分的计算方法。

World vs Model 把 48 支球队在不同阶段的晋级概率、夺冠概率,与 Polymarket 上的市场价格进行对比,然后让两个不同类型的模型公开挑战“市场共识”。比赛开始后,所有预测都会根据真实结果进行评分,看看模型到底有没有预测能力,还是只是看起来很聪明。

官网:https://mli3w.github.io/world-vs-model/

Github:https://github.com/mli3w/world-vs-model

 

两个模型:一个完全不懂足球,一个基于 Elo

World vs Model 设计了两个模型来挑战市场。

第一个是 zero-knowledge model,可以理解为“零足球知识模型”。它完全不看球队实力、历史战绩、球员状态、教练水平,也不关心谁是强队谁是弱队。它只观察预测市场本身的价格结构,然后根据 favorite–longshot bias 进行修正。

所谓 favorite–longshot bias,可以粗略理解为:在很多市场中,热门选项和冷门选项的定价可能会存在系统性偏差。热门可能被低估,冷门可能被高估。这个模型不懂足球,只是尝试利用这种价格结构偏差。

 

第二个是 informed model,也就是“有信息模型”。它基于 World Football Elo Ratings,对世界杯赛程进行模拟。这个模型会考虑球队 Elo 评分、东道主优势、淘汰赛不确定性、评分波动等因素,再通过模拟推导不同球队晋级、进四强、进决赛、夺冠的概率。

这两个模型形成了一个很有意思的对照:

  • 零知识模型:不懂足球,只看市场结构。
  • Elo 模型:不依赖市场价格,而是从球队实力出发。
  • 市场:由交易者共同形成的群体判断。

也就是说,这不是“模型 vs 模型”,而是“模型 vs 群体价格系统”。

 

公开、可证伪的记分卡

各种预测类工具最大的问题是:事后诸葛亮太容易。比赛前说十个可能性,比赛后只拿说中的那一个出来宣传。“预测能力”的比拼变为“讲好XX的叙事能力”。

World vs Model 的设计采用Pre-registered(预注册)机制,在比赛前会将两个模型的预测、市场基准、分歧点写入Github的ledger/wc_results.json,后续再根据真实比赛结果进行评分。

这些预测记录是 Append-only(只追加)、Immutable(不可修改)和 Timestamped(带时间戳):

  • 追加式记录:新的预测快照追加到 predictions.jsonl,不是覆盖旧记录。
  • Git 可审计:因为托管在 GitHub,历史提交都带有时间戳,可以查看,篡改会留下提交痕迹。
  • 预注册:预测在赛前固定,赛后再评分,避免“事后改答案”。

World vs Model 每一次预测都在比赛结果出来后用Brier分数和“skill vs market”打分。

Brier score 是概率预测中常见的评分方法。简单说,如果你给出的概率越接近真实结果,分数就越好;如果你非常自信但预测错了,惩罚也会更明显。

skill-vs-market 则更进一步:不是只看模型有没有预测对,而是看它相对于市场有没有额外价值。因为预测市场本身已经是一个强基准,如果模型只是比随机猜测好一点,但不如市场,那它其实没有太大意义。

 

 

为什么 World vs Model 的实验特别有价值?

World vs Model 最有价值的地方,不在于它预测了哪支球队会夺冠,而在于它提供了一套非常透明、可以被现实检验的预测方法。

首先,它不是事后才来“复盘吹牛”。项目会提前记录每一次预测,等比赛结果出来后,再用公开的评分方式来判断模型到底准不准。

其次,它利用了预测市场一个很特别的优势:市场里的概率必须符合基本逻辑。比如,一支球队“进入半决赛”的概率,不可能高于它“进入八强”的概率;所有球队夺冠概率加起来,也不能无限偏离合理范围。正因为有这些逻辑约束,项目就能发现市场价格中一些看起来不合理的地方。

第三,它看的不是单一冠军预测,而是大量相关市场。世界杯不是只有“谁夺冠”这一个问题,还有小组出线、进入十六强、进入八强、进入四强、进入决赛等很多层级。World vs Model 通过同时观察这些市场,可以更全面地比较模型和市场的判断,避免只押注一个结果带来的偶然性。

第四,项目的透明度很高。它把代码、方法、数据来源和参考资料都放在 GitHub 上,任何人都可以查看它是怎么计算的,也可以复现或质疑它的结果。

另外,项目还展示了 Elo 模型的模拟结果,包括各小组的预计晋级概率、淘汰赛路径和不同球队的夺冠可能性。

World vs Model 与其说是一个世界杯预测网站,不如说是一个关于“如何诚实预测”的公开实验。它把模型、市场和真实比赛结果放在同一个记分牌上,让普通人就能直观观察:到底是群体智慧更强,还是模型真的能发现市场忽略的机会。

 

对普通用户的价值

对不关心理论和技术的普通用户可以把World vs Model 当成一个世界杯概率观察面板来看,可以重点关注几个问题:

第一,市场最看好哪些球队?

例如法国、英格兰、巴西、阿根廷、葡萄牙等传统强队,在预测市场中通常会获得更高关注。

第二,模型和市场在哪里分歧最大?

如果 Elo 模型认为某支球队被市场高估,或者零知识模型认为某个晋级概率存在结构性错价,这些地方就是最有趣的观察点。

第三,随着比赛推进,模型是否会被现实打脸?

这是项目的核心看点。预测不是发布那一刻结束,而是在结果出现之后才真正开始被检验。

第四,市场是否真的比模型更聪明?

如果市场长期胜出,说明群体价格机制确实很强;如果模型在某些领域稳定胜出,则说明市场可能存在可被捕捉的偏差。

 

无论最终是 Polymarket 的集体智慧胜出,还是开发者的 Elo 蒙特卡洛模拟更准,World vs Model 是 2026 世界杯期间最值得技术人收藏和追踪的网页。

 

发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址