MMACADEMY 数学思维陪伴营 WEEK 21 助教:37

概率和统计的核心理念初解析

大数据会"读心术"?

大数据会"读心术"吗?

大家好!我是 37。这周我们进入了第十一个主题——《概率和统计的核心理念初解析》。

在日常生活中,大家有没有遇到过这种"细思极恐"的时刻:刚跟朋友聊完某个话题,相关视频或广告就会精准地出现在手机屏幕上;或者对着 AI 随口提了一个模糊的问题,它竟然给出了完全契合你心意的回答……

它们怎么知道我们在想什么?难道大数据和 AI 真的会"读心术"吗?

谁在偷看我的大脑?——细思极恐的

概率空间:算法如何预测你的下一步

读心——概率游戏:过去数据 → 概率空间(Probability Space)→ 预测下一步

事实上,它们并没有读心术。本质上,是算法为我们每个人都构建了一个庞大的概率空间(Probability Space)。我们在网上的每一次点击、搜索、停留,甚至屏幕滑动的速度,都成为了这个空间里的样本数据。算法通过海量的数据,不断计算我们下一步行为的概率。例如:

2013
淘宝

推出"千人千面"个性化推荐系统:根据用户浏览、搜索和购买记录等,预测商品偏好,计算我们对某件商品心动并下单的概率。

2016
抖音

上线:通过分析用户的观看历史、点赞和评论等行为,优化视频推荐,计算我们对下一条视频感兴趣并完播的概率。

今天
大语言模型

更是把概率玩到了极致:它结合我们的上下文,计算输出哪一个字的概率最高,从而拼凑出让我们觉得"它懂我"的回答。

这些实例表明,大数据推送的本质是一种概率行为——用过去的数据,预测我们下一步的行动。

曾经我以为,概率不过是掷骰子、抛硬币时的"运气游戏"。但在今天的大数据时代,概率早已成为最精密的算计。当我以为是出于"自由意志"买下了一个手机壳、刷了两个小时短视频时,其实早就落在了别人设定好的概率分布之中。

做玩家,还是做数据点?——主动掌握概率思维,还是被动成为别人概率空间里的一个数据点

这让我不得不警惕:如果不具备概率思维,我们每一个人,不过是别人概率空间里的一个数据点。

那既然我们时时刻刻都处在被别人计算的概率中,难道我们只能永远被动地接受吗?我们是否有可能主动去设定条件,重新夺回属于自己的主导权?

思维导图

最后,分享我在学习《问题解决的艺术》这门课时整理的思维导图,仅供参考;大家学习时也可以选择自己喜欢的梳理工具,不一定要用思维导图。