AI 疾行,现实滞步:技术与现实的碰撞与反思

日期:2025-08-09 11:22:54 / 人气:29


凌晨 GPT-5 的发布会,想必让不少人看得心潮澎湃,我也不例外。AI 已然达到 “博士毕业” 的水准,朋友圈里有位朋友评论道:《西部世界》和《三体》,一部来自美国,一部产自中国,或许是对未来最具前瞻性的诠释。
暂且不论这些令人心绪复杂的畅想。作为一名现实世界的行业从业者,每次看完新的发布会,我的首要想法始终是:到底该如何运用这些先进技术?
说实话,现在真的跟不上技术发展的脚步了。科技进步如同光速,然而实际工作中那些肉眼可见的障碍,依旧难以破除。比如我一直想尝试的纳米经济学、极小颗粒度微观数据分析,以及另类数据(像叙事)分析,技术层面是能够实现的,但要真正应用到实际中,前方不知还有多少座大山需要翻越 —— 人类的接受度便是最大的问题,相比之下,AI 倒没什么 “意见”—— 这些技术并不能真正在实际工作中发挥作用。
AI 在高速前行,现实世界却还在 “趴着” 缓慢挪动。
不过,将目光投向西方,看看美国经济数据行业,看看美联储,再看看劳工统计局(BLS)最近发生的事情,突然觉得心里平衡了不少。
不要以为美国有了 GPT-5,各行各业就都能被 AI “附体”。技术在不断进步,但美国官方数据的质量却在持续恶化,这种强烈的反差和讽刺感,足以抚平我的所有焦虑。
以 CPI 数据为例。这张 BLS 的 “CPI 插补图”(BLS CPI Imputation),不同颜色代表着 CPI 各项价格的采集和计算方式。深蓝色(home cell)是直接采集到的真实价格;浅蓝色(different cell)则是 “实在采不到,拿别的类似品类、地区的数据来估算” 的 “毛估估” 价格。
2025 年 6 月,浅蓝色的 “毛估估价格” 占比飙升至 35%,而今年 2 月这一比例还只有 9%。美国 CPI 数据的重要性无需多言,美联储加息、债券估值、社保发放等诸多事项都以它为基准 —— 可其中 35% 都是依靠人类大脑估计出来的,那么真实世界中的误差得有多大?
再看上周五的非农就业报告(NFP),数据一出,估计很多人都想立刻扔掉手机。7 月仅新增 7.3 万个岗位;更令人匪夷所思的是,5 月和 6 月的数据被大幅下修,合计不到 3.5 万个,堪称疫情以来最糟糕的三个月。
数据修正的离谱程度超乎想象:2024 年 8 月初报比 7 月多了 2.8 万,修正后 8 月实际却比 7 月少了 6.6 万。虽然主流媒体总爱用 “超预期” 或 “不及预期” 来下结论,却很少提醒人们这些数字随时可能 “变脸”;但这种直接从 “人脸” 变成 “外星人脸” 级别的变化,实在太过离谱(所以懂王之后的反应也并非完全不能理解)。
为何如此重要的数据,质量却越来越糟糕?
在数字科技和 AI 高速发展的美国,BLS 却还在采用颇为复古的人工田野调查方式:派遣采价员前往门店,人工抄写价格。BLS 每月要调查 12 万家企业和 6 万户家庭,数据收集过程中充满了不可控因素。企业填表的回传率、填表时的心情好坏、是否如实填写、调查员工作是否认真、预算能支撑跑多少家企业等等,都会影响最终结果。再加上懂王时期冻结招聘、大幅削减预算,BLS 只能依靠 “估算” 和严重滞后的 “修正” 机制来拼凑数据(每月出初步值,接下来两个月进行修改,第二年还要进行总复盘)。
但正如辛顿所说:人类的设计是节能型的。人类拥有一项天才本领,就是能基于不完整的信息做出还算靠谱的判断。所以世界还能正常运转(尽管市场会因此动荡)。
但不幸的是,人类还有一项 AI 不具备的能力:能将一切政治化。
你会发现,数据被修正之后,很多人的第一反应不是反思模型,而是先琢磨 “这是不是对我有利”。或者把 “只相信数据” 当作武器,去压制不同的声音。很多人喜欢将经济学视为科学,但实际上,它充满了各种小心思和权力变量,每个数字背后都存在无数看不见的博弈,更接近玄学。
不过,也并非毫无希望。比如英国国家统计局(ONS)的 CPI 数据收集已经开始使用超市扫码器数据,自动化采集每月十亿级别的商品价格,不仅数据量大、覆盖面广,还能自动处理促销、打折、会员价等复杂情况。更具开创性的是,它还使用了许多另类数据,甚至能捕捉到 “粉丝经济”—— 对于从事宏观研究的人来说,这样的数据处理方式怎能不让人动心?
这个世界,需要 “打怪升级” 的地方还有很多呢。

作者:门徒娱乐




现在致电 5243865 OR 查看更多联系方式 →

门徒娱乐 版权所有