其他

“AI+经济学”是什么?举几个栗子

2017-07-23 余亮 智能国

纳什把博弈论引入经济学


我今年跑人工智能的场子比去年少多了,泛泛而谈的都不去,因为基本都没我谈的好。真要深入学习,就在家看书或者报个在线学习班。不过这次钛媒体和杉数科技做的"AI大师圆桌会"对我有吸引力,因为邀请到在德州扑克牌大战中问鼎的冷扑大师主创者Tuomas Sandholm。


之前名扬四海的阿尔法GO,代表的是在完全信息和疆界封闭世界称王的机器智能。围棋棋局虽变数极多,但一切都在“桌面”上。扑克牌则是非完全信息博弈,对手手中有什么牌,在桌面以下,不确定因素太多,彼此要靠猜。卡耐基梅隆大学计算机系教授、冷扑大师Tuomas Sandholm就认为,在现实生活中几乎不存在围棋这样具有完全信息的场景,所以阿尔法GO的算法在现实世界很难直接派上用场,无论是商业谈判中的对方底牌还是股票交易中的内部消息等都更像德扑,德扑AI打开了人工智能应付随机事件和隐藏信息的大门。


阿尔法GO的算法包括局面判断和蒙特卡洛树,而冷扑AI的算法思想包括:基于纳什均衡的博弈论、虚拟遗憾最小化算法(Counterfactual Regret Minimization ,CFR)和决策树等。我对冷扑的算法机制还不太了解,就冒着40度酷暑跑去听,结果听到了别的有意思的事情。


会场在上海财大的豪生酒店,小范围讨论,全场就50来号人。主办方之一杉数科技的主要人员也来自财大,所以这里的算法就有了一种财大的气息。


几位科学家都比PPT上的照片呆萌不少,赵何娟则比照片中年轻很多。对,钛媒体的创始人赵何娟也亲自来致辞,可见重视。她马尾辫连衣裙像个学生,说好希望当年有这么有趣的教师教自己。


两位中国科学家唐平中与何斯迈的演讲题目,看上去比较枯燥,一个叫《应用机制设计:水权市场,淘宝刷单与百度广告拍卖》,一个叫《收益与库存管理中的博弈行为》。但听起来很有意思。


他们都强调“AI+经济学”。西方经济学认为所谓经济学就是研究资源的稀缺性并解决资源匹配问题。我以为,“AI+经济学”是指算法介入资源匹配的过程,借鉴经济学对各种经济模型的思考研究,可以平衡以往AI算法的短视(如算法推荐新闻造成的信息茧房)和经济学模型的慢速(不能大规模实施处理数据)。


唐平中是清华大学交叉信息研究院青年千人助理教授,也是Tuomas Sandholm在卡耐基梅隆大学计算机系的博士后。他先讲甘肃省石羊河流域的水权交易市场。


西北地区干旱缺水,政府就设计了二级水权市场,有点类似碳排放量交易市场,政府首先根据往年用水状况给各村庄配给用水量(前提是供水基础设施发达,没有水渠管线,分配水量是不可想象的)。到了年中,各村根据实际用水情况变化,有用不完的水量可以拿去二级市场交易,类似于高校里各院系年中调预算。但是这个买卖匹配过程比较麻烦,一开始是工作人员手动匹配各村庄的买卖申请单,基本不可行。算法专家就来想办法,促成交易匹配,提升交易意愿。他们正在与清华经管系与水利系合作,落实这个机制。所以甘肃偏远地区有些机制还是蛮现代的。


搜了一下,这方面论文好多,好可怕……


我觉得,听下来这更是个市场博弈论的例子,和AI有点远。不过,如果能通过有效算法促进交易机制,又能够利用机制运行中产生的数据反馈不断优化,就有了数据AI的雏形。

举个例子


唐中平表示,讲完了社会主义例子要讲资本主义例子,就开始讲淘宝和百度的用户匹配与防刷单机制。嗯,资本主义的AI需求高呀。淘宝每时每刻要把用户的浏览与无数商品进行匹配,为每个用户生成商品列表页面。之前的匹配机制就是根据各种数据比如地区、年龄、价格、销量、网络状况等做判断。然而商家用户洞悉规律之后,就会采取刷单办法。比如猛降价格以求得销量暴增,这样下个月在推荐界面就会获得高位。算法专家提出的解决办法是让机器模拟人的行为,预测到用户这样做会带来的新状况,然后调试基准,更新博弈环境,获取动态平衡。



如果说这是AI+经济学,我看这里的经济学有一点点像“理性预期理论”。这个理论大意是说政府不要搞宏观调控,因为今天的市场即使不公平、不均衡,但各个市场主体自己会去适应,会根据现在的情况去预期下一阶段的状况,并提前做好准备。而你一搞调控,等于把各项参数改变了,市场主体们的预期就不准了。这个理论当然有点一厢情愿,比如无法克服马太效应,为了反对宏观调控而一味神化市场机制无视市场失灵等等。而唐中平提到的这个算法有点反其道行之,就是用神经网络模拟用户,去预测用户的预测,然后调试机器,抵消用户的预测。这是一种基于博弈论的方法,所以淘宝店主们与淘宝系统的斗智斗勇又要迈向新的台阶啦。


何斯迈教授,他不是一个人,他是那些少年时代就获得国际奥数金牌群体中的一个。1990年代赴美之后,经历过文化差异造成的挫折,最终在平淡而不平凡中归来,继续钻研一般人不感兴趣的数学问题。


他讲的也是资源匹配问题,标题很干巴,例子很生猛,首先是肾脏匹配。一般而言,全球病人的换肾需求只有10%得到满足。算法专家努力发明新的匹配方式。比如“同时法”:大家互换,你家亲友愿意捐肾但是不匹配,他家亲友愿意捐肾也不匹配,但你们换过来可能就匹配了,人数越多越可能匹配。这种方法要求所有参与者必须同时做手术,目的是防止有人反悔,就像足球小组赛最后一场必须同时举行一样。


(我就觉得这小人的示意图画的有点戳心)


算法专家还想了另一个办法,链式法:一圈患者都找不到合适的肾脏,这时需要引入一个“第一推动者”,就是找来一个肾,只要匹配其中一个,这个人的亲友的肾就能拿出来匹配别人,救活了一圈人。不过这个“第一肾”可能原本已经匹配好另一个人了,这就遇到一个伦理问题:救了一连串患者,却让一个孤独的患者失去了生存机会。也就是那个常见的交通伦理问题,前方突然出现一个人,要是打方向盘就会撞到一群人,司机选哪个?


用计算机算法来让经济学模型经受检验并落地!何斯迈讲电商定价机制,涉及到好多因素,还要用爬虫侦测友商定价策略,随时调整,算法复杂。要做好这个,真不是文科出身的媒体经济学家讲讲市场至上什么就行了,几乎是一门工科学问。何斯迈出身中国科技大学,那正是一所充满工程和钻研精神的大学。



唐平中说要把AI的算法和经济学的算法结合起来,前者对我比较好认知,什么逻辑回归、最近邻算法、支持向量机,乃至深度森林等等。但印象中经济学一般不说“算法”这个词,所以AI科学家这里的经济学算法指什么?我问了唐平中老师,他给我举了个例子:拍卖,这就是一种经济学算法机制。不过结合AI算法,是要解决高频交易中的算法,时时处理海量计算,否则就不需要AI了。


会后,上海财大交叉科学研究院院长、杉数科技首席科学家葛冬冬批评国内公司热衷跟风,看到亚马逊做无人超市,几个月后也纷纷推出无人超市,没有好好去做研究。


当下最大的产业风口还是人工智能,就在这个圆桌会的当天,国务院印发了《新一代人工智能发展规划》。现在是个互联网公司都要宣称自己是做AI的,比如滴滴也宣称自己做AI。当然,滴滴有数据,就可能做AI。在唐平中那里我也终于听到了滴滴的算法。他说滴滴的拼车遇到一个难题,就是一口价,司机找到第一个乘客之后,即使找不到第二个乘客也只能按照拼车价来交易。于是司机受损,当然乘客很愿意。他在帮滴滴做一个“两口价算法”,具体怎么做没有展开说,估计也是个博弈论的问题。


冷扑大师最后出来。但是很遗憾,全英文讲座,我基本听不懂,所以本文到这里终于可以结束了。Sandholm演讲时,在座的不少听众不时发出会心的微笑。所以以后他们和机器智能关系更近,我就等着机器先来收拾我好了。


Tuomas Sandholm在演讲

会间还注意到一个小细节,唐平中在举淘宝卖家例子的时候,截图用了锤子手机的销售做例子。他选择了锤子手机做例子,这个选择机制是怎么产生的我还不知道呢~。


锤子~


AI遍地开花,找准自己的切入点很重要。这批科学家倒也不特别强调自己是AI,而是就从业务问题入手,用数学来解决。钛媒体也不愧是“财经”系出身,在搭乘AI列车的时候,切入点落在了经济学上。希望AI科学家可以借鉴经济学的思维并帮助经济学升级,向兼具理论与实践能力的科学方向发展而不是向巫术倾斜。




人文撞物理,激荡智能国

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存