机器学习是社科范式革命吗?读《社会预测——基于机器学习的研究新范式》

date
Aug 7, 2020
slug
revolutionary-machine-learning-in-social-science
status
Published
summary
文章《社会预测——基于机器学习的研究新范式》载于国内社会学顶刊《社会学研究》2020年第3期,5月20日在知网发布,作者为南京大学-约翰斯·霍普金斯大学中美文化研究中心、南京大学社会学院(陈云松),香港科技大学应用社会经济研究中心(吴晓刚),复旦大学社会学系(胡安宁),南京大学社会学院(贺光烨、句国栋) 。
tags
Communication
type
Post
auth
文章《社会预测——基于机器学习的研究新范式》载于国内社会学顶刊《社会学研究》2020年第3期,5月20日在知网发布,作者为南京大学-约翰斯·霍普金斯大学中美文化研究中心、南京大学社会学院(陈云松),香港科技大学应用社会经济研究中心(吴晓刚),复旦大学社会学系(胡安宁),南京大学社会学院(贺光烨、句国栋) 。

文章内容

该文章从诠释和反事实因果解释的学科属性出发,接受邓肯沃兹在《美国社会学杂志》(American Journal of Sociology) 上对社会学研究预测能力缺失的学科批判,论述了“社会预测”概念的历史脉络,讨论了通过机器学习方法实现社会预测的科学原理和当代路径,重新定义的社会预测的当代内涵,讨论了其学术价值、治理价值和话语价值,并认为这一范式具有科技哲学层面的范式突破意义。
文章认为韦伯和沃兹的分歧反映了社会学研究在旧时代因囿于数据、模型和算力三大限制而匮乏预测能力的缺憾。百年来的社会学家在韦伯的视野下从事研究工作,追求诠释性理解和对过程、结果的因果性解释。然而,“预测”这一想法却一直萦绕在航普尔、欧本海默、邓肯·沃兹、霍夫曼、马丁等广大社会学同僚的心头。沃兹认为,因果性解释必须能够作为“预测社会现象的基础”。
笔转当下,文章指出数据、算力和算法的高精度预测三大条件已经满足,故基于机器学习的社会预测具备方法能力、学科意义和范式价值。具体来讲,本文中,机器学习内涵沿用了苏珊·艾希的社科语境下的定义通过开发适用于特定数据的计算机算法,实现聚类、分类及预测等任务(Athey,2018),外延被作者划定为监督学习与无监督学习,而机器学习以精度为主要目标的路径与传统的回归模型大相径庭。文章定义“社会预测”为“利用呈现社会现象或过程的时空局部数据,基于适当算法的机器学习,对时空外部的未知信息进行精确的量化测量,从而为社会决策和研究提供信息和依据”,及“计算社会学”为“借助复杂模型和社会计算工具对复杂社会现象与过程进行描述、解释和预测的定量社会学新领域。”
在此基础上,文章提出了社会预测的学术价值、治理价值和话语价值,以及范式突破意义。学术上可以拓展研究视野即获得潜藏指标、启发理论假说、助力因果推断、实现数据增生、推动理论创新;治理上,帮扶社会弱势群体、助力社会不平等研究、帮助公共卫生治理;话语上,发挥中国优势占领学术高地、降低社会治理成本、加快构建中国体系。文章认为,社会预测在认识论上淡化了绝对主义认识论色彩、形成了以精确估算目标变量为任务的问题范畴、减少了对理论和反事实框架的依赖、隐藏聚焦了预测精度这一通用规则,故会推动社会学研究的定性、定量和定量预测三分天下的范式样态的转变。

四点疑惑

阅读中,有因果性与可预测性间的关系、事后诠释和因果解释、以精度为目标以及“三大范式三分天下”四个方面的困惑。
其一,文章援引亨普尔和奥本海默“因果性解释必须能够作为预测社会现象的基础”认为“可预测性是因果机制成立的‘必要非充分条件’”可能存在逻辑漏洞。“因果性解释必须作为预测基础”讲的是因果性解释和预测社会现象的关系,而预测社会现象和可预测性显然不是一回事,存在概念混淆的嫌疑。但我没有看过相关材料,或许是我的问题。
其二,文章认为诠释性理解“只需要听起来有道理,完全可以仅仅是‘事后’的,或许有所不妥。就机器学习的取向,我们可以得到训练和测试的水准,但模型在预测集/测试集上的精度仅仅是作为”真实精度“或”预测精度“的近似值或者说估计。从这个意义上讲,不仅诠释性解释是”事后“的,机器学习对模型的拟合水平的认知也是如此:它要么是逃不出”已知数据“的归纳,要么也是”事后“的。
其三,文章指出机器学习总体模型的拟合目标是精度,可能还欠考虑。这是文章讨论的模型范畴和对机器学习模型的分类引申出来的小问题无伤大雅。
其四,文章预言未来范式是三个“子范式“即“定性、定量和定量预测的三分天下”,或许过于武断。范式的革命是一个解决解密活动中“反常现象“的过程,文章论述了预测方面的缺憾,但这种缺憾是否得到了广泛的共识、是否阻碍了研究的进步可能有待进一步的论述。总体上,这篇文章洞见充沛、结构清晰、论证严密,读下来受益匪浅,仅仅是将四个小疑惑记录于此。毕竟大概每一个人都想问:
新的时代来了吗?
notion image
附:论文思维导图(原图下载链接
notion image

© Reynard 2021 - 2024