大數(shù)據(jù)和機(jī)器學(xué)習(xí)在社會(huì)科學(xué)中的應(yīng)用
一、文章來源
[1] King G, Pan J, Roberts M E. How Censorship in China Allows Government Criticism but Silences Collective Expression[J]. American Political Science Review, 2013, 107(02): 326-343.
[2] Jiang J, Meng T, Zhang Q. From Internet to social safety net: The policy consequences of online participation in China[J]. Governance, 2019: 1–16.
二、主要內(nèi)容
King et al(2013)首次大規(guī)模、多源頭分析了網(wǎng)絡(luò)審查機(jī)制。在政府發(fā)現(xiàn)、評(píng)估和審查之前,研究人員從中國1400個(gè)不同的社交媒體網(wǎng)站自動(dòng)定位、下載和分析上百萬的社交媒體信息。通過計(jì)算機(jī)輔助的文本分析方法,King等對(duì)比了在85個(gè)不同話題領(lǐng)域中受審查和未受審查的信息。和以往研究不同的是,對(duì)國家、領(lǐng)導(dǎo)人和政策進(jìn)行批評(píng)的信息并非最有可能受到官方審查和刪除。作者發(fā)現(xiàn)審查機(jī)制的目的是刪除描述、加強(qiáng)和激發(fā)群體性事件的信息。政府進(jìn)行網(wǎng)絡(luò)審查的目的是預(yù)見正在發(fā)生或者有可能在未來發(fā)生的群體性事件。
電子技術(shù)的進(jìn)步推進(jìn)了治理的現(xiàn)代化,在過去的20年間,世界范圍內(nèi)多個(gè)國家的中央和地方政府都建立起了以互聯(lián)網(wǎng)為基礎(chǔ)的平臺(tái)來與民眾保持溝通。在日本、美國、中國、哥倫比亞、烏克蘭等國,網(wǎng)絡(luò)參與(也作“電子參與”)已經(jīng)成為公民聯(lián)系政府并表達(dá)他們?cè)V求與不滿的最常見方式。由此,網(wǎng)絡(luò)參與的興起催生了許多圍繞于此的學(xué)術(shù)探討。盡管這些探討對(duì)互聯(lián)網(wǎng)擴(kuò)大公民參與、提高政府回應(yīng)性以及促進(jìn)政府決策的透明化和平等化保持樂觀態(tài)度,但是互聯(lián)網(wǎng)是否真的能有效地推動(dòng)政策變化仍然受到學(xué)者質(zhì)疑。因此,在這篇文章中,三位作者通過對(duì)中國網(wǎng)民在地方領(lǐng)導(dǎo)留言板(Local Leader Message Board, LLMB)上的留言進(jìn)行分析,為網(wǎng)絡(luò)政治參與推動(dòng)政治平等、削弱不同群體間政治影響力的差異,尤其是對(duì)弱勢(shì)群體有補(bǔ)償效應(yīng)提供了新的證據(jù)。
這兩篇文章是利用大數(shù)據(jù)和機(jī)器學(xué)習(xí)的經(jīng)典之作,而隨著大數(shù)據(jù)應(yīng)用的日益廣泛、深度學(xué)習(xí)技術(shù)的不斷突破以及人工智能浪潮的快速興起,這種基于海量數(shù)據(jù)的分析方法日益成為公共管理領(lǐng)域研究的重要手段。本期活動(dòng)將與大家共同探討網(wǎng)絡(luò)爬蟲的基本原理、如何使用Python抓取和存儲(chǔ)網(wǎng)頁信息、如何通過半監(jiān)督學(xué)習(xí)對(duì)海量數(shù)據(jù)進(jìn)行處理等,或許為大家的研究打開一扇新的大門。
Python下載地址:https://www.python.org/getit/
pycharm下載地址:http://www.jetbrains.com/pycharm/
三、導(dǎo)讀人介紹

王友奎,清華大學(xué)公管學(xué)院博士生,研究方向?yàn)殡娮诱?wù)和大數(shù)據(jù)。

黃梅銀,張楠老師研究助理,研究方向?yàn)殡娮诱?wù)。

黃昊,清華大學(xué)公管學(xué)院博士生,研究方向?yàn)榇髷?shù)據(jù)與社會(huì)風(fēng)險(xiǎn)治理。
四、導(dǎo)讀人寄語
大數(shù)據(jù)在社會(huì)科學(xué)研究中的作用日益凸顯,本次訓(xùn)練營通過對(duì)兩篇經(jīng)典的利用大數(shù)據(jù)的文章進(jìn)行導(dǎo)讀,讓同學(xué)們了解互聯(lián)網(wǎng)審查機(jī)制和互聯(lián)網(wǎng)對(duì)政策變化的作用。通過對(duì)網(wǎng)絡(luò)爬蟲的基本原理的介紹,現(xiàn)場(chǎng)實(shí)操如何使用Python抓取和存儲(chǔ)網(wǎng)頁信息、如何通過半監(jiān)督學(xué)習(xí)對(duì)海量數(shù)據(jù)進(jìn)行處理,讓同學(xué)們初步掌握網(wǎng)絡(luò)數(shù)據(jù)獲取的技術(shù)。本次的導(dǎo)讀的三位也是大數(shù)據(jù)學(xué)習(xí)和使用的愛好者,歡迎大家一起學(xué)習(xí)、共同進(jìn)步。
時(shí)間:5月17日(周五)18:00-20:00
地點(diǎn):公管學(xué)院620
溫馨提示:為了提高學(xué)習(xí)效果,建議講座前提前閱讀論文并下載有關(guān)程序。因?yàn)橹v座期間要在較短的時(shí)間內(nèi)吸收大量知識(shí),要提前準(zhǔn)備才能跟上節(jié)奏!歡迎清華各院系同學(xué)參加!