数据简介
政府注意力是指在特定时间内政府对于不同议题的关注程度。从公共管理学的角度出发,政府会优先分配资源给重点关注的对象。注意力被认定为一个稀缺性的指标反映了关注对象的程度。同时观察政府注意力也能反映相关政策的变迁和逻辑,从而理解政府对于该议题所采取的决策和行动。政府注意力作为反映政策资源配置导向的核心指标,其量化构建需依托精准的语义锚点。
而在注意力的建设上,方匡南等人(2025)采用了定向狄利克雷分布算法(latent Dirichlet allocation,LDA)从国家治理现代化的角度出发基于《人民日报》、《光明日报》与《新闻联播》在2009年1月至2021年8 月期间发布的新闻报道建立了国家治理指标用。区别于传统的LDA模型,定向LDA首先是基于先验词确定了特定的主题,因此目标的主题数固定为2从而避免了像传统LDA模型基于不同主题数产生的变化。同时,定向LDA的狄利克雷分布固定为2并且对于不同的主题狄利克雷分布都不同这也比传统的LDA设置统一的狄利克雷分布用于不同的主题更灵活以及准确。
本次政策注意力指标以 “政策”“法规”“改革”“治理” 等 12 个核心词汇作为先验词库,基于定向 LDA 模型构建差异化的主题识别框架。这有助于我们确定该文章是否为政策相关的报道与频率。因此,数据皮皮侠帮助大家收集了从2006年到2025年6月的《人民日报》、《光明日报》与《新闻联播》新闻数据。并通过TFIDF和TextRank技术对每篇文章选取50个关键词汇并找出相似词汇以确保每篇的主题词。再进行过压缩后采用政策相关的词汇比如‘经济’,‘发展’,‘政策’等核心词汇进行定向LDA模型的使用。最后通过日度和月度数据的整理确定其日度注意力指数和月度注意力指数的建设。在月度数据中注意力指数被 分成了初步和最终,参考论文最终月度指数是在初步月度指数的基础上除以参考基数并乘以100得到的。基数采用了和论文中一样的2013年7月为主的参数。
数据来源
数据来源于公开的《人民日报》、《光明日报》与《新闻联播》的报道,总共20435篇报道。
时间跨度
2006年-2025年6月
数据范围
日度数据和月度数据
数据格式
数据格式为Excel形式
数据指标
数据展示
日度数据
月度数据
参考文献
[1] 方匡南,戴明晓,郑挺国,等。国家治理政府注意力指数构建及其应用 —— 基于新闻文本的测度 [J]. 统计研究,2025,42 (03):131-145.