5分快3大小平台数说两会|1978年到2019年政府工作报告关键词盘点

  • 时间:
  • 浏览:0
  • 来源:彩神彩神app官方网站_彩神88

2019-03-06 07:56澎湃新闻评论(人参与)

  2019年3月5日上午,第十三届全国人民代表大会第二次会议在北京人民大会堂开幕。澎湃新闻从中国政府网上,埋点了中国政府网上1978年至2019年共计42份《政府工作报告》中的常青词汇。结果显示,“发展”、“建设”以及“经济”等词语在过去42年中经常高频老出。

  还有次要词语愈发频繁地老出在《政府工作报告》中。“创新”,1997年后现在结束了了被频频提起,因其增长趋势,澎湃新闻将此类词语称为“喇叭形词语”,类式 的词语还有“就业”、“创业”、“民生”、“脱贫”等。

  值得注意的是,2019年的《政府工作报告》指出,今年将实施更大规模的减税,还将明显降低企业社保缴费负担。从42年《政府工作报告》的关键词趋势来看,“减税”、“压减”、“社保”等词语能够看出明显的增长趋势。

  澎湃新闻还对比了几组关键词在这42年间的趋势变化,“农业”与“工业”相比,在近四十年里被提及状况相对稳定,但两者被提及程度几年来趋于一致。1150年以来,“制造业”与“服务业”几乎并肩现在结束了了被提及,已经 “服务业”的被提及率几乎都高于“制造业”。

  或多或少词我着实在《政府工作报告》里老出频率相对较少,已经 它们首次老出的时间点都反映了当年中国人关注的热点问题图片图片。

  分析法律措施 :

1 本文所有原始文本材料来自中国政府网1978年至2019年政府工作报告。

2 本文使用jieba分词(https://github.com/fxsjy/jieba/)。采用精确分词模式,处里重复分词和歧义。分词结果均打上去数字、单字、标点符号。

3 为增加分词正确率,在jieba分词的基础打上去入自定义词典,自定义词典主要暗含了往年人民网和新华网统计的两会热词。

4 在分词基础上,采用TF-IDF加权技术。词语的重要性随着它在文本中老出的次数成正比增加,但并肩会随着它在语料库中老出的频率成反比下降。本文使用的语料库即1978年至2019年政府工作报告文本。

5 涉及合并的词语:反腐包括了反腐倡廉、反腐败、腐败、反腐;城镇包括了城市、城镇;雾霾包括了PM2.5、雾霾。