网络舆情监控技术
3.网络舆情监控技术
“网络舆情监测系统”是针对在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,民众对社会管理者产生和持有的社会政治态度于网络上表达出来意愿集合而进行的计算机监测的系统统称。
网络舆情监控系统能够利用搜索引擎技术和网络信息挖掘技术,通过网页内容的自动采集处理、敏感词过滤、智能聚类分类、主题检测、专题聚焦、统计分析,实现各单位对自己相关网络舆情监督管理的需要,最终形成舆情简报、舆情专报、分析报告、移动快报,为决策层全面掌握舆情动态,做出正确舆论引导,提供分析依据。
网络舆情监控系统架构一般包括三个层面:
1)采集层,这层包含了要素采集、关键词抽取、全文索引、自动去重和区分存储及数据库,可以对微博、论坛、博客、贴吧、新闻及评论、搜索引擎、图像和视频等数据信息进行采集。
2)分析层,该层可以对采集的数据信息实行自动分类、自动聚类、自动摘要、名称识别、正负性质预判和中文分词操作,保证分心的全面性。
3)第三层为呈现层,系统对采集分析的数据可以通过负面舆情、分类舆情、最新舆情、专题跟踪、舆情简报、分类评、图表统计和短信通知等形式推送给用户。
舆情监控系统对热点问题和重点领域比较集中的网站信息,如:网页、论坛、BBS等,进行24小时监控,随时下载最新的消息和意见。下载后完成对数据格式的转换及元数据的标引,对下载本地的信息,进行初步的过滤和预处理。对热点问题和重要领域实施监控,前提是必须用通过人际交互建立舆情监控的知识库来指导智能分析的过程。对热点问题的智能分析,首先在传统基于向量空间的特征分析技术上,对抓取的内容做分类、聚类和摘要分析, 对信息完成初步的再组织。然后在监控知识库的指导下进行基于舆情的语义分析,使管理者看到的民情民意更有效,更符合现实。最后将监控的结果,分别推送到不同的职禽邑部门,供制定对策使用。