系统介绍

互联网已经成为政府了解民情的直接渠道,也是新形势下政府的重要舆论阵地。因此,网络舆论一旦被错误地控制和引导,将成为影响社会稳定的重大隐患。如何应对网络舆情,目前正在考验着我国各级政府。当网络舆情发生时,政府需要从传统的“灭火式”处置网络舆情,到坦荡透明地面对舆论,将负面舆情转化为展示正面形象和树立政府公信力的机会,打造良好的政府形象。政府通过采样、采用科学的检测方法收集和分析舆情,以及政府形象评比、采用新的传播理论、启动新的媒体公关等方式建设政府媒介公关和品牌传播。

北科维拓网络舆情监控分析系统通过融合最新的海量信息自动搜集、全文搜索和数据挖掘技术可以24小时监控成千上万的网站、论坛和博客的变化,帮助用户及时、全面、准确地掌握各种商业信息和网络动向,从而提高自身的竞争力和事件追踪能力。通过对信息进行进一步的整理、分析,系统还可以为客户决策提供高价值的市场参考及危机处理服务。

系统对舆情的处理按照信息采集、舆情过滤、自动分类、相似性排重、舆情分析、舆情展示的流程推进,整个系统由四部分组成,分别是信息采集子系统、信息预处理、舆情处理分析子系统和舆情管理子系统。

信息采集子系统

系统采用搜索引擎技术加全网站采集方式实现对互联网全网信息的采集。搜索引擎技术实现对全网的海量数据进行搜索,对搜索的结果进行动态收集、分析、提取,即时收集全网信息;全网站采集方式,是兰州北科维拓科技股份有限公司经过长期积累对互联网的各个网站进行逐一分析,时时对各个网站进行数据抓取、分析、收集信息,这种方式避免了搜索引擎在搜索时对于非主流网站不能收录的问题,避免信息漏控。

信息预处理

互联网信息量非常大,往往有很多信息都是垃圾信息,比如网站的一些广告信息,论坛中的一些灌水回复等等,这些垃圾信息在互联网中占据了很大的信息量。这些垃圾信息在做情报分析时,往往是一个干扰项,非但不能对信息分析起作用,反而会引起分析不准确,造成情报误判。本系统在采集过程中就进行了垃圾信息过滤,这样可以对系统的传输、存储、后期分析减轻压力,提前减少情报误判的因素。

舆情处理分析子系统

通过双重筛选机制,自动筛选出与“我”有关的舆情;自动排除与“我”有关舆情中不具有舆情价值的信息;

双重筛选机制将重要舆情过滤出来,将不具备舆情价值的信息排除掉,更有利于舆情影响和舆情价值的分析,舆情工作变得有的放矢。

基于内容对经过双重过滤处理后的重要舆情自动分类,无需人工干预,准确率达到85%以上。先设置分类关键词,每一个关键词都设置一个相应的优先级分值。对收集到的文章内容进行分析,分别对标题和内容进行匹配,统计匹配的次数,然后根据设定好的关键字匹配模型对每个关键字进行分值计算。分值超过一定分值的都将自动处理所对应的处理,匹配分值最高的关键字就自动分类。

采用“文章相似性技术”根据文档内容的匹配程度确定是否重复,比利用网页标题和大小等规则判断具有更强的准确性、实用性以及运行效率。采用中文分词技术对文章关键字比较计算,得出文章相似度,相似度高于0.75以上的文章系统默认处理为“已处理”,无需再进行任何操作,相似度位于 0.5-0.75 之间的相似转载文章需要用户在页面进行再次确认,确保文章无漏处理。

根据采集信息的特点进行分类别的数理统计、分析,包括论坛点击、热帖、转载、新闻热点重复信息等,从多个角度进行数理分析,从而将杂乱无章的文字信息整理成可以直观感受的数据报表,将舆情分析数字化,找出舆情数字规律,以数字的形式表现舆情数据,保证了舆情分析的准确性。

舆情管理子系统

 舆情管理子系统是系统的前端展示模块,用户在使用系统时,接触的最多的就是这个模块。系统采用多种形式将用户关注的舆情分门别类地呈现给用户,用户浏览舆情即洞悉网络舆论发展的全貌。