大数据搜索与挖掘

产品与技术
微博舆情监控系统
所属类别:大数据应用  浏览次数: 0

系统简介:


    微博客(microblogging或microblog,简称微博)起源于美国的Twitter (twitter.com),是一种允许用户及时更新简短文本(通常少于140字)并可以公开发布的博客形式。截至2011年12月底,根据各自官方网站的报告,新浪微博用户数已达到3亿,腾讯微博用户数已达到3.3亿,网民使用率超过50%。

 

    微博是一种革命性的社会媒体工具,大多数用户成为其积极的内容产生者。它的信息传播速度快,影响范围广,实名用户数量庞大,与真实社会相互交融,密不可分。微博已经逐渐超越电视、新闻、论坛,成为舆情话题产生和传播的主要场所,成为社会舆情的引爆点与主战场。在2009年,Twitter引爆摩尔多瓦颜色革命并进行活动串联,导致重大动乱,成为微博第一例参与社会重大活动的案例;2011年风起云涌的阿拉伯之春、伊朗骚乱,以及震惊世界的伦敦骚乱等,也处处渗透着微博的力量;2012年初的“王立军事件”是微博发展过程中的一个重要事件,2月9日晚间的微博故事或可在新闻史上留下一笔,据监控数据显示,新浪微博2月9日的PV峰值为220000000,超过去年的最高峰值190,000,000,并将今年以来的PV均值拉升201,038,400。通过微博,大家分享各类信息,并发表各自的观点,表达个性化的感情,形成社会舆情,最终直接影响国家安全与社会稳定。可以说,网络信息和社会信息的交融对社会的直接影响越来越大,甚至关系到国家信息的安全和社会的长治久安。


    WBK微博舆情监控系统是灵玖软件针对政府社会舆情、企业危机公关等需求,耗时2年,打造的一套微博监测、预警、监控与公关于一体的解决方案,实现指定博主列表监测与敏感主题监测,目前已积累了近一亿的微博用户数据,每日常规获取数据超过1000万条,实时采集实时搜索,适用于各类微博监测与企业微营销。



主要功能:


    微博搜人:内置1亿微博人物基本信息,根据灵玖自主研发的JZSearch精准搜索引擎依据职业、性别、工作、教育、行业及各类个性化特征筛选出潜在的监控对象;


    个性分析:依据微博博主的基本属性、行为规律、发布的内容及其关系网分析微博用户的个性特点,兴趣爱好及其社会圈子;


    微博监控:根据指定的监控列表,实时跟踪监控列表的言行,及时发现最新信息并及时识别有价值信息,方便舆情监测者一览无余;


    舆情热点每日发布最新热点话题、热门网站、热门文章与作者;


    舆情追踪能够24小时不间断地对监控全面,系统自动进行首发地址的追踪、统计走势和传播路径的分析,实现事件话题追踪、网站追踪、人物追踪、地域追踪、机构追踪以及活跃分子追踪,实现全方位立体式舆情追踪,不留死角;


    舆情预警通过监控知识库的判断和分析,一发现负面问题就及时产生报警消息,并推送给管理部门知晓,使之及时掌握舆情爆发点和事态发展趋势,真正起到了"网络监督员"的作用;


    舆情报告提供傻瓜式服务,日日简报,月月专报,要事快报。报告内容图文并茂,提供了大量的统计分析和网民观点分析,能够为辅助决策提供很大帮助。


图1:微博搜人展示

图2:微博博主个性兴趣分析展示图

图3:微博人物关联图



应用案例:


目前已经应用于北京市网络监管部门、某上市公司等单位。


性能指标:


单机每日采集微博数200万,实时监测微博账号2000个(内置微博用户数据1亿条,历史微博内容10亿条);


微博信息发布到搜索时延10ms;


运行环境:


操作系统:Linux2.6及以上;也可支持Windows Server


关系数据库:MySQL5.0及以上,可定制为Oracle, SQL Server


应用服务器:Tomcat5.x及以上、WebSphere Server、WebLogic Server


集成应用系统平台:J2EE


浏览器:MS Internet Explorer 6.0 SP2以上


硬件配置:至少2台服务器,最优配置5台服务器