大数据搜索与挖掘

产品与技术
大数据文本聚类
所属类别:大数据挖掘  浏览次数: 0

系统简介:


    大数据文本聚类能够对大数据文档进行自动梳理,归纳热点趋势,把内容相近的信息归为一类,按照热度进行排名,并自动为该类生成标题和主题词。适用于自动生成热点排行、热门事件识别、热点趋势发现等诸多应用。


主要功能:


能够从大数据中分析出热点类别,按照热度进行排名,并自动为该类生成标题和主题词。


应用案例:


大数据文本聚类已经应用在舆情监测系统中,如下是针对新闻大数据生成的结果图。


图:新闻大数据聚类结果展示


技术特点:


1、聚类速度快;


2、准确率高;


3、自动得到类别主题词


运行环境:


操作系统:Linux2.6及以上;Windows Server


硬件配置:PC即可,内存2G以上