大数据搜索与挖掘

产品与技术
多民族语言搜索
所属类别:大数据搜索  浏览次数: 0

系统简介:


    JZSearch多民族语言精准搜索引擎是灵玖软件针对少数民族语言搜索的需求而打造的一款搜索系统,它能够依据少数民族语言用户的特点,方便快捷地构建精、准、快的搜索服务。当前的搜索大部分都需要内置一部核心词库,而维语、藏语、蒙语、阿拉伯、哈萨克斯坦,韩语等多种少数民 族语言往往缺乏相关的电子资源,整理一部词典往往费时费力。JZSearch少数民族语言全文精准搜索引擎支持无词典模式,采用先进的N-Gram模型, 可以构建高速的索引与搜索。

 

    JZSearch少数民族语言精准搜索引擎采用了灵玖软件在自然语言理解、信息检索方面的先进技术成果,融合多年在信息发现整合方面的工作积累,弥补了当前少数民族语言搜索的空白。 



主要功能:


JZSearch多民族语言精准搜索引擎主要功能包括: 


*一套系统同时支持搜索维语、藏语、蒙语、阿拉伯、哈萨克斯坦,韩语等多种少数民族语言; 


*支持文本、数字、日期、字符串等各种数据类型,多字段的高效搜索;

 

*支持数据库,文件,网页等检索 


*支持丰富的查询语法,支持与、或、非以及邻近运算;



应用案例:


目前已经应用于新疆维吾尔语的搜索与舆情分析。 


图 维吾尔语搜索


图 朝鲜语搜索


图 蒙古语搜索



JZSearch多民族语言精准搜索引擎性能:


单台采集器性能:     采集网站数:1000个        每秒采集页面数:35页   平均占用带宽:1M-2M 


索引和分析服务器:  分词平均速度:20MB/s    索引平均速度:10MB/s   处理信息量:TB级别


运行环境:


操作系统:Linux2.6及以上;也可支持Windows Server


数据库:MySQL5.0及以上,可定制为Oracle, SQL Server


应用服务器:Tomcat5.x及以上、WebSphere Server、WebLogic Server


集成应用系统平台:J2EE


浏览器:MS Internet Explorer 6.0 SP2以上


硬件配置:1台服务器即可