大数据搜索与挖掘

产品与技术
机构名与地址搜索排重系统
所属类别:大数据搜索  浏览次数: 0

系统简介:


    AddrSmart机构名与地址搜索排重系统是灵玖中科软件(北京)有限公司自主研发的邮政地址与机构名智能匹配系统,可以快速便捷地匹配输入的任何地址片段,给出匹配出的最佳结果,并针对性地给出计算依据。 机构名搜索系统提供不同机构名的比对与排除采用机构名与地址搜索排重系统的内核,已经搭建了中国邮政集团的邮址搜索引擎系统,年搜索量过亿,运行稳定。 

    AddrSmart可应用于邮政、银行、保险以及广泛的公众服务。可提供地址标准化、地址去重与机构名去重等解决方案。


主要功能:


AddrSmart机构名与地址搜索排重系统三大功能: 


(1)地址搜索 


根据不规范的地址查询邮编,根据邮编查询地址;以及根据组织机构名查询邮编以及地址等。 


(2)地址查重与比对 


输入一批地址,自动剔除形式不一但物理属性一致的地址。输入两个形式不一致的地址,自动比对邮政地址的一致性。

 

(3)机构名查重 


针对同一机构不同简写、别名及笔误造成的重名问题,AddrSmart可以从大数据业务中自动搜索并检测出重复的机构数据,对数据进行清洗并整合。下面给出的是查重后的部分结果示例。 


北京希杰通汽车贸易有限公司 | 北京西杰通汽车贸易有限公司分公司 | 

白雨建材厂 | 北京白雨建材厂 | 北京白羽建材厂 | 

北京宝圣工贸有限公司 | 北京宝盛工贸有限公司 | 

薄涛制衣(中国)有限公司 | 帛涛制衣(北京)有限公司 | 

北京龙翔伟业工贸有限公司分公司 | 北京龙祥伟业工贸有限公司 | 北京尤祥伟业工贸有限公司


技术架构:


图:AddrSmart机构名与地址搜索排重系统技术架构


应用案例: 



目前已经应用于中国邮政集团、人民银行、统计局等涉及到地址与机构名大数据业务等多家单位。下面是


图:中国邮政集团邮址搜索服务应用AddrSmart核心技术


性能指标:


操作系统:Win/Linux/FreeBSD均可,支持32位/64位;SaaS API支持各类应用开发语言


数据库:支持MySQL,Oracle, SQL Server,Teradata等主流数据库


速度:单机每秒处理5000条记录


并行吞吐量:峰值处理2亿条大数据业务


硬件配置:单机、多机并行均可