一、邮址匹配的主要问题

邮政、银行、保险以及广泛的公众服务都会涉及到邮政地址,需要判别邮址的正确性,判别是否有意的地址欺诈行为,也需要依据邮址在内部CRM系统中和已有的客户信息进行关联挖掘分析。但是,人们在书写地址的时候,往往极其不规范,很难做到模糊匹配,准确挖掘有价值的信息。

在实际情况中,中文地址名的匹配存在较大的困难,这是由于中文地址名存在多种约定俗成的表示方式,主要存在如下情形:

1.标准表示,如:"北京市|海淀区|中关村|甲331号|怡升园商务公寓|8单元|14层"等。其中"|"为内置的不同段地址的分隔符。

2.地址的缩略表示,如:北京海淀,怡升园等

3.组织机构名及缩略形式,如:"灵玖中科软件(北京)有限公司","灵玖软件","北京科大"

4.信箱,如:北京3709信箱48分箱

5.复杂的门址形式,如:8单元|14层可以多样化地表示为8-14,八单元14层,也可以是八门一十四层等等。

6.复杂的混合形式,如:"北京市|海淀区|中关村|甲331号|怡升园商务公寓|8单元|14层|灵玖软件|市场部"。

二、我们能为您解决什么(白皮书下载、咨询及在线测试

灵玖AddrSmart邮址精灵系统是灵玖中科软件(北京)有限公司自主研发的邮政地址智能匹配系统,可以快速便捷地匹配输入的任何地址片段,给出匹配出的最佳结果,并针对性地给出计算依据。

AddrSmart充分融合了灵玖软件在自然语言理解、信息检索等方面多年的技术积累,具有智能、高效、自学习三大特点。智能主要体现在系统可以智能识别用户输入的真实意图,智能模糊匹配后台知识库,进行逻辑推理,并给出逻辑推理的知识依据;高效体现在本系统可以单机每秒处理5000条记录;自学习是指整个系统无需人工干预,直接导入正确标注的邮编数据,即可完成整个系统的学习,自适应地调整处理结果。

AddrSmart主要功能包括:(1)地址纠错;(2)智能模糊匹配;(3)多种门址号码识别

三、AddrSmart的核心技术优势特色:

1.智能模糊匹配:

AddrSmart可以模糊匹配用户的各种形式的输入,包括简略的输入,智能地匹配上相关的邮编数据。

2.快速高效:

AddrSmart单线程每秒可以处理5000条数据。

3.准确率高:

根据80万条地址的实际测试,准确率高达99.97%。

4.准确率高:

AddrSmart支持多线程,可以应用于互联网服务。

5.智能学习功能:

AddrSmart的所有知识库自动学习已经正确标注过邮编的数据即可获取,无需复杂的人工干预。

6.技术先进:

AddrSmart综合运用了自然语言理解技术、信息检索技术、模糊匹配与机器学习技术,技术含量高。

四、AddrSmart典型案例

中国邮政集团邮址搜索 www.cpdc.com.cn

中国地搜网 www.86disou.com