

一、邮址匹配的主要问题
邮政、银行、保险以及广泛的公众服务都会涉及到邮政地址,需要判别邮址的正确性,判别是否有意的地址欺诈行为,也需要依据邮址在内部CRM系统中和已有的客户信息进行关联挖掘分析。但是,人们在书写地址的时候,往往极其不规范,很难做到模糊匹配,准确挖掘有价值的信息。
在实际情况中,中文地址名的匹配存在较大的困难,这是由于中文地址名存在多种约定俗成的表示方式,主要存在如下情形:
1.标准表示,如:"北京市|海淀区|中关村|甲331号|怡升园商务公寓|8单元|14层"等。其中"|"为内置的不同段地址的分隔符。
2.地址的缩略表示,如:北京海淀,怡升园等
3.组织机构名及缩略形式,如:"灵玖中科软件(北京)有限公司","灵玖软件","北京科大"
4.信箱,如:北京3709信箱48分箱
5.复杂的门址形式,如:8单元|14层可以多样化地表示为8-14,八单元14层,也可以是八门一十四层等等。
6.复杂的混合形式,如:"北京市|海淀区|中关村|甲331号|怡升园商务公寓|8单元|14层|灵玖软件|市场部"。
二、我们能为您解决什么(白皮书下载、咨询及在线测试)
灵玖AddrSmart邮址精灵系统是灵玖中科软件(北京)有限公司自主研发的邮政地址智能匹配系统,可以快速便捷地匹配输入的任何地址片段,给出匹配出的最佳结果,并针对性地给出计算依据。
AddrSmart充分融合了灵玖软件在自然语言理解、信息检索等方面多年的技术积累,具有智能、高效、自学习三大特点。智能主要体现在系统可以智能识别用户输入的真实意图,智能模糊匹配后台知识库,进行逻辑推理,并给出逻辑推理的知识依据;高效体现在本系统可以单机每秒处理5000条记录;自学习是指整个系统无需人工干预,直接导入正确标注的邮编数据,即可完成整个系统的学习,自适应地调整处理结果。
AddrSmart主要功能包括:(1)地址纠错;(2)智能模糊匹配;(3)多种门址号码识别
三、AddrSmart的核心技术优势特色:
1.智能模糊匹配:
AddrSmart可以模糊匹配用户的各种形式的输入,包括简略的输入,智能地匹配上相关的邮编数据。
2.快速高效:
AddrSmart单线程每秒可以处理5000条数据。
3.准确率高:
根据80万条地址的实际测试,准确率高达99.97%。
4.准确率高:
AddrSmart支持多线程,可以应用于互联网服务。
5.智能学习功能:
AddrSmart的所有知识库自动学习已经正确标注过邮编的数据即可获取,无需复杂的人工干预。
6.技术先进:
AddrSmart综合运用了自然语言理解技术、信息检索技术、模糊匹配与机器学习技术,技术含量高。
四、AddrSmart典型案例
中国邮政集团邮址搜索 www.cpdc.com.cn
中国地搜网 www.86disou.com