2024-6-12 14:03

基于流式计算的垃圾短信治理关键技术研究

本文版权为《邮电设计技术》所有,如需转载请联系《邮电设计技术》编辑部

摘要:某运营商在现网垃圾短信治理中,常采用关键字+规则的方法,难以在拦截成功率和误拦正常短信之间找到平衡。基于文本语义分析识别垃圾短信,则需要解决大数据挖掘算法、海量数据处理、响应时效等问题,因此在大业务量的集约化平台上应用并不广泛。通过算法研究、开发原型系统等工作,探索基于流式计算的垃圾短信治理技术方案,研发了一套基于Storm+Mahout架构的垃圾短信识别原型系统,完成了性能和准确率测试,取得了较好的效果。

关键词:垃圾短信治理;自然语言处理;大数据;流式计算

doi:10.12045/j.issn.1007-3043.2024.05.010

前言

通信技术的进步、移动终端的普及和移动通信网络的能力提升为移动信息服务在中国的推广带来了机遇。根据工信部统计数据,2022年我国移动短信业务总量为118 748亿条,比上年同期增长6.4%,移动短信业务收入为 401 亿元,比上年同期增长 2.7%。其中,个人短信市场收入为22.7亿元,占比5.7%;验证码服务市场收入为131.39亿元,占比32.8%;行业应用短信服务市场收入为102.73亿元,占比25.6%;其他企业短信市场收入为 143.98 亿元,占比 35.9%。近年来,由于微信、line等社交通信技术的快速发展,国内个人短信业务呈现快速下滑态势,而企业短信业务整体维持良好的增长态势。

企业短信是当前国内行业移动信息服务的主要产品形式,它充分满足了金融、交通运输、电子商务、零售商贸、文化传媒、公共服务等行业集团客户的移动信息应用需求。企业短信在为用户提供便捷消息服务的同时,也为信息垃圾的传播提供了一条方便的渠道。垃圾短信不仅影响用户正常通信业务的使用,严重时还可能被犯罪分子利用进行违法活动。因此,垃圾短信作为热点问题一直受到社会各界的广泛关注。运营商作为短信的运营和监管者,承受着巨大的社会压力。同时,垃圾短信也严重影响了用户对运营商的信任,破坏了运营商长期建立的良好声誉。

点击查看全文(PDF)>

作者:王九九,狄秋燕,马永亮   来源:邮电设计技术

相关

短信运营商数据挖掘测试移动通信
本评论 更新于:2024-9-8 7:39:33
在C114 APP中与业内人士畅聊通信行业热点话题!