客服问题多,就找萌萌客
  • 菜单
    客服问题多,就找萌萌客

    关于文本审核的技术与逻辑

    作者:萌逻辑  发表时间:2022-07-07 01:07
    【导读】
    文本审核的技术与逻辑就是把机器识别技术和人工审核结合起来(目前机器识别技术主要是辅助人工审核),对文本中的文字、图片等内容进行审核,看文本中有没有辱骂性文字、灌水、刷屏等垃圾信息。

    随着互联网的不断发展,网络安全隐患也逐渐的暴露出来,为了整顿互联网环境,国家的监管力度也是不断提升,内容审核的标准也在不断提升,暴力、血腥、政治、黄赌毒及危机青少年不良社会导内容向已成为重点关注区域。

    今天,萌萌客外包客服服务商的小编给大家带来的内容就是——内容审核中的文本审核的技术与逻辑是什么。

    关于文本审核的技术与逻辑

    文本可能是一个签名、一个词组,一段文本甚至是一篇文章,还有些文字附带在图片上,如一张海报,一张头像图等。从内容上分,内容应该分为三种,文字,图形与语言。在文字上来说,国内图书有中图法,国外有亚马逊分类法,高斯分类等。

    对于图片中存在的文字,识别最多使用的还是OCR(文本识别技术)。对于长短文本及变形变异字体中,会使用到垃圾文本处理技术(在AI技术来讲:CRF分词,NLP,n-gram算法,随机森林算法)随机森林指的是利用多棵树对样本进行训练并预测的一种分类器,通过对文本的处理进行归类,自动预测文本内容的形式。

    当你要做预测的时候,新的观察值随着决策树自上而下走下来并被赋予一个预测值或标签。一旦森林中的每棵树都给有了预测值或标签,所有的预测结果将被归总到一起,所有树的投票返回做为最终的预测结果。简单来说,99.9%不相关的树做出的预测结果涵盖所有的情况,这些预测结果将会彼此抵消。少数优秀的树的预测结果将会脱颖而出,从而得到一个好的预测结果。

    在对于上下段落中,突然出现的垃圾文本或不相关的文字或词组,会采用上下语义识别技术(LSTM深度神经网络,word-embedding)。此算法技术,会判断此句话中是否跟上下文结合,是否是一段无效的垃圾文本,最常见场景是我们在评论区随意敲打着一串自己都看不懂的文本。此技术很适合用于评论区的灌水,刷屏,甚至辱骂性的文字内容。

    客服在审核

    对于图片的识别,目前单靠机器识别,还无法满足审核的需求,目前机器识别技术只能辅助人工审核,暂无法全面机器审核。AI机器审核只相当于人类三岁的智商,还处于弱智能时代,所以为了增强内容审核安全及无延迟的用户体验,还是需要人工团队来审核的。

    内容审核除了有文本审核之外,还包括图像审核、视频审核、语音审核、直播审核和人脸审核。文本审核的技术与逻辑相信通过上面萌萌客外包客服服务商的小编的介绍您已经清楚了,下次小编带您看看内容审核中其他几类的技术与逻辑都是什么样的。

    【萌萌客:www.mmker.cn】提供专业的电商在线客服外包服务、电话客服及内容审核等服务,帮您简单客服难题。

    关键词
    相关文章 相关问题
    • 关于网络视频内容审核的规则

      在2019年中国中国网络视听节目服务协会为了加强对网络视频的监控,发布了《网络短视频平台管理规范》和《网络短视频内容审核标准细则》,规定了在网络短视频的节目、标题、名称、评论、弹幕、表情包等的语言、表演、字幕、背景中不得出现的一

      2022-07-07
    • 关于图片智能审核的内容

      像京东、淘宝、美团、饿了么这些平台每天会上传大量的图片,为了防止有违规的图片上传到平台上都会进行图片审核,图片审核包括人工审核和图像智能审核,智能审核虽然不像人工审核那么精细,但可以辅助人工审核提高效率。

      2022-07-07
    • 关于数据审核的内容有哪些?

      数据审核如果按审核的内容性质可以分为准确性审核、适用性审核、及时性审核和一致性审核,按照审核对象可以分为原始数据审核和二手数据审核。数据审核的意义就在于提高数据挖掘模式的质量,降低实际挖掘所需要的时间。

      2023-01-05
    • 关于内容审核定义,以及相关内容的介绍

      内容审核就是审核资讯类平台、网站上的用户产生的原创内容,避免发布到网上的内容有无法违纪、诈骗、色情等信息,审核的方式一般有主动和被动两种,不同的方式优缺点也不一样。本文将为大家详细介绍“内容审核”的相关内容。

      2023-08-26
    查看更多相似内容

    微信联系

    400-118-2016

    全国咨询热线

    13717595797

    方案咨询

    9:00-24:00

    即时服务

    咨询在线客服

    Copyright ©2006-2022 北京萌萌客网络科技有限公司 京ICP备17068726号