“动动嘴皮子”,AI就能知道你在说啥

[娱乐] 时间:2024-04-30 03:43:55 来源:蓝影头条 作者:综合 点击:86次
来源:新华网
  中评社北京3月1日电/据科技日报报导,动动道说虽然电视剧《狂飙》已经迎来了大结局,嘴皮但热度仍然没有丝毫减弱,动动道说有的嘴皮网友利用剧中人物创作娱乐视频,也有的动动道说网友剪辑其中精彩片段。不过,嘴皮还有一些“较真”的动动道说网友,发现《狂飙》中的嘴皮一些人物对话,配音和嘴型对不上,动动道说于是嘴皮便想通过人工智能进行唇语识别,还原最初的动动道说剧本情节。  然而,嘴皮AI读唇语并非只能被用于破译“隐藏剧情”。动动道说据统计,嘴皮我国听力残障人口超过2054万,动动道说除了主要的手语交流外,读唇语也是他们重要的沟通方式。但人工解读唇语容易受到个人经验、视觉感受能力、语言理解能力等因素影响,在正确率方面差强人意,于是人们开始尝试利用AI技术来解读唇语。  比唇语专家更懂唇语  “所谓AI读唇语,即人工智能唇语识别,其核心技术框架为视觉识别和自然语言处理。”北京理工大学计算机学院副教授、网络与安全研究所所长闫怀志介绍道,具体而言,就是利用机器视觉技术,将人脸从图像中连续识别出来,并提取其中连续的口型变化特征,输入至唇语识别模型,辨识出该人物口型对应的发音,进而输出可能性最大的表达语句。  “视觉识别和自然语言处理分别有着庞大的技术体系和不同的技术路线,但究其本质,都是通过大量的唇语数据来训练AI模型,力求文本输出的准确性。”闫怀志补充道。  近几年,不断有AI巨头开始在唇语识别赛道上作出尝试。谷歌旗下Deep Mind公司就与英国牛津大学合作,研发出了一款AI读唇语软件,通过让AI读唇语软件“收看”数千小时的电视节目来训练其唇语识别能力。有意思的是,在随机抽取200个视频片段的读唇语测试中,AI读唇语软件的准确率达到了46.8%,而经过专业训练的人类读唇语专家,准确率仅为12.4%。  为何AI读唇语能够悄然兴起?闫怀志给出了自己的分析:一是强烈的需求牵引,二是巨大的技术推动。从需求牵引来说,唇语识别不仅可为部分残障人士提供方便,更可以在公共安防等诸多领域发挥巨大作用;从技术推动来说,由于AI算法、算力以及数据瓶颈被不断突破,使得AI技术在唇语识别领域取得较大成功成为现实。

(责任编辑:时尚)

    相关内容
    精彩推荐
    热门点击
    友情链接