九游官方网页版-九游(中国)





    1. 咨询热线:021-80392549

      九游官方网页版-九游(中国) QQ在线 九游官方网页版-九游(中国) 企业微信
      九游官方网页版-九游(中国)
      九游官方网页版-九游(中国) 资讯 > 人(rén)工智能 > 正文

      嘘!AI正在悄(qiāo)悄听懂(dǒng)你(nǐ)说的话

      2019/02/12机器人460

      小(xiǎo)时候看(kàn)特务电影时,特工们往往有(yǒu)一项必备的(de)技能,就是隔着几百米远盯着(zhe)正在说话的对(duì)象,从嘴(zuǐ)型(xíng)判断(duàn)出对方(fāng)在说什么。有(yǒu)了(le)这种记忆,导致如今看什么语音(yīn)识别技(jì)术都觉得相(xiàng)当一般——我都说出声儿了你(nǐ)才听懂,算(suàn)什么AI好汉。

      不(bú)过最近一项(xiàng)专利申请表(biǎo)明,微软正在向特工学习,推出了无声语(yǔ)音识别(bié)技术(shù)。当AI也能像特工一样,无声(shēng)之(zhī)中辩人言(yán),我们(men)的世界究竟会有什(shí)么不同?

      除(chú)去(qù)唇语识别,AI还有什么方式悄(qiāo)悄听懂你的话?

      说起无声语(yǔ)音识别,可能很多人第一反应就(jiù)是复制人类(lèi)的方式,利(lì)用图像(xiàng)识(shí)别进行辩读(dú)唇(chún)语。而利用唇(chún)语进行语(yǔ)音识别这种方式也由来已久,但是识别的准确率一直不算(suàn)高。DeepMind曾(céng)在2016年做过测试(shì),经(jīng)过1万小时(shí)的新(xīn)闻视频(pín)训练(liàn),AI唇语准确率达到了46.8%。国内有一家企(qǐ)业曾经提供过相关数据:在对中文新闻视频的识别中,准确率达到了70%。而搜狗(gǒu)所推出的驾驶场景(jǐng)下的唇(chún)语(yǔ)识(shí)别,因为涉及到的词汇量很少,准确率能够(gòu)达到90%。

      可以发现(xiàn),相比现在主流语音识别动(dòng)辄95%、97%的准(zhǔn)确率,唇语识(shí)别准确程(chéng)度实在是有些(xiē)拿不上台(tái)面。对于中文这种一字一音节的语言来说还好,对于英(yīng)文这种连音很多的语言来说(shuō),唇语识别要跨越的门槛确实不(bú)小。

      另一方面来看,唇语识(shí)别(bié)所涉及到伦理问(wèn)题实在过于严重。唇语识(shí)别的(de)“射程”太远,如果这种技术真的(de)发(fā)展成熟,意(yì)味着天(tiān)网之下的我(wǒ)们在交谈时将再无隐私(sī)。在隐私焦虑越来越浓的(de)今天,哪家企业(yè)公(gōng)开研究这项(xiàng)技术,只怕是(shì)觉(jiào)得自己家的公关(guān)部门过得太(tài)清闲(xián)。

      因此(cǐ)包括微软(ruǎn)在内(nèi)的产业和学界,都在(zài)寻(xún)找一种(zhǒng)更精准也更(gèng)隐私的无声语(yǔ)言识别。目前看来,无声(shēng)语音识别的技术(shù)方(fāng)向可以被(bèi)分为两个“派系”,一是“气宗(zōng)”,另一个(gè)是“电宗”。

      微软(ruǎn)所提(tí)交的专利(lì),就是典型(xíng)的“气宗(zōng)”——在终端上添加传感器,通(tōng)过感知(zhī)用(yòng)户说话(huà)时的(de)气流来判断用户说话的内(nèi)容。这(zhè)种(zhǒng)终端如同一只小型麦克风,置于用户(hù)嘴边,用户在说话时形成的气(qì)流会在设备中形成反射,经过训练,可以将这(zhè)些气流反射的信(xìn)号和文字(zì)一一对应(yīng)。

      而“电宗”则更(gèng)加神奇,我(wǒ)们知(zhī)道人在(zài)说(shuō)话时需要调动整(zhěng)个下半(bàn)张脸的肌肉,不同的文字发(fā)音所调动肌肉的方(fāng)式也并不相同(tóng)。通过对面(miàn)部(bù)EMG(肌电)信号的采集,来学习(xí)人类说话(huà)时面部EMG信号特(tè)征,并通过神(shén)经(jīng)网络的(de)训练将EMG信号和文(wén)字对(duì)应起来。

      可以看出这两种无声语音识别(bié)都有一个共同的(de)特点,那(nà)就(jiù)是(shì)自主性和私密性。不管是(shì)EMG信号采集(jí)还是气(qì)流采集,都需要在讲(jiǎng)话(huà)者身上佩(pèi)戴好设(shè)备,而不是(shì)像图像技术一(yī)样(yàng),能够(gòu)在远程且讲话者不知情的情况下进行采集分析。

      无声语音识别变成(chéng)真·气功(gōng)?

      不论是气宗还是电宗,这些无声语音识(shí)别(bié)技术都(dōu)面临着同样(yàng)的问题——既(jì)然要用(yòng)户把话(huà)说出来才能进行识别,那为什么不直接应用语音识别来进行(háng)文字转换(huàn)和(hé)翻译,非要弄一(yī)些(xiē)和“气功”一样(yàng)没有切(qiē)实应用场景的花招(zhāo)?

      其实无声(shēng)语音(yīn)识别的应用,可(kě)能不像(xiàng)大家想象的那样广泛,它(tā)既不能以最(zuì)高效的方(fāng)式帮助听障人士(shì),也不允许被应用于监听等等工作。但在(zài)一些(xiē)关键(jiàn)场合下(xià),无声(shēng)语(yǔ)音识别却可(kě)以发挥出奇用(yòng)。

      我们(men)可(kě)以一(yī)起开动脑筋,想想在(zài)哪里人(rén)们需要说话(huà),但却(què)听(tīng)不(bú)到(dào)彼此的声(shēng)音。答案很简单,要么是(shì)在声音无法传播的(de)地方,要么是(shì)在(zài)一些特别嘈杂的地(dì)方。于是无声语音识别就有了如下的(de)应用场(chǎng)景:灾(zāi)害现(xiàn)场、舱外(wài)探(tàn)索、水下作业……

      在这类场所中,人们(men)或许为(wéi)了躲避被(bèi)污染的空气、或许为了(le)呼吸氧气,都(dōu)会穿上类似(sì)生化服、宇航(háng)员服等等(děng)特殊(shū)服装。穿上之(zhī)后既看不到对方的表情,也听不到对方的声音,更没办法用语音交互去控制其(qí)他(tā)设备了(le)。同时(shí)环境情况(例如氧气(qì)不够充足)往往不允(yǔn)许人们以正(zhèng)常的声音说话,加(jiā)上(shàng)防护(hù)服的封(fēng)闭状况会引起(qǐ)声(shēng)音的回响,以往的(de)有声语音识别在这种情况下(xià)很难发挥作用(yòng)。

      这时可以被安(ān)置在防护服内部的无声语(yǔ)音(yīn)识别就显得很有价值,讲话(huà)者只(zhī)需要做出口型就能(néng)向外界传递信息。

      除此(cǐ)之外还有嘈杂的马路、工厂车(chē)间、机场……

      在(zài)这(zhè)些场所中(zhōng),想要让(ràng)对方(fāng)听清自己的声音,往(wǎng)往(wǎng)需要(yào)扯着(zhe)嗓子(zǐ)吼。想让语(yǔ)音识(shí)别准确拾(shí)音,更是难上加难。这(zhè)时利用无声语(yǔ)音识别(bié)就会轻松很多,不仅可以(yǐ)准确表达信息,也能让一(yī)些处于这(zhè)种场(chǎng)合的工作人员戴上(shàng)隔音耳塞(sāi)保护自(zì)己的听力。

      实际上(shàng)目前在欧洲一些型(xíng)号的(de)战斗机中,就因为(wéi)机(jī)舱内噪(zào)音巨大(dà)、飞行员之间无法沟通,已经应用上(shàng)了EMG信号无(wú)声语音识别(bié)技术。

      当然,目前相比语音识(shí)别技(jì)术、甚至相比唇语语音(yīn)识别,无声语音识(shí)别技术的发展阶段(duàn)还(hái)很(hěn)初级,应用效率也(yě)不高。

      实际上无声语(yǔ)音识别是(shì)一项典型(xíng)的“美好而无用”的AI技术,它既完美体现了一系列技术的排(pái)列(liè)组(zǔ)合(hé),例如EMG信号无声语音(yīn)识别所体(tǐ)现出的AI与神(shén)经学的结合;又在应(yīng)用上极大(dà)程度的受限,即使(shǐ)在一些声音难以传播的(de)场(chǎng)景下,也要考虑计算条件、识别语音(yīn)后信(xìn)息再传递的媒介,更不用提复(fù)杂的数据收集(jí)工作了。

      但我们有理由相信,在未来AI技(jì)术越(yuè)来越普(pǔ)及化、应用成本越来越低时(shí),总会(huì)出(chū)现一些极端场(chǎng)景应用上这些看似无用的(de)技术——也许未来(lái)有一(yī)天,战斗(dòu)机的控制(zhì)也要(yào)应用上语(yǔ)音交互呢?

      关键词(cí): 人工(gōng)智能(néng) 机器人




      AI人工智能网声明(míng):

      凡(fán)资讯来源注明为其他媒体来(lái)源的信息(xī),均为转(zhuǎn)载自其他媒体,并不代表本(běn)网站赞同其观点,也(yě)不代表本(běn)网站对(duì)其真(zhēn)实性负责。您(nín)若对该文章内容(róng)有任何(hé)疑问(wèn)或质(zhì)疑,请立(lì)即与网(wǎng)站(www.baise.yingtan.bynr.xinxiang.zz.pingliang.ww38.viennacitytours.com)联(lián)系,本网站将迅(xùn)速给您回应并做处理。


      联系电(diàn)话:021-31666777   新闻、技术(shù)文(wén)章投稿QQ:3267146135   投稿(gǎo)邮箱:syy@gongboshi.com

      精选(xuǎn)资讯更多(duō)

      相关资讯更多(duō)

      热门搜索

      工博(bó)士(shì)人工智能网
      九游官方网页版-九游(中国)
      扫描二维(wéi)码关注微信
      扫(sǎo)码反馈

      扫一(yī)扫,反馈(kuì)当前页面

      咨(zī)询反馈
      扫码(mǎ)关注

      微(wēi)信(xìn)公众号

      返回顶部

      九游官方网页版-九游(中国)

      九游官方网页版-九游(中国)