本文共 1805 字,大约阅读时间需要 6 分钟。
机器人:对不起,我不知道您在说什么。
用户:Siri,帮我叫救护车。
Siri:好的,从现在开始我会叫你“救护车”。
根据人们的设想,我们只要说一句话,人工智能就应该可以准确、完美的完成我们下达的指令。但事实总是差强人意,面对人类语言的复杂性,的“自然语言理解”还有很长的一段路要走。
在人类的生活中,“语言”是一个必备硬件,而在智能时代,“语言”也有着等同的重量。
哪些人在攻克“自然语言理解”?
苹果收购Siri、Novauris等,组建基于神经网络算法的语音识别团队,打造聊天机器人Siri等产品;
Google收购多项语音识别技术专利、SayNow 、Phonetic Arts等,推出Google Home,以及云自然语言API,近期宣布将打造聊天机器人Daniell;
Facebook收购Wit.ai和Mobile Technologies等,以提高自身整体对自然语言的理解能力,推出聊天机器人Facebook Messenger;
Amazon收购语音识别技术Yap、Evi、Ivona等,打造聊天机器人Alexa以及智能家居产品Echo;
英特尔收购语音识别技术公司Indisys,于近期推出IFTTT式自然语言处理Web应用程序;
IBM将自然语言理解运用于超级计算机Watson,并在实际中解决了多个领域的众多疑难杂问;
加拿大人工智能初创公司Maluuba,推出一款基于自然语言理解的机器学习系统。
并不只是国外的科技公司,国内也有那么几家公司在专注于自然语言理解。比如:立志做客服界小冰的客服公司智齿科技,其人工智能客服为乐视节省了60%以上的客服成本,可以回答98%的问题。
在这些公司中,做的最为出色地应该是加拿大人工智能初创公司Maluuba,他们的机器学习系统EpiReader可以阅读文章,其中就有近期大热的《权力的游戏》,而在之后的提问中,EpiReader也正确的回答了测试人员的问题。
此外,据介绍,EpiReader使用了2层神经网络,类似于人类大脑神经元。第一层神经网络能让系统基于对于段落的理解挑选可能存在的答案,第二层神经网络用来评估第一层给出的答案,并最终给出一个正确的回答,在这场测试中,EpiReader分别得到了74%和67.4%的准确率,按照国内有关专家的说法,这成绩超越了谷歌的DeepMind, 和IBM沃森在今年3月份公布的结果。
哪些领域用到“自然语言理解”?
首先就是最近大热的聊天机器人。比如苹果的Siri,至今为止,Siri已经不知道被多少人调戏过了,话就不多说了,直接上图,你就能看到作为一个聊天机器人,Siri到底有多傲娇。
其次就是语音识别。作为一项人工智能,语音识别也有着自己的市场。但是说到语音识别的原理,其在依靠着自然语言理解的庞大数据库之上,才能正确理解人们所说的话,并给出正确的回应。
最后就是云服务。众所周知,云服务对于先进的各家企业来说,都是一个很好的资源,他们可以在上面对自家的数据、产品进行分析、测试。在其中,功能最齐全的应该是谷歌的云服务,其中就有自然语言API,拥有情感分析、实体识别以及语义分析三大功能,可以帮助人工智能研究团队完善自己的产品。
在目前来说,Maluuba的机器学习系统EpiReader应该可以说是至今性能最好的了,但这真的就够了吗?是不是还缺了那么一点?
自然语言的理解还有待继续加强。的确,在填空测试中,EpiReader的成绩完全压了等公司一头,也能够在读书之后正确回答问题,但要知道,小说的语言一般都是“官方语言”,并且逻辑性也相对较强的,而使用英语的人也多有着自己的“方言”用语,要想让人工智能更好地理解自然语言,它还需要一本“方言词典”。
此外,口头表达给自然语言理解增加了一个难度。在交流上,人们更倾向于口头表达,并且拥有自己的说话方式、习惯,而且也不会如文字表达那样更具有逻辑,这就要求自然语言理解能够准确识别出话语中的重点部分,千万不能出现Facebook聊天机器人那样的错误,在用户提出看科技新闻的要求时,反馈却是一条澳洲树袋熊的新闻,要是人与机器人面对面的话,这场面实在太尴尬!
转载地址:http://uguyo.baihongyu.com/