沫言|人工智能时代的中文和英文,谁能成为AI的母语?

人工智能是当前最热门的技术 , 各国都在投入资金和人力进行研究 。 谁错过了人工智能 , 谁就丢掉了未来 。
沫言|人工智能时代的中文和英文,谁能成为AI的母语?语言文字在人工智能中占有非常重要的地位 , 它是人和人工智能交互的工具 , 人工智能只有准确理解语言文字才能做出准确应对 , 才能表现出高智商 。 今天就谈谈中文和英文是不是优秀的人工智能语言 , 以及未来前景 。
一、语音识别
虽然我不想承认 , 但英文语音识别确实比中文更准确、高效 。
英文由26个字母构成 , 逻辑结构更简单 , 发音以字母为基础 , 音标和音标区之间区分比较明显 , 只要说的不是很快 , AI能比较容易、准确识别每一个字母 , 加上同音单词比较少 , 所以英文的语音识别效率领先中文许多 。
沫言|人工智能时代的中文和英文,谁能成为AI的母语?中文发音则要复杂的多 。 汉语拼音有23个声母 , 6个单韵母 , 18个复韵母 , 还有16个整体认读音节 , 整套方案共63个发音元素 。 除此之外 , 汉语还有四种音调 , 加上种类繁多的方言 , 发音不准的话 , 非常影响AI识别 。
沫言|人工智能时代的中文和英文,谁能成为AI的母语?AI在进行中文识别的时候 , 需要先进行发音识别 , 再根据单词进行汉字判断 , 识别效率低于英文 , 识别错误率也高于英文 。
语音识别 , 英文胜 。
二、文字识别
到文字识别环节 , 我们终于可以扬眉吐气了 , 中文文字识别的效率和准确度比英文更胜一筹 。
中文有几个特点 , 让AI识别更高效:
1、汉字信息密度高 , 更少的字数可以承载更多的信息 , 中文文章永远比英文短 , 综合来看 , 中文信息密度比英文高37.5% 。
沫言|人工智能时代的中文和英文,谁能成为AI的母语?2、中文以汉字为单位 , 可以灵活排列 , 横竖都可以 , 而英文是线性文字 , 只能横排 , 竖排、错乱排列的识别效率会骤降!
【沫言|人工智能时代的中文和英文,谁能成为AI的母语?】3、汉字独立表意能力强 。 比如“他去吃早饭” , 你看一个字就能多明白一个字的意思 。 而英文“He went to have breakfast” , 你即使看到“have”这个词 , 你依然不明大概的意思 , 只有到“breakfast”你才知道原来have是吃 , went to是去 , 整句是去吃早饭 。 英文表意比较依赖“短语” , 甚至整句 , 不看完整句话 , 你往往不能知道句意 。 这就给AI识别造成了难度 , 因为AI跳跃识别能力较差 。
文字识别 , 中文胜 。
三、同音字词
中文发展人工智能最大障碍就是同音字词现象!比如 , 他姓zhang , 到底是“张”还是“章”呢?如果是口语的话 , 还要补一句弓长张 , 或立早章 。 中文里有多少同音字、同音词 , 很难准确的统计 。 同音字词也是英语使用者攻击中文表意不清最大的借口 。
沫言|人工智能时代的中文和英文,谁能成为AI的母语?英语虽然也有同音字 , 如right正确的、write写字;meet遇见、meat 肉;hole 洞穴、whole 全部的;pear梨子、pair双;flower花、flour面粉等 , 但英语同音字词数量远比中文同音词数量少 。 英语是通过造更多单词的方法 , 来减少同音词现象的 。


推荐阅读