互联网时代的文字错讹( 五 )

可见 , 传统文字错讹的原因主要在两个层面:一是书写主体(书写者)判断疏失 , 一是书写对象(汉字、文本等)特性干扰 , 但是前文例举的错讹“终南快捷方式”、“早”“晚”混用、“树之棒果”等 , 已超出了这两个层面 , 它们有个共同之处 , 都和新型的书写媒介有关 。 无论是繁简转换 , 还是九宫格输入、OCR文字识别 , 错误的发生 , 都在这些中间环节 。 这让我们意识到 , 互联网时代书写主体和书写对象之间还存在着一个机器智能的媒介 , 新型文字错讹本质上是机器智能带来的副作用 , 要化解机器智能的不足和局限 , 只有不断提升技术工具性能 , 并且增加人工干预 。

面对新型文字错讹 , 总体而言 , 要大力发展信息技术 , 如人工智能、大数据、构建知识关联来解决新时代的新问题 。 以前文例举的几种错讹类型而言 , 如繁简转换 , 可以在word软件里关闭“转换常用词汇” , 只按字转换 , 不按词转换 。 由于一个简体字对应多个繁体字 , 由繁转简时 , 一般较少出现讹误 , 这种方法能够有效规避“終南捷徑”转成“终南快捷方式”的问题 。 但是由简转繁 , 这种方法又会带来不少繁简单字不对应的错误 , 必须辅以严格的校对 。 另一方面 , 需要通过更新技术手段解决词汇在转换过程中带来的关联错误 , 比如在计算机中建立繁简词表 , 并标明具体对应的时间与地域信息 , 如是中国古代的繁体字词 , 还是港台当代的繁体字词 , 进而构建历时性的繁简词库与共时性的繁简词库 。 至于九宫格输入、OCR文字识别等新型错讹 , 目前除了技术革新 , 比如基于大数据的聚类分析 , 恐怕还得依靠人工校正 。


推荐阅读