汉语拼音化的可行性分析以及汉语半拼音化方案

一 , 汉字的拼音化是否可行 首先我要说一下汉字的拼音化是否可行 , 有不少人认为汉字拼音话根本不可能实现 , 理由是汉字的同音字太多 , 如果全部用拼音表示 , 则理解起来会十分困难 。 比如说有人举了这样一个例子 。 有一家姓杨,有兄妹二人,哥哥叫"杨阳",妹妹叫"杨洋",某天杨阳养了一只羊,妹妹杨洋很高兴,即:杨阳养羊,杨洋乐洋洋. 这9个字如果用拼音来表示的话是这样的:Yang yang yang yang ,yang yang le yang yang . “杨阳养羊,杨洋乐洋洋.” 这几个字如果用我们现在用的方块字来表示的话 , 其中的含义 , 很容易就读出来 , 但是如果用拼音表示的话 , 这几个字几乎都是一个音 , 读者根本读不出其中的含义 。 还有一个例子更典型 , 就是我国语言学家 , 音乐家赵元任先生写的小文章《施氏食狮史》 。 石室诗士施氏 , 嗜狮 。 誓食十狮 。 氏时时适市视狮 。 十时 , 适十狮适市 。 是时 , 适施氏适市 。 氏视十狮 , 恃矢势 , 使是十狮逝世 。 氏拾十狮尸 , 适石室 , 石室湿 , 氏使侍拭石室 。 石室拭 , 氏始试食十狮尸 。 食时 , 始识是十狮实十石狮 。 试释是事 。 上文如果用拼音表示的话 , 则全篇都是 , “shi”这个音节 , 让人感到不知所云 。 这篇文章虽然是“游戏文” , 但它说明我国文字中同音字之多 。 基于以上理由 , 所以许多人都认为汉字基本上不可能实现拼音化 。 以上理由看起来似乎很有道理 , 但是仔细想想这个理由 , 其实根本站不住脚 。 我们几个中国人聚在一处交谈 , 所使用的语言都是汉语 , 大家所听到的都是一个一个的音节 , 我们听到的这些音节 , 大量的都是音同义不同的音节 , 音同义不同的现象 , 丝毫不比拼音符号所表达出来的更少 。 我们中国人在用汉语交谈时 , 大脑完全能处理读懂这些大量的音同义不同的现象 , 而且丝毫不影响我们中国人彼此之间的交流速度 。 那么 , 当我们把这些汉语变成拼音符号的时候 , 大脑有什么理由看不懂这些拼音符号呢? 所以说 , 上面那些反对汉语拼音化的理由根本站不住脚 。 二 , 汉语拼音化的最主要的障碍是什么 说到这里有人或许会提出这样的疑问 , 汉语拼音推行了这么多年 , 为什么没有人能取代我们现在用的方块字呢? 汉语拼音在100多年前就已经产生了 , 而且已经形成了一个比较完备的系统 , 解放后我国在几十年中也是努力的想推行汉语的拼音化 , 但是汉语拼音始终无法取代现在用的方块字的地位 , 这又是为什么呢? 针对这个问题 , 我们不想做太多的探讨 , 因为这牵扯到许多历史文化 , 社会等方面的问题 。 我想说的是 , 除了社会方面的阻力之外 , 我们的汉语拼音方案本身的不完善是阻碍汉语拼音化的最重要的原因 。 其实日本韩国越南等汉语文化圈的国家 , 历史上长期都曾长期的使用汉字 , 但是他们都实现了语言文字的拼音化 , 这些国家的历史经验都向我们证明了 , 汉字是完全可以实现拼音化的 。 我国的汉字拼音化之所以久久未能实现 , 其中最重要的原因就是我们的拼音方案没能结合我国的国情 , 没能结合我国语言的特点 , 形成一套更加完善的拼音方案 。 我国语言的一个最基本的特点 , 就是书面语言和口语的严重分离 。 在我国古代最主要的书写工具是毛笔 , 毛笔的书写速度过慢 , 耗时耗力 , 所以为了提高记录的速度 , 中国古代形成了一套特殊的用于记录的书面语言系统 , 这个特殊的书面语言系统就是大家熟知的文言文 。 文言文的用字十分的简约 , 这样可以大大的提高记录速度 , 但是造成的弊端就是语言结构的不完整 。 以大家熟悉的曹刿论战为例 , 来说一下文言文语言结构的不完整性 。 曹刿论战这篇古文的前几句是这样的 , “十年春 , 齐师伐我 。 公将战 。 曹刿请见 。 ” 如果把这几句话翻译成白话文的话 , 是这样的 , “鲁庄公十年的春天 , 齐国军队攻打我们鲁国 。 鲁庄公将要迎战 。 曹刿请求拜见鲁庄公 。 ” 如果我们再把这几句翻译成口语的话 , 是这样的 , “有个人叫鲁庄公 , 在他在位的第10个年头的春天 , 齐国派他们的一些军队来攻打我们鲁国 , 鲁庄公想要出兵迎战这些齐国的军队 , 鲁庄公正在这样打算的时候 , 有个叫曹刿的人 , 来登门求见鲁庄公 。 ” 我们来对比一下这三段话 。 这三段话尽管表达的内容很接近 , 但是第1段话 , 用字非常的少 , 十分的简约 , 第2段话用字就比较多了 , 是第1段话的2~3倍 , 第3段话用字则更多 , 用字的数量几乎是第1段话的7-8倍 。 那么文言文为什么用字数量会如此之少呢?因为文言文根本就不是我们生活中用的原生态语言 , 文言文是古代为了提高记录速度 , 而采用的一种速写语言 。 文言文根本就不是一种对话中所使用的语言 , 不论是在现代还是古代 , 如果你用文言文跟对方交谈 , 对方估计什么都听不懂 。 古人说话其实也是挺通俗的 , 只不过记录到文字上的时候 , 为了提高效率和节约纸张 , 所以采用这种简约的记录方式 。 文言文本质上是一种速写语言 , 因此他在记录过程中省略了许多正常的语言成分 。 比如说 , 曹刿论战中的前三个字 , “十年春” , 如果我们仅看着前三个字 , 就会产生许许多多的语言上的歧义 , 到底是10年里头的10个春天 , 还是第10年的那个春天 , 还是一个人的名字就叫十年春 , 还是某个地点叫十年春 。 如果我们仅仅就看这三个字 , 根本就不知道所以然 , 只有结合上下文 , 我们才能理解这三个字的含义 。 所以说 , 文言文其实是一种语言成分不完整的语言 , 这种语言成分不完整的语言如果转化为声音信息的话 , 人的大脑基本上是理解不了的 。 由于文言文很难被大众理解 , 为了提高大众的知识水平 , 所以在近代知识分子们发起了白话文运动 。 但是我们要知道 , 这个白话运动虽说有一定的进步意义 , 但是这个白话文运动其实是一种不彻底的白话文运动 。 我们读一读五四运动时期的文章 , 我们很容易就发现这些所谓的白话文其实都是半文半白的 。 我们所谓的白话文其实是文言文和口语的混合语言 。 有人或许会说 , 我们现在当代作家的作品中 , 文言文和口语混合的现象已经很少了 , 当代作家的语言基本上都是很通俗易懂的 , 半文半白的现象已经很少见了 。 事实上我们当代作家所写的文章 , 也大量的存在半文半白的现象 。 现代作家中半文半白的现象其实也是十分严重的 。 比如说这句话 , “鲁庄公十年的春天 , ” 我们看这句话 , 感觉已经十分通俗易懂了 , 但是这样的话 , 如果直接放到口语中 , 还是给人感觉十分的别扭 。 如果我们把这句话变成口语 , 则应该这样说 , “这个鲁庄公在位的第10个年头的那个春天 。 ”这样说的话才是真正的白话 , 才是真正的口语 。 我们比较一下这两段话 , “鲁庄公十年的春天 , ”vs“这个鲁庄公在位的第个10年头的那个春天 。 ” 比较这两句话你就会发现 , 第1句话中少了许多语言的成分 , 比如说 , “这个”“那个”“在”“第”“的” 等等 , 这些语言成分是形成语言逻辑结构必不可少的东西 , 但是我们在写文章的时候 , 在许多语句中不自觉的把这些成分给省略掉了 。 通过以上的分析 , 我们可以发现 , 不论是文言文还是我们当代作者所写的文章 , 都是一种语言结构不完整的语言 , 省略掉了许多与重要的语言成分 。 正是由于我们的文章省略掉了许多重要的语言成分 , 而这些语言成分又是语言逻辑关系构建的必不可少的东西 , 所以 , 当我们的书面文章转化为拼音的时候 , 就会出现许许多多的语言上的歧义 。 所以 , 我的结论是 , 文言文是根本不可能转化为拼音语言的 , 因为文言文所缺少的语言成分太多太多了 , 而我们当代作家所写的文章 , 其中也少了许多的语言成分 , 当这些文章转化为拼音的时候 , 读者读起来也会感到十分的费劲 。 因此要实现汉语的拼音话 , 首先要做的工作就是把白话文运动推行的更彻底 , 让我们的文章 , 更加的口语化 , 只有我们的文章彻底口语化了 , 才能实现汉语的拼音化 , 文章口语化是汉语拼音化的前提 。 三 , 汉语拼音化的设想---“汉语半拼音化方案” 世界各地的文字都有一种有象形文字 , 像拼音文字转化的趋势 , 汉语发展到现在 , 其实在很大程度上已经逐渐接近拼音文字了 。 拼音文字的一大特点就是可以用少量的字符来表达大量的语言内容 , 其实汉语中常用的字符数量也有越来越少的趋势 , 目前汉语中常用的字符只有100多个 。 根据权威的机构统计 , 每个汉字在我们的文章中使用频率是极其不均匀的 。 在我们日常所能读到的报刊杂志文章中 , 最常使用的汉字只有140个 。 在这140个汉字中 , 最常使用的只有5个汉字 , 它们分别是 , “的 一 是 了 我” , 这5个汉字使用频率的总和占了我们文章字数的10% 。 还有12个汉字的使用频率也非常高 , 它们分别是 , “不 人 在 他 有 这 个 上 们 来 到 时” , 这12个汉字使用频率的总和占了我们文章字数的10% 。 还有25个汉字的使用频率也非常高 , 它们分别是 , “大 地 为 子 中 你 说 生 国 年 着 就 那 和 要 她 出 也 得 里 后 自 以 会” , 这25个汉字使用频率的总和占了我们文章字数的10% 。 还有37个汉字的使用频率也非常高 , 它们分别是 , “家 可 下 而 过 天 去 能 对 小 多 然 于 心 学 么 之 都 好 看 起 发 当 没 成 只 如 事 把 还 用 第 样 道 想 作 种 开” , 这37个汉字使用频率的总和占了我们文章字数的10% 。 还有61个汉字的使用频率也非常高 , 它们分别是 , “家 可 下 而 过 天 去 能 对 小 多 然 于 心 学 么 之 都 好 看 起 发 当 没 成 只 如 事 把 还 用 第 样 道 想 作 种 开” , 这61个汉字使用频率的总和占了我们文章字数的10% 。 以上这些汉字总共有140个 , 使用的总频率占了我们文章字数的50% 。 也就是说我们一般文章中一半左右的字都是由这140个字所组成的 。 在这140个汉字中 , 前三组总共有42个字 , 这42个字的使用频率占了整个汉字使用频率的30% 。 这42个字大多是语言逻辑关系得以形成的关键字 , 缺少了这些字 , 我们的语言就会逻辑不完整 , 缺少了语言逻辑的支撑 , 汉语的拼音化就只能是空中楼阁 , 所以我们在汉语向拼音转化的过程中 , 要尽量多的使用这些字 , 综合以上分析 , 本人提出以下的汉语拼音化方案 , 由于本方案保留了部分的原始汉字 , 所以称为汉语半拼音化方案 , 第一 , 设立140个基本汉字 , 这些汉字共分为4组 。 第1组:的 一 是 我了 第2组: 人不在 他 有 , 这 个时上到 们 来 第3组:你 说中国 年 , 那里会自和 , 大 地 为 子 , 以后她 出生 , 也要得着就 第4组:家 可 下 而 过 天 去 能 对 小 多 然 于 心 学 么 之 都 好 看 起 发 当 没 成 只 如 事 把 还 用 第 样 道 想 作 种 开家 可 下 而 过 天 去 能 对 小 多 然 于 心 学 么 之 都 好 看 起 发 当 没 成 只 如 事 把 还 用 第 样 道 想 作 种 开 这4组共140个汉字不再拼音化 , 仍保持原样 。 这140个汉字已经占了文章的一半的字数 , 可以在阅读过程中 , 给读者大量的提示 。 第二 , 设立42个增添汉字 , 这些汉字共分为3组 。 第1组:强烈建议增添的字 , 包括 , 的 一 是 我了 第2组 , 一般建议增添的字 , 包括 , 人不在 他 有 , 这 个时上到 们 来 第3组 , 建议选择增添的字 , 包括 , 你 说中国 年 , 那里会自和 , 大 地 为 子 , 以后她 出生 , 也要得着就 这三组共42个汉字建议在拼音文章中尽量的多添加 , 以保证文章有良好的逻辑结构 , 更适合阅读 。 第三 , 凡是涉及到人名地名 , 都用下划线或者用大写字母表示 。 第四 , 除140个基本字以外 , 其他汉字都用拼音替代 , 最好使用有声调的拼音 。 第五 , 生僻词可用引号或其他符号加以标注 。 据报道 , 伊朗外交部7日在其官方“推特”账号上发文称 , 伊朗副外长阿拉克奇(Abbas Araqchi)表示 , 伊朗“准备重新全面遵守”与6个国家达成的核协议 , 但该推文没有提供任何其他信息 。 应用案例 案例一:这个 yáng yáng yǎng 了 一 只yáng , 那个yáng yáng “lè yáng yang” 原文:“杨阳养羊,杨洋乐洋洋.” 案例二: 据bào dào , yī lǎng 的wài jiāo bù 7日在 其guān方的“tuī tè ” 的 zhàng hào 上发 wén chēng , yī lǎng 的fù wài长ā lā kè qí( A b b a s A r a q c h i ) biǎo shì , yī lǎng “zhǔn bèi chóng xīn quán面地zūn shǒu ” 与6 个 国家dá成的hé xié yì , 但是这个tuī wén没有tí gòng rèn hé其他的xìn xī 。


    推荐阅读