有不少汉字在简化时被合并至另一字,并由此产生多音字、多意字。因而,繁简转换较易(多对一),简繁转换较难(一对多)。
汉字合并时参照普通话读音,因此在方言中,多音现象更为普遍。例如在粤语常用字中,简体中文有349个多音字,而繁体中文只有229个。利用算法进行注音等语言工作时,繁体中文包含更多的直接信息量。
在歌曲《陀飞轮》中,如下汉字存在合并:錶表(表)、鬥斗(斗)、儘盡(尽)、隻只(只)、鬆松(松)、於于(于)、劃划(划)、裡里(里)。如使用繁体中文为源,则多音现象可以有效减少。同时,简化过程中存在极少量的分拆现象,例如“著”分拆为“着”、“著”。
Continue reading »


