2011年6月10日凌晨我发布了一条微博
我在想一个冯如杯项目,越想越激情,以至难以入睡。我说不清它到底是怎样一个想法,只能说有几个关键词:粤语,歌词,注音,娱乐,网站,商业化。我能预想到的难点是海量字音数据库以及多音字识别。
一年半前开始对方言产生兴趣,在学习的过程中手工整理了一些粤语流行歌曲的歌词注音,这些文章为杯茶博客持续带来流量。Mojim 魔镜歌词网凭借其良好的SEO以及精准的歌词数据,不仅获得了大量一次流量,还有较高的回头率与用户黏性。如果能够自动生成歌词粤语注音,并且编写专用程序进行搜索引擎、用户体验等方面优化,注重歌词及注音准确性,想必可以凭借内容获得访问来路。
因此,微博中提到的关键词演化为如今的“杯茶歌词注音”。也许日后不只限于粤语,可能加入闽南语等歌坛主流方言,但闽南语因其文白异读、正字本字有待考证、用字混乱等原因实现难度较大。当初预想字音数据库为技术难点,实践证明粤语歌词中使用的汉字不过几千,2012年1月22日导入的5621组汉字、注音基本已能满足需要,并可以根据实际情况添加。至于多音字问题,目前没有找到出色的解决方案,姑且罗列全部读音,由访客自行分辨。值得注意的是,歌曲中的汉字并不使用原有声调而是跟随旋律,如果退而求其次仅保留发音,难度理应有所减小。
建立杯茶歌词注音主要出于以下几个目的:满足K歌兴趣爱好并辅助学习粤语、提高PHP及MySQL Web设计技术、为网站流量寻觅新来源、为申请港校研究生加重注码、参加“冯如杯”科技竞赛,目的实现的可能性逐次递减。北航人文气氛淡薄,评委可能只看重技术含量而忽视“杯茶歌词注音”对汉字(简体、繁体)以及方言文化表示的尊重。至于港校申请,此为锦上添花,况且具体安排言之尚早,不可过分期望。
更新日志
2011年12月
完成汉字=>粤拼转换函数 实现逐字注音 确定本站同时支持简体中文及繁体中文
代码效率较低 汉字粤拼对应数据库亟待完善
2012年1月22日
导入5,621个汉字的“香港语言学学会粤语拼音方案(粤拼)”注音数据
主流粤语罗马化方案相互转换有待实现
2012年1月23日
在原有基础上,补充5,621个汉字的“广州话拼音”、“教育学院拼音方案”、“粤语国际音标”三种方案的注音数据
2012年1月24日
实现汉字=>注音转换 汉字、注音隔行输出
2012年1月25日
完成UI Demo 参考豆瓣九点、糗事百科
2012年1月26日
为混合输出结果添加UI 添加“歌手、简繁版本、注音方案、国语版”等歌曲信息
2012年1月27日
完善歌曲信息 开始制作歌手列表页及歌手作品列表页
2012年1月28日
完成首页、歌手列表页及歌手作品列表页
2012年1月29日
杯茶歌词注音上线 http://zhuyin.buicaa.com/ 杯茶博客部分内容转移至杯茶歌词注音
2012年1月31日
连接“无觅相关文章插件” 添加页面功能
http://zhuyin.buicaa.com/page_s/1.html
2012年2月2日
Sitemap http://zhuyin.buicaa.com/sitemap.xml
站点地图 http://zhuyin.buicaa.com/sitemap.html
关键词 杯茶歌词注音,注音,粤语注音,歌词注音,拼音,粤语拼音,歌词拼音,粤语发音
无图版 | 本文链接: http://www.buicaa.com/?p=3935