关于中文夹杂的英文字母- -| 回首页 | 2006年索引 | - - 梦是人脑记忆的碎片处理?

电脑文字的未来

                                      

电脑文字的未来

张时钊

西安   陕西省气象局   邮编:710015



(20届CODATA国际会议  POSTER ID:IT-8)



一般人们只记得,语言文字是用来交流信息的,实际上它的更重要的功能是作为人类思维的工具。从人类诞生至今,语言文字的发展已经历了4个阶段,每一阶段的载体形态及其功能都有大提高,不过都不是代替和排除前一阶段,而是兼容前一阶段,与前一阶段的载体并存。而且新阶段的载体不断简化,而其作用和效能则日益提高。见下表:

                        

阶段              载体                         特点                                                    新增作用
肢体语言        肢体动作                   限用眼看,转瞬即逝                               仅仅传递信息
口语              空气振动                   限用耳听,转瞬即逝                               作思维工具
文字              二维图形                   限用眼看,可保存、远递                         提升思维效能
电脑文字        电磁状态                   易大量复制,远递极速                            思维机械化




文字阶段,最先是用笔写在纸上的,到了印刷时代,大量的字改用字模印在纸上。这虽大大增强了文字的存贮和传播功能,却失去了签字作用及张扬个性的书法。信息时代的主流文字又变成不能直接看见的电磁状态,必须用显示器还原才能阅读。目前的电脑文字实是印刷文字的翻版,即采用“字库加编码”的方法,不同字模对应不同的内码。这样,印刷文字的不足依然如故,而且:阅读印刷文字完全不要字模,可是电脑文字的显示却离不开全部字模(字库)。



手写文字:     笔  ——————→  文章 —————→阅读

印制文字:     铅字——————→  文章 —————→阅读

电脑文字:     字库——→编码——→文章 —————→阅读←——字库



如果世界上只有一种拼音文字,只使用英文时,关系倒不大,但用到字形繁多的中文上,就首先出了问题,直到今天的互联网时代,要同页显示各种文字时,问题更大。现在的解决办法是使用统一码Unicode,它计划收全所有文字的所有字形。当前硬件的进步已经不在乎内码的增长和携带庞大的字库。问题在于:文字种类繁多且还要不断发展,永远收不完所有字形。为了保证已有文字数据不失效,前期收入的编码不能更改,所以整个码表不能事先计划,一开始就已混乱不堪。

另一方面,字库的字数多了,大大地增加了选取需要的特定字形的困难。即使单一的汉字,一开始就要靠特殊的输入法,直至当前“万码奔腾”,还会发生输不进一个罕用的字,要同时使用多种文字,更加困难。汉字总数在10万以上,目前字库已达7-8万,还会出现缺字,因为量太大,易出错,已发现所谓电脑错字及重码。人们已经感到,庞大的Unicode不是解决问题的有效方法,于是提出了IDS、CDL,用已有的字形组成新字,原则上可以只用少量字根,最后只用笔画组出一切需要的汉字。不过他们需要额外的结构符或指定部件位置的数据,表示一个新字的字符串太长,更不能当内码用。





       应在这里数字化                  目前在这里数字化

                ┌————————————→ 字母 ——————↓   

曲线 ——→ 笔画—————→ 字根 ————→ 汉字 —————→文章

                └————————————→ 图符 ——————↑



1984年我开发的无字库汉字系统,只用240个字根组出所有汉字,不要额外字节(仅个别字要加结构码),字根串就是汉字内码。2003年完成的微机演示软件,只用50种笔画,组出所有汉字,包括任何大字典中都没有的。我认为电脑汉字的出路是笔画组字,继而推论,世界所有文字应可由少量元笔画组出。首次试验,只要7种元笔画就可组出全部ASCII字符及大批图符,这7种元笔画实际上是7个子程序。文字不是图画,仅由单色的线条(笔画)组成,在研究一切文字笔画特性和软硬件不断提高的基础上,人们一定可以用键盘(不是电子笔)快速地写出所有的文字来。这才是电脑文字的未来。



50种汉字笔画                                                                笔画组出的字典里不会有的地方字   
(要看这里的图,请击http://www.chancezoo.net/hz/dnwz.htm)
                                       


关键词:语言文字,Unicode,内码,字库,电脑文字

作者简介:张时钊,男,1937年4月22日出生,退休计算机高工,1984年首次研制成功无字库汉字,被领导错认为是输入法,退休后感到无字库才是解决电脑汉字种种问题的正确方向,2001年建网站继续研究,详情请看http://www.chancezoo.net, http://www.chancezoo.org

联系方式:电话:029-86239494    Email:mzsgls@pub.xaonline.com

【作者: chancezoo】【访问统计:】【2006年11月21日 星期二 07:16】【 加入博采】【打印

Trackback

你可以使用这个链接引用该篇文章 http://publishblog.blogchina.com/blog/tb.b?diaryID=5881847

回复

验证码:   
评论内容: