王选夫妇与计算机照排技术

时间:2022-03-21 09:46:21 公文范文 来源:网友投稿

  天将降大任于斯人
   1975年,岁月不饶人,王选已38岁,接近不惑之年,时间也在他脸上刻下了比别人更多的痕迹。因为喘息,甚至在两肋有深纹。别看只有38岁,王选几乎有一种特殊年龄,不老,但也不年轻,身体虚弱,但眼睛放光,自有了陈堃銶后再没熄过。甚至有时亮得出奇, 似乎把全身的火焰都集中在了自己的眼睛上,比如工作时,查阅资料时。当然,由于过分集中在眼睛,别处也有时更显虚弱。换句话说,他能调动全身的火焰,但却只能拆东墻补西墙,无法达到整个身体的平衡。然而,正是这样一个拆东墙补西墙的身体却灵敏地感觉到那个时代最重要的东西、革命性的东西。
   1971年,英特尔研制出世界上第一块四位字长微处理器4004;1974年,英特尔再度推出比4004快20倍的微处理器8080;同年,美国MITS公司利用8080设计出世界上第一台微型电子计算机,预示着革命性的微机时代的到来。然而,计算机是西方人发明的,建立在英文基础上,对中国而言简直是另一星球的事,高不可攀:古老的已经使用了几千年并且还在使用的象形文字汉字,能进入微机编码吗?显然不可能——这几乎是一种常识的常识;很多人认为汉字太落后了,已经是人类之外的文字——这也是微机时代到来时许多所谓有识之士普遍的共识。但王选不这么看,至少把这看成挑战。他是干什么的?就是为解决这事而来的,他的奇妙而晦涩的身体这么多年来在一种特殊的运行中,已拥有了某种东西,而这东西仿佛就是上帝为汉字文明准备的。
   1974年春暖花开时,北大有了一台电子计算机,不想闲着,这朵“微机之花”不能总是含苞欲放,应该干出点什么,于是决定用计算机把学校的管理工作抓起来。一天,学校组织一大批人分头到学校印刷厂、物资部门及财务部门进行调查,陈堃銶参加了调查。在印刷厂,事情就是这么凑巧,这么宿命,陈堃銶意外地了解到国家有一个关于汉字信息处理技术的重点科研项目,代号为“748工程”。回到家,陈堃銶将这一消息告诉了王选,王选嗅觉非常灵敏,越是病人嗅觉就越灵敏。此时王选眼睛放光,似乎也看到了陈堃銶眼睛放光,从此两人眼睛里多了一种东西。很难说是激光或者类似的东西,反正是只有他们俩相视时才有的东西。
   “748工程”是包括精密汉字照排系统、汉字情报检索系统、汉字通信系统和汉字终端设备等内容的研究。王选认为精密汉字照排系统最为关键,这是书刊编辑排版工作的专用系统,对已延续了五千年的汉字意义重大,这是场跟上世界文明潮流、使汉字不致被排除在外的革命。陈堃銶了解到在“748工程”中,已有五家单位在研制精密汉字照排系统,这五家分别是上海印刷技术研究所、中华印刷厂、北京新华印刷厂、清华大学计算机系、中国科学院自动化研究所,这五家都实力雄厚,并且还有诸多合作伙伴。
   这是国家工程,与独立的个人无关,更与病人无关。但王选一眼便看到这五家单位的致命缺陷,王选准备单干。
   精密汉字照排系统的方案,其创造性、先进性和可行性是能否研制成功的关键,上述五家恰恰在这三个方面都存在着严重的缺陷;王选很想告诉他们——第三代西文照排机已在西方大量推广,第四代机也正在一些技术先进的国家加紧研制,中国的五家单位,你们选择的是二代机与三代机,即使费了九牛二虎之力研制出来,又有多大价值?此外,王选想说,更重要的一点是,五家在汉字字形存储方面采取的全部是模拟存储方式,而不是数字,模拟存储方式能解决存储和输出等技术难关吗?
   王选的目光掠过第一代、第二代和第三代照排机,直接瞄准了国外正在研制的第四代机——激光照排机。王选知道(好像那五家单位不知道似的)最早开始研制激光照排机的英国蒙纳公司对四代机刚刚进入试制阶段,尚未形成商品;日本虽然搞出了第三代照排机,但功能很不完善,仅能勉强应付日文中的少量汉字。这是挑战,也正好是机会,跟在别人后面往往是集体的行为,是一致的看得清的行为,也是平庸的行为,这便是王选和五家单位的区别。
   当然,把古老的象形文字——常用字3000字以上非常用7000字以上——融进电子计算机,时间跨度达千年,谈何容易?况且汉字印刷用的字体、字号又特别多,每种字体起码也需要七千多字,每个汉字从特大号到七号,共有16种字号。如果考虑到不同字体和不同字号在内,印刷用的汉字字头数高达100万字以上。因此,汉字点阵对应的总存储量将达200亿位。这是一个吓人的天文数字,难怪五家单位的五个技术专家群在一起做。
   必须找到一种方法,对汉字信息进行大大压缩,这是关键的第一步。王选唯一担心的是自己的身体,灵魂过分强大,身体往往不堪使用,他的身体能支撑吗?自从确立了目标,王选常常整夜整夜不睡觉,坐着研究不行就躺着研究,幸好有陈堃銶,简直就是他的另一半,他们太一样了。陈堃銶早已习惯了王选,两人奇迹般地完全达到兼容,甚至很多时候他们就是一个人。王选着了魔似的拿着字典,查报刊,在床上翻来覆去、苦心孤诣研究浩如烟海的汉字:字形的特点,规律,没有规律的规律,没有逻辑的逻辑。不能按西方的逻辑分析,那样永远走不通,中国文明有自己的奇怪的逻辑。
   但是说怪也不怪,不过是自成体系。王选与陈堃銶慢慢归纳出汉字的横、竖、折等规则笔画:它们由基本直线和起笔、收笔及转折等笔锋组成;归纳出撇、捺、点、钩等不规则笔画:它们都有一定的曲线变化。有一天,躺着的王选气喘喘地对陈堃銶说,能不能想办法对这些笔画进行统计,看看能否选出一些典型的笔画,供整套字合用,然后,再研究怎样用更少的信息描述它们?这样说的时候,汉字或中国逻辑已然隐现,陈堃銶非常敏感,更有女性对空间想象的本能,认为可行。陈堃銶从印刷厂找来字模,将字模稿上的一个个汉字字形放大,放在坐标纸上,再描出字形的点阵和统计笔段,就像图案,发现横、竖、折的基本部分比较固定,变化的是头和尾。而头和尾的样式不是很多,因此可以挑选出若干个供所有字合用的典型。但撇、捺、点这些不规则笔段,笔画变化太多,很难挑出几种可供所有汉字合用的典型。

推荐访问:照排 夫妇 王选 计算机 技术