有中文同音字中文输入软件件吗

电拼汉字计算机输入法,所用键盘及其中文内码的制作方法
专利名称电拼汉字计算机输入法,所用键盘及其中文内码的制作方法
技术领域本发明涉及汉字计算机输入方法及其键盘,特别涉及一种以汉字拼音编码为基础的计算机输入方法、专用于这种汉字输入方法的计算机键盘及其中文内码。
目前,在计算机中文输入技术中,虽然已经有数百种以汉字编码为基础的汉字计算机输入方法及其相关键盘,但尚没有一种易学易懂易记易用、适合广大使用者(包括专业输入人员和非专业使用者)的计算机汉字输入法及其相应键盘。
目前所开发的中文电脑汉字输入法,包括音码输入、形码输入和音形码输入,这方面的例子例如有五笔字形输入法、双拼双音输入法和音形二维汉字码等。
中文电脑开发者首先采用拆字式的字形编码,开发出许多互不相通的编码。编码把数以千计的中文字形变为西文字符。形码要求对个别汉字进行编码,重码越少越好。单字编码可以实现符号少的理想,但因此而产生成千上万的编码却不易学习和使用。形码使用者要绝对掌握三项有关知识,即字形、编码和键位。这的确不是一件容易的事。对于那些没有原稿可看,需要边想边打字的作者来说,形码干扰思路,同中文打字机一样难学难用。比较能够顺利使用形码电脑的是那些只要看稿打字、不需要进行创作思考的专业打字员。从本质上说,形码中文电脑仅仅实现了“字”处理而非“词语”处理和淘汰了笨重的大键盘而已。由于它同中文挂钩,因而对繁体和简体中文需要有不同的编码。
由于形码同中文挂钩,形码成为次级符号系统,视中文字形的变化而定。形码的学习以首先学会中文为必要条件。换句话说,中文电脑的学习和使用必需要压后到学生掌握一定的中文知识以后。这就大大缩小了学生用中文电脑的时间窗口—不是像外国小孩子在幼儿园或一、二年级便可以开始学用电脑,而是要到高小、甚至十几岁才学用中文电脑。相对于汉语而言,中文是记录汉语的一级符号系统,只要学会中文,便可以用它来记录汉语。直接同汉语挂钩的汉语拼音也是一级符号系统,也可以用来直接记录汉语,不因中文字体的变化而变化。图7示意性地示出了中文输入法的符号系统级别。
不过,单音节拼音必需克服大量同音字的问题。早期的拼音软件(如CCDOS)让用户在列出的众多同音字中挑选适用的汉字,麻烦和效率低。因此,单音节拼音输入法不能满足专业打字员对速度的要求,被认为只适合非专业者使用。
随着电脑功能的加强,人们发现采用以词和词组为输入单元的输入法在一定程度上解决了同音字的问题。注音符号和汉语拼音(或罗马拼音)都能够充当汉语词和词组输入的工具。越来越多的中文软件采用了词汇输入法。不过,尽管汉语的多音节同音词问题不大,但单音节同音词的输入问题仍然有待解决。
另外,为了提高转换中文的准确度,过去的很多软件设计者采用拼音结合字形的输入法,因而失去一级符号的资格。
再者,到目前为止,还没有专门为汉语拼音设计的优化键盘。电脑通常只提供Qwerty(英文)键盘,所以中文电脑用户往往只好使用这个对输入汉语拼音效率并不高的键盘。
现代电脑的特点之一是其键盘上的字母的排列同ChristopherSholes在1873年研制出的机械打字机完全一样。从那个时候以来,Sholes设计的键盘不仅成为标准英文键盘(又因其左上角的6个字母而被称为Qwerty键盘),而且也在稍经修改后成为许多其它语文打字机的标准键盘。
据说,Qwerty键盘是一个蓄意被设计成低效率的键盘。为了减少几条键杆卡在一起的麻烦,Sholes把字键的位置安排得产生减慢打字速度的效果(注1)。但是,这种做法不可能完全消除键杆卡住的问题,这就促使人们后来努力研制出彻底解决这个问题的办法。IBM球式打字机的面世是第一个彻底克服这个问题和容许高速打字成功的尝试。接着发明的诸如菊碟、点阵喷墨和激光等打印技术也是如此。其实,Qwerty键盘的低效率很早就被人发现,而且有人还研制成更有效的键盘。August Dvorak教授於1936年根据时间与动作研究的结果研制出高效英文键盘(2)。可惜由于遭受Qwerty键盘使用者的排斥和改变机械键盘的困难而不能普及。这个被称为Dvorak键盘的键位跟Qwerty键盘完全不同也可能是它难以推广的原因之一。
Qwerty键盘仅仅由于它是第一个商业上成功的键盘而取得先入为主的地位。众所周知,任何涉及改变人的习惯的革新都会遭遇抗拒。这种抗拒是可以理解的。习惯一旦形成就有如电脑里产生ROM记忆那样不容易再加以改变。因此,人们的大脑随着年龄的增长产生越来越多的ROM。不过,人们对改变习惯的抗拒往往被迫需要克服。因此,虽然对惯用Qwerty键盘的人重新学习新键盘是必需付出相当代价的,但面对目前电脑的发展和文件处理速度的要求,不得不为跟上时代而付出代价,不过这个代价是值得的。
在中国,就Qwerty键盘的使用而言,可以说直到目前为止还没有养成牢固的使用习惯。然而,随着英文打字机和电脑终端设备的使用日益增加,可能很快便会有越来越多的人习惯使用Qwerty键盘。为了减少抗拒的心理和减轻重新学习的费用,现在必需及时选择和使用一个最适合处理汉语拼音的标准化键盘。同时,鉴于日益需要处理多种语文的前景,这个键盘也必需同时适合处理英文和其它语文。
众所周知,中文通常采用双字节内码,因而,在电子邮件和西文环境下会出现“乱码”情况。使用现有内码的中文在Internet上则需要相关的阅读器和汉字输入手段。
因此,本发明的一个目的就是要克服上述现有技术的缺陷,提供一种汉语拼音编码的计算机汉字电拼输入方法。
本发明的另外一个目的是提供一种专门为利用上述电拼输入法进行汉语拼音输入而设计的计算机优化键盘,即高威有限公司(GOWELL CORP)首创的拼音-国际键盘(Pinyin International Keyboard以下简称之为PI键盘)。
本发明的再一个目的是提供一种中文内码,即ASCII中文内码的处理方法。
根据本发明的汉字电拼输入法不同汉字字形挂钩,它利用词汇化汉语拼音,多层次字母标调和小量特别拼写法来大大提高转换中文的准确度。它把单音节同音词按照四声排列,并规定以不标调的基本式来代表最常用的同音词,电拼在每一个同音词栏中规定列在动词行(第二行)的汉字,它又规定采取第四声实体名词拼写法的汉字。其它单音节汉字词则按照其常用程度分别列入第一、第三和第四行。第五行保留给一些有特别拼写法的音节词。这种输入法属于“音语码”的新类别(即继音码、形码和音形码之后的新类别)。
根据本发明的PI键盘是根据汉语拼音字母和复合字母频率来设计的高效键盘。为了便利输入汉语拼音,PI键盘的键位按照汉语拼音的需要做了必要的调整,同时又尽量避免了任何不必要的改变,以便增加同英文键盘的兼容性,减轻习惯使用Qwerty键盘的人可能遇到的困难。
ASCII中文内码采用与西文完全兼容的单字节处理手段来彻底克服上述困难。办法是对字符集内尚未定形的汉字按照其所属声调以附加数字来区别。由此而产生的ASCII内码与汉字一一对应。对于双音节或多音节同音词,也以相同方法处理。当用户按照电拼和选词方式输入中文时,尽管屏幕显示标准中文,但在存储时则采用ASCII中文而非某种内码。电拼中文软件设有ASCII中文内码本身和相对的输入和输出接口,以便实现其它内码(GB、BIG5和Unicode)的转换功能。这项新发明旨在取代现有烦琐的中文内码。用ASCII文本来实现汉字的准确处理。
通过下面结合附图对本发明的详细描述,本发明上述以及其它的目的和优点将会变的更加清楚,其中附图说明
图1示出了一个表格,用于表示拼音字母出现频率对汉字的字数;图2示出了一个表格,用于表示拼音复合字母的出现百分率;图3示出了一个表格,用于表示英文字母的出现频率;图4示出了一个表格,用于表示不同键盘的字键使用频率的比较;图5示出了部分汉字及其相应的电拼码;图6示出了根据本发明的PI键盘;图7示出了中文输入法的符号系统的级别示意图;根据本发明的电拼输入法在保持一级符号系统的基础上实现了学习起步早、记忆量小和输出准确的理想。
直到目前为止,大多数键盘都是为英文打字而设计的。由于不同语文的字母使用频率不一,对一种语文的优化键盘对另一种语文来说不一定如此。而根据本发明的PI键盘是参照Dvorak键盘设计原理为汉语拼音而设计的优化键盘。
根据本发明的电拼输入法在采用词汇输入的基础上进一步解决同音词分化问题。其设计出发点是现有的词汇输入法,着重对常用单音节同音词进行定型设计。必需指出,不是每一个字都是词。蚂、蚁、珊、瑚、咖、啡等单字通常不单独使用,而是合而成为双音节词。它们不是本发明电拼拼写定形的对象。由于一些电拼拼写法使用频率高,因此很容易通过反复使用而记牢。记住特别拼写法的好处是省掉挑选同音词的麻烦,提高键入速度。本发明电拼输入法的灵活性在于它容许用户自行决定要记住多少特别拼写法。必需指出,学用特别拼写法同汉字一样,存在一条效益递减规律。例如,掌握最常用的100个特别拼写词就足以使用户的输入速度大为提高,进一步掌握另100个特别拼写词得到的好处就有所下降。汉字也是如此,掌握最常用的2400个汉字相当于掌握99%的汉语词。其后每掌握1400个汉字才包括其余汉语的0.9%。从实用角度来看,用户的记忆负担会因此而大大减少。学会汉语拼音的人完全可以通过掌握一些最常用的特别拼写法来获得最大效益。
上述提到的2400个汉字的涵概率达99%现代汉语词。不标声调的汉语音节只有四百多个,而连声调在内的单音节也只有一千多个。不标声调的音节数目同汉字字数的差距很大。解决办法是增加拼音音节数。本发明电拼输入法的基本设计原理是采取合理的办法来增加拼音音节数。首先,字母标调足以把音节数目增加到千多个。再把同音同调的音节按照汉字同音词的需要进一步改变其拼写法,这里主要考虑音节的语法特征。对少数语法特征相同的同音同调词则采取“特殊拼字”的方法来加以区分。例如,他、她和它被分别定型为ta、tha和tta。鉴于多音节词的广泛使用,估计不需要定型2400个单音节词来达到99%的现代汉语键入准确度。
在落实字母标调方面,本发明的电拼输入法的基本原理是规定每个音节的辅音除了“n”和“ng”发音之外全部皆不发音,类似于法文后缀辅音不发音的惯例。例如,“bob”、“boc”、“bov”和“box”都发“bo”音,b、c、v、x在这里仅仅分别表示汉语的四个声调而已。
为了增加可以直接拼音转换的数目,本发明的电拼输入法采用字母标调方法。本发明电拼输入法的基本原理是利用拼音音节后只有n和ng两个辅音才发音的特点,规定一切其它附加辅音都不发音,只用来标调和表达词性,根据本发明的电拼输入法不采用在音节后面加1、2、3、4来表示四声的方法,因为这样做不但增加符号数、减慢输入速度,而且混淆了字母和数字两种不同的符号系统。所述标调法还反映出常用词拼法简单的特点(基本式不标调)。应该指出,本发明的电拼拼写法基本上对单音节适用。至于该电拼拼写法是否也对双音节词适用,基本上视有无需要区分常用同音词而定。本发明的电拼输入法不用字形信息分化同音词,以便保持一级符号系统的地位。根据本发明的电拼输入法不但克服同音词的问题,而且也消除初学者和专业之间的鸿沟。
本发明的电拼输入法可以采用多层次标调法以及一些其它输入规则。下面将详细加以描述。
1.多层次标调输入法所述多层次标调输入法包括强式标调输入法和弱式标调输入法。
1.1强式标调输入法单音节的基本式(default)规定为最常用的单音词,如wo代表“我”。
第一声重复音节带头的辅音字母,例如,bbian编、ffan翻。
第二声在音节最后的辅音之前加r,例如xiarn闲、wern闻;如无辅音,则把r置于音节后,例如,dar答、chir迟其它办法(a)把由ai、ei和ui组成的音节的后元音i改为j,例如,(ai)aj癌、(fei)fej肥、(shui)shuj谁;(b)把由ao组成的音节的后元音改为u,例如,(bao)bau薄。
第三声重复主要元音,主要元音的选定按照a、e、i、o、u的优先次序,例如,(chao)chaao吵、(mei)meei美、(gou)goou狗、(luo)luoo裸其它办法(a)元音i后为u时,在i和u之间插入o,例如,(jiu)jiou九、(liu)liou柳;(b)元音u后为n或i时,把u改为ue,例如,(kun)kuen捆、(zui)zuei嘴。
第四声在音节后面加h其它办法(a)把由iu、ou、iao和ao组成的音节的最后的元音u或o改为w,例如,(jiao)jiaw较、(you)yow右;(b)把最后的辅音ng改为nq例如,(xing)xinq性、(bing)binq病;(c)把最后的辅音n重复为nn,例如,(xin)xinn信、(yin)yinn印;(d)把ei、ai、uai、ui组成的音节中的i改为y,例如,(bei)bey被、(zai)zay再、(zui)zuy罪。
同音词众多的音节,如ji、yi、shi、zhi等音节,强式的基本式(default)的拼写法把音节最后i元音改为y,例如,把“ji”改为“jy”级,把“shi”改为“shy”事。由此而增加的基本式也可以按照上面的标调法进行标调,从而可以使定型字数增加一倍。
当音节无辅音开头时,作如下的加辅音特殊处理方法
aw傲注意(1)标第一声时,使用“p”或“b”视汉字词是否是动词而定(参看动词性标调)。
(2)分辨多音节同音词时不必斤斤计较单音节拼写法原来对应的汉字。例如,shouzhii手指、zhiizai旨在、zhirde值得、zhirgen植根、zhirjie直接。
1.2动词性标调法在音节后加如下者为动词p(第一声)、s(第二声)、v(第三声)、x(第四声),例如,zhip知、zhis值、zhiv止、zhix制。
1.3第三层标调法第三层标调法分别在音节后加b、c、l、f来代表四声。例如yib医、yic仪、yil乙、yif意。
1.4弱式(ruoshi)标调法弱式标调法以重复最后声母或加k来表示。词性通过重复相应的声母来表达。例如,lancc兰、yongvv咏。这里,由于兰是名词,所以它采用本栏的名词附加符号c的做法而拼写成为lancc。如果它是动词,便会拼写成为lanss。咏是动词,同一栏上的动词为yongv。第四声加的k同时表达实物名词,例如,daik袋。
1.5特别(tebie)标调法这一层标调法归纳一些特殊的标调法和缩写,例如,tha她、yk亦,以及无法排入弱式行的标调法(一般是第四声)。例如,jianq降、mukk墓。
2其它输入规则
2.1句头不大写句头不大写。除了这一点与英文不同之外,大写法基本上与英文相同,即人名、地名词头大写。例如,姓氏如Li李、Wu吴,地名如Beijing、Chengdu成都和专用名如Asperin等词头大写。
2.2成语和其它缩写除了已经列入词典的缩写外,输入法包括众多缩写。用户也可以自行设定所需的缩写。例如(a)四字成语皆可用小写缩写,如lffw龙飞凤舞、jdjr绝代佳人。
(b)其它常用多音节词也可以采用缩写方法,如msz秘书长、msc秘书处、dbt代表团、tpt特派团。
(c)英文和中文缩写可以兼容,如ZG中国、UNDP开发计划署、NATO北约、SC安理会。缩写后加Q或q代表全称,如UNDPQ联合国开发计划署、AIDSQ人体免疫丧失综合症、SCQ安全理事会。
2.3信息技术分词原则鉴于汉语如何分词尚未有定论,而不同的语言在分词方面也有差别。因此,当前除了尽可能按照附件2(汉语拼音正词法基本规则)分词之外,为了信息处理的需要,建议采用下列的信息技术分词原则(a)重叠式后面的“的”或“地”一律分写。例如,“蒙蒙的”拼写为“mengmeng de”、“轻轻地”拼写为“qingqing di”;(b)意义无法由组成成分按句法规则直接推出的字串,都作为一个分词单位。例如,“白菜、十三点、北大”;(c)使用频率高的字串,虽然不一定复合语法规则,但可以作为一个分词单位。这些字串在汉语中是连续无间断读出的。例如,“都是、不是、不再、早已、最大、最高、最小、最好、最坏、不好、好不、毫不、并没有、不得不、越来越”。;(d)凡是成语都作为一个分词单位;(e)所有重叠式(包括语素重叠、词的完全重叠、词的不完全重叠和词组重叠),都作为一个分词单位。例如,“人人、村村、个个、讨论讨论、白花花、黑漆漆、雪白雪白”;(f)不太长的专用名字串(通常不超过4个字)作为一个分词单位连写。例如,“人民日报、联合国、北师大、语用所”分别拼写为“Renmribao、Lianheguo、Beishida、Yuyongsuo”;(g)采用“就大不就小”的原则。例如,“吝”字在现代汉语中只能构成“吝惜”、“吝蔷”这两个词。此外存在着文言遗留的说法,如(不吝…)、“吝于…”、“吝而不给”句,它们都可以列入信息词典内。
3高频字为了迅速提高输入汉字的效率,本发明的电拼输入法规定高频字如下;(a)一级高频字b-不 c-从 d-的 e-额 f-分 g-个 h-和 i-一 j-将 k-可 l-了 m-们 n-年q-千 r-日 s-是 t-同 w-为 x-想 y-月 z(-z)-在(子)ch-产 go-过 sh-十 zh-著 zo-作(b)二级高频字1.ba-吧,baa-把2.bei-北,bey-被3.da-大,daa-打4.er-而,i2-二5.d-的,di-地 dy-第 dei-得
6.geh-各,g-个7.guo-国,go-过8.hua-话,hhua-花9.hui-会,huj-回10.huor-活,ho-或11.ji-及,jii-几,jy-级 jic-极12.jiu-就,i9-九,jiou-酒13.kuai-快,kuay-块14.mai-卖,maai-买15.men-门,mn-们16.na-那,naa-明17.qian-前,qan-千18.s-是,sh-十,shr-实,shy-事,shyr-时,shii-使19.shui-水,shuj-谁20.ta-他,tha-她,tta-它21.i5-五,wur-无22.xiang-想,xang-向,xianq-象23.xie-写,xe-些24.yii-以,i-一25.you-有,your-由,yiu-又,yow-右26.yu-於,yuv-与27.zai-在(z),zay-再28.zhe-这,zh-著29.zi-字,-z-子30.zuo-做,zo作另外,图5示出了部分汉字及其相应的电拼码。
4.电拼软件的线上转换功能和主动分词速写软件实现线上转换(On-line Conversion),即在线上输入电拼后按空挡键在同一位置上转换成汉字,并且能够依次转换为较不常用的同音汉字。而不是像一般输入法那样,首先在输入行上输入拼音,通过选定所需字的手段把汉字送到文件上。在线转换减少选字工序(当输入字为所需字时)和眼睛上下移动带来的疲劳。
电拼软件首创主动分词连写输出功能。当用户输入分词连写的汉语拼音时,对输出的汉字可以做出以半格分词来保存选择反映输入的分词。例如,当输入“jintian tianqi hen hao”时,相应的汉字输出可以是“今天 天气 很 好”或“今天天气很好”。
5.电拼内码-ASCII中文内码ASCII中文内码是电拼输入法的最新发展。用ASCII文本来实现汉字的准确处理。ASCII中文内码采用与西文完全兼容的单字节手段来克服所谓“乱码”情况。办法是在现有电拼定型的基础上,对字符集内尚未定型的字按照其所属声调以附加数字来做区别。单音节的两个表分别对应于Big5和GB字符组,包含电拼没有覆盖的所有字符。每个表的字符根据四声分类。每个组由一个电拼音节表示。
电拼然后指定数字后缀,如jji1、jji2、jji3...,jih1、jih2、jih3、jih4...。指定这些数字的目的在于逐一实现在ASCII中文拼音和中文字符之间的对应关系。实际上,根据所使用平台的内码(Big5用于CWIN、GB用于PWIN),将使用一个字符组的字符。对于使用统一码(UNICODE)的平台,也可以执行类似的操作。
汉语拼音词、单音节电拼词和在其基础上为区分起见而定形的双音节同音词构成ASCII中文的核心,其覆盖范围大约在百分之95以上,视文件性质而定。没有被覆盖的双音节词或新词,在ASCII中文里将由连接符串联的单音节字作纪录。例如如果要建立“中温”一词,ASCII中文将以“zhong-wwen”来加以代表,以便有别于“zhongwen中文”。如果不存在相应的电拼词,若已确定ggang1的相应汉字为“肛”,那么“下肛”的ASCII中文纪录将为“xia-gang1”。当一些词的拼写法已经稳定下来,如zhongwwen已经被确定为代表“中温”,则在ASCII中文环境内会以“zhongwwen”取代“zhong-wwen”。
ASCII中文可以容纳不同的输入法,以字为单元的输入法将以其单音节拼写作纪录。屏幕显示形式可以是汉字,也可以为ASCII中文。在输入和输出方面,可以同GB,Big5,Unicode,ASCII中文以及前两者的扩张码进行双向转换。
ASCII中文内码具有很高可读性。熟识电拼的人可以理解其大部分含义,不必转换为汉字。它彻底克服了西文环境下的“乱码”问题,也便利在Internet上应用和进行中、英双文信息处理。网络上可以用电拼阅读器来进行ASCII中文内码对汉字的转换。
注意(1)汉语音节的使用很不平均,有些音节同音词很少,甚至没有相应的汉字。例如zhun-准
zzhun★zhurn zhuen
zhunnzhuo-捉
zhuoh*音节拼写后没有汉字者表示该音节没有常用同音词,并不表示没有相应的汉字。
同音词多的音节如ji-及,jji-机,jir-即,jii-几,jih-寄jip-击,jis-集,jiv-挤,jix-记
jib-基,jic-极,jif-己,jik-剂jy-级,jjy-鸡,jyr-疾,jyy-济,jyh-既jyp-积,jys-急,jyv-纪,jyx-计jyb-饥,jyc-吉,jyf-继yyk-季(2)同音词分化举例(a)shyshr-事实,shyrshy-时事,shrshyr-实时,sshshr-失实,sshshy-失事,jixshy-记事。jiishyr-几时。
(b)pingding-平定,pirngding-评定。
6.中文数字的输入法i1-一,i2-二,i3-三,i3-四,i5-五,i6-六,i7-七,i8-八,i9-九,i0-十。
I1-壹,I2-贰,I3-叁,I4-肆,I5-伍,I6-陆,I7-柒,I8-捌,I9-玖,I0-零。
为了根据上述电拼输入法向计算机输入汉字,本发明提供一种前述PI输入键盘。
就键盘的灵活性和适用范围来讲,音素键盘远远优于像日文假名键盘(Kana Keyboard)或双拼键盘。双拼键盘不适合处理诸如shaanxi、d、h、sh、zh、GB、lffw等特别拼写法和缩写,也不能用来处理其它语文。由于在中文文件里外国人名、地名、公司名称和英文词以及缩写会越来越多地出现,仅仅为了增加打字速度而推广双拼是不明智的。这样将迫使打字员至少要学习两个键盘,即双拼键盘和标准英文键盘,不仅增加了学习的困难,而且也因为常常要转换键盘而减慢打字速度。
根据本发明的PI输入键盘是在利用电脑程序取得关于拼音字母和二辅音字母的出现频率数据后,又参照关于英文字母出现频率的资料(5)(图3)进行设计的。设计是除了首先考虑汉语拼音字母的使用频率外,也设法把出现频率高的二辅音字母组成的两个字母分别放在键盘的左右两边,例如,高频二辅音字母ng、an、zh、sh、hu、he被合理地安排到需要左右手轮流打字的位置。PI键盘共有9个键同Qwerty的完全相同,主要由于它们是低频键,较难掌握,对习惯Qwerty键盘者更是如此。
图1、2、和3分别示出了汉语拼音和英文字母的使用频率。图6示出了本发明PI键盘的键位分布。其中,键位字母上带*的键与Qwerty键盘的键相同。仅仅使用主行上的字键便能够打出71.5%的汉语拼音,使用两手的食指和中指便可以打出82%的汉语拼音,而左右手的分布则为49%和51%,就算不考虑标点键也稍微偏重于右手。如果连标点符号也计算在内,则右手的使用肯定多于左手。PI键盘用来打英文时频率分布没有这么理想。其中一个原因是英文的音节数目远多于汉语拼音,因而字母的出现频率变得较均匀。但用PI键盘打英文还是比Qwerty键盘强。事实上,对英文来说,频率分布未能达到最优安排的原因主要是让“T”字母的键位不变。PI和Dvorak两键盘主行的频率分布差别主要由于PI键盘上行有较高的字母频率(见图4)。
如上所述,已经结合附图对本发明的电拼汉字输入法、所用键盘及其中文内码做出了详细和完整的描述。
在&双文转换单音词表&的基础上可以建立高效拼音转换输入法,高威天马中文软件普及版(Gowell-TianMa Chinese Word)将首先利用这种电拼(Dianpin)输入法。它包括大约两千三百左右定型单音词,同时采取以“eu”代替“ü”,例如,lüse-绿色,guilü-规律,lüxing-旅行等三词分别拼写为leuse,guileu和leuxing。电拼输入法基本上克服了频繁选字的麻烦。用户可以首先掌握高频字的输入,以便尽快在实际输入中得到好处,然后在需要时逐步学习其它定型拼写法。
另外,阻碍采用更有效键盘的条件已经随着电脑语词处理系统的发展而消失。尽管过去高效键盘在推广上遭遇到许多困难,如今以提高打字的生产力而言,本发明的PI键盘将无疑是一项有意义和成功的努力。实践证明,它不仅是优化的拼音键盘,而且也是一个比Qwerty键盘还高效的英文键盘。
注(1)见“The persistence of Qwerty and analogous seeminglysuboptimal technologies”john M.Hartwich Queen’s University又见“Typists Speed And Efficiency Increase With Dvorak Keyboard”Virginia DeGanahl Russell载于1985年冬季的《ComputerTechnology Review》,其中Russell说,“Shole的打字机有一个机械问题。为了避免连续击键时键杆卡在一起,他故意把最常一起使用的字母分别放置在键盘的四个象限。对今天能够盲打的打字员来说,这是最糟糕的安排。”又见“The Key to Faster Typing”Tom Benford著,载于《Amtrak Express》第六卷、第二期,月。
(2)Dvorak提出的设计原则是(a)把打字集中在主行和每一只手的食指和中指,(b)使用上行多于下行,(c)较强的右手负担稍多的打字任务,(d)把从上行跳到下行或反向的跳打减到最少,(e)把同一只手连续击键的情况减到最少。
1.一种计算机汉字拼音编码输入方法,利用汉字的声、韵、调组码并利用计算机键盘上相应字母键位输入汉字,其特征是所述的调采用多层次标调法,包括;1)强式标调法单音节的基本式规定为最常用的单词;第一声重复音节带头的辅音;第二声;在音节最后的辅音之前加r,如无辅音,则把r置于音节后;其它办法(a)把由ai、ei和ui组成的音节的后元音i改为j;(b)把由ao组成的音节的后元音o改为u;第三声重复主要元音,主要元音的选定按照a、e、i、o、u的优先次序;其它办法(a)元音i后为u时,在i和u之间插入o;(b)元音u后为n或i时,把u改为ue;第四声在音节后面加h其它办法(a)把由iu、ou、iao、ao组成的音节的最后的元音u或o改为W;(b)把最后的辅音ng改为nq;(c)把最后的辅音n重复为nn;(d)把ei、ai、uai、ui组成的音节中的i改为y;同音词众多并以i结尾的音节,其强式的基本(default)的拼法是把音节最后的元音i改为y;音节无辅音开头者,作如下辅音特殊处理ai爱
aw傲;2)动词性标调法动词在其音节后加第一声p第二声s第三声v第四声x;3)第三层标调法分别在音节后加b、c、i、f表示四声;4)弱式标调法重复最后声母或加k来表示;5)特别标调法该标调法归纳一些特殊和无法排入弱式行的标调法(一般是第四声);
2.根据权利要求1所述的汉字输入方法,其特征是除了人名与地名词头大写以外,句头不大写。
3.根据权利要求1所述的输入方法,其特征是(a)多音节词可用每字拼音首母的小写缩写,缩写后加Q或q表示全称;(b)英文和中文缩写兼容。
4.一种专用于权利要求1所述汉字输入方法输入汉字的拼音输入键盘,其特征是26个字母键的位置分布如下Q L D J TY O R F PC S U N EH A I GV X W Z BK M
5.一种将利用权利要求1所述汉字输入法输入的汉字转换成计算机内码的方法,其特征是在现有电拼定形的基础上,对字符集内尚未定形的字按照其所属声调以附加数字来做区别。
6.根据权利要求1所述的汉字输入法,其特征是该输入法还包括电拼软件,该软件实现线上转换,即在线上输入电拼后,按空挡键即在同一位置上转换成汉字,并且能够依次转换为较不常用的同音汉字;主动分词连写输出,当用户输入分词连写的汉字拼音后,对输出的汉字可以做出以半格分词来保存选择反应输入的分词。
7.根据权利要求1所述的汉字输入法,其特征是所述在线转换减少选字工序。
一种电拼汉字输入方法、专用键盘及其中文内码,所述电拼汉字输入方法不同字形挂钩,它利用词汇化汉语拼音,多层次字母标调和小量特别拼写法提高转换中文的准确度。所述键盘除了考虑汉语拼音字母的使用频率外,还把出现频率高的二辅音字母组的两个字母分别放置在键盘的左右两边以合理地进行左右手轮流打字。本发明的汉字输入方法采用一级符号系统,可以用来直接记录汉语,不因中文字体的变化而变化。所属中文内码彻底克服了在西文环境下产生“乱码”的问题。
文档编号G06F3/023GK10300
公开日日 申请日期日 优先权日日
发明者吴文超 申请人:高威有限公司}

我要回帖

更多关于 中文语音输入软件 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信