首頁 五筆字根 五筆教程 打字相關 五筆下載 五筆新聞 常見問題 五筆經驗 五筆相關
五筆字型單字編碼規則
[位置:五筆教程·五筆教程][字體:  ][顏色:   ][中文簡體 中文繁體]

一、五筆字型編碼歌訣

  掌握漢字的編碼規則,熟悉每個漢字的編碼,是五筆字型輸入的基礎,下面提供的單個字的五筆字型編碼規則歌忘記訣:
    五筆字型均直觀,依照筆順把碼編;
    鍵名漢字打四下,基本字根請照搬;
    一二三末取四碼,順序拆分大優先;
    不足四碼要注意,交叉識別補后邊。
  從這歌訣就可以看出五筆字型編碼規則的大致面貌,同時口訣也概括了五筆字型拆字取碼的五項原則:
  1、從形取其順序按書寫規則,即從左到右、從上到下、從外到內;
  2、以130多個字根為基本單位;
  3、對于字根數超過四個的漢字,按一二三末字根的順序,最多只取四碼;
  4、單體結構拆分取大優先;
  5、末筆與字型交叉識別。
  下圖是五筆字型編碼流程圖,以方便讀者了解整個編碼方案的概貌:
  

二、鍵名漢字的編碼規則

  五筆字型中規定的鍵名漢字共有25個,"王土大木工目日口田山禾白月人金言立水火之已子女又纟"
     25個鍵名漢字與25個字母鍵相應,這些字的編碼相當簡單,它們的編碼就是4個所在字母鍵字母,如:"言"字的編碼為"YYYY","纟"字的編碼為"XXXX",等等。輸入鍵名漢字時,只要連續擊四次該字所在的字母鍵即可。

 

三、成字字根的編碼規則

  在五筆字型字根鍵盤的每個字母鍵上,除了一個鍵名字根外,還有一些其它類型的字根。有些字根其本身就是一個漢字,這樣的字根稱為成字字根。成字字根的編碼是按下面公式進行的:
    鍵名碼+首筆碼+次筆碼+末筆碼
  當成字字根僅為兩筆時,編碼只有三碼,公式為:

        鍵名碼+首筆碼+末筆碼

例如:"石",字根所在的鍵為D,第一筆劃為 "橫"的編碼是G,第二筆為 "撇"的編碼是T鍵,末筆"橫"的編碼也是G鍵,所以這個字的五筆編碼就是DGTG。再比如"蟲"字,這個字根是在J鍵,第一筆是豎H,第二筆是折N,最末一筆是捺(在五筆里"點"做為"捺")Y,所以"蟲"的五筆編碼就是JHNY。

四、鍵外字的編碼規則

  國標GB2312-80中,上述的鍵名和成字字根這樣的鍵面字總共才有一百多個,絕大部分漢字都不是成字字根,這些才是我們在使用當中用得最多的。
  五筆字型漢字編碼主要是鍵外字的編碼,編碼可以分為兩類,純字根碼和識別碼。如果一個漢字的字根是四個或超過四個,就用前三后一總共四個字根碼組成編碼。
  不足四個字根的漢字需補一個字型結構識別碼,以增加區分漢字的信息量。

  1、字根碼
  每個字根都分派在一個字母鍵上,其所在鍵上的英文就是該字根的"字根碼"。
凡含四個或超過四個字根的漢字,取其第一、二、三、末四個字根碼組成鍵外字的輸入編碼。

第一字根編碼+第二字根編碼+第三字根編碼+最末一個字根編碼

這里一、二、三、末應按正常書寫順序,先左后右,先上后下,先外后內。

  2、交叉識別碼
  一個字的字根不足四個時,依次擊入字根碼后,最后需要補一個識別碼。為什么需要這個識別碼呢,這里可以舉例說明:如"沐"和"汀"字,這兩個字都是由兩個字根組成的,且這兩個字的字根碼都是IS。雖然也可以讓輸入者選擇的方式來確定到底需要輸入哪一個字,但這對漢字輸入速度極為不利,重碼率要越低越好,所以五筆編碼中才引入了識別碼這個概念來對這類漢字進行區分。
  識別碼是用該漢字最后一個筆畫和字型結構信息來確定的,具體規則如下表:

           
  左右結構(第1位) 上下結構(第2位) 雜合結構(第3位)
末筆是"橫",在一區 G F D
末筆是"豎",在二區 H J K
末筆是"撇",在三區 T R E
末筆是"捺",在四區 Y U I
末筆是"折",在五區 N B V

  

  從上表可以看出,識別碼的確定分兩個步驟,第一步根據最后一筆確定是在哪個區,第二步再以該漢字的字型結構來確定在哪一位,然后就能得到具體識碼了。
  例:"旮"字,這個字同旭一樣字根只有兩個,字根碼為VJ,但字型不同,可以通過識別碼來區分,"旮"最末筆是橫,在一區,是上下結構,所以是在第二位,即F,所以"旮"的五筆編碼就是VJF。再如"汀"字,最末一筆是左豎鉤,在五筆里為豎,在第二區,這個字是左右型結構,所以在第一位,即H,所以"汀"的五筆編碼就是ISH。

  加識別碼后仍不足四碼時,擊空格鍵結束。單筆與字根相連的字型為雜合型,見前面所述。
  關于末筆畫還有如下規定,這些規定使取碼更為簡單,明確。
  (1)、末字根為"力"、"刀"、"九"、"七"等時,一律認為末筆畫為折。
  (2)、"進"、"逞"、"選"等字,不以"走之"的末筆為末筆(書寫時確實是末筆,但這樣末筆都一樣,減少了識別信息量,約定以去掉"走之"部分后的末筆整個字的末筆來構造識別碼。進、逞、遠的識別碼應分別為:23,K;13,D;53,V。當以"走之"末筆為末筆時,則識別碼都相同,為43,I。沒有得到識別信息。
  (3)、"我"、"戔",成等字的末筆取"丿"。

   

五、簡碼

  為了提高輸入速度,五筆字型方案還設計了簡碼輸入,它將常用漢字只取其前邊的一個、兩個或三個字根構成,因為"識別碼"總是在全碼的最后位置,所以簡碼的設計不但減少了擊鍵次數,而且省去了部分漢字的"識別碼"的判別和編碼,給擊鍵帶來了很大方便。

  簡碼漢字共分三級:

  1、一級簡碼
  五筆字型中,根據每個字母鍵上的字根形態特征,每鍵安排一個最為常用的高頻漢字,這類字共25個,它們的編碼只有一位,輸入時只要擊鍵一次再加一次空格鍵即可。這些高頻字及其編碼如下:
    一 G 地 F 在 D 要 S 工 A
    上 H 是 J 中 K 國 L 同 M  
    和 T 的 R 有 E 人 W 我 Q
    主 Y 產 U 不 I 為 O 這 P
    民 N 了 B 發 V 以 C 經 X
  這些高頻字實際情況的鍵位記憶可以與鍵名聯想起來進行,大家詳細看看,可以發現有兩個字,其一級簡碼字與鍵名字是相同的。下面是高頻字與鍵名字對照表:

        第一區: 一 ->王 地 ->土 在 ->大 要 ->木 工 ->工
    第二區: 上 ->目 是 ->日 中 ->口 國 ->田 同 ->山  
      第三區: 和 ->禾 的 ->白 有 ->月 人 ->人 我 ->金
    第四區: 主 ->言 產 ->立 不 ->水 為 ->火 這 ->之
    第五區: 民 ->已 了 ->子 發 ->女 以 ->又 經 ->纟

  2、二級簡碼
  二級簡碼是指編碼時取單字全碼的前兩個字根代碼。二十五個鍵位代碼,其兩碼組合共計有25*25=625個編碼。也就是說,用兩位碼可以給與625個漢字編碼。五筆字型就選取使用頻率較高的600多個漢字與這些對應,這些編碼就成為這些漢字的簡碼。

  3、三級簡碼
  三級簡碼由一個漢字的前三個字根組成,只要一個漢字的前三個字根碼在整個編碼體系中是唯一的,一般都作為三級簡碼,三個字母可以組成的編碼數是:25*25*25=15625個。實際上,在國際基本集的5763個漢字中,有三級簡碼的漢字有4400多個。要輸入這些漢字,只要依次鍵入這三個字根代碼,再加上空格鍵即可。這樣看上去似乎擊鍵次數仍為四鍵,并沒有減少,但是由于省略了前三個字根之后的字根判定或者交叉識別代碼的判定,則可達到提高編碼速度,進而達到提高輸入速度的目的。
  在五筆字型編碼方案中,具有簡碼的漢字總數達5000多個,它們已占國際基本集的5763個的絕大多數。因此,簡碼不但使用得編碼輸入變得非常簡明直觀,而且可以大地提高輸入效率。
  當然,由于簡碼都是四碼簡略而得,所以有的字就會同時有幾種簡碼。例如"經"字,即有一級簡碼、二級簡碼,又有三級簡碼,還可以用四位輸入。所以,最好能夠將簡碼漢字背熟,對于一個有幾種簡碼的漢字,盡量采用擊鍵次數少為好,這樣可以提高你的輸入速度。

六、重碼和容錯碼

  如果一個編碼對應著幾個漢字,這幾個字稱為重碼字;幾個編碼對應一個漢字,這幾個編碼稱為漢字的容錯碼。
  在五筆字型中,當輸入重碼時,重碼字顯示在提示行中,較常用的字排在第一個位置上,并用數字指出重碼字的序號,如果你要的就是第一個字,可繼續輸入下一個字,該字自動跳到當前光標位置。如果是其它的重碼字則需要用數字鍵加以選擇。
  例如:"嘉"字和"喜"字,都分解(FKUK),因"喜"字較常用,它排在第一位,"嘉"字排在第二位。若你需要"嘉"字則要用數字鍵2來選擇。
  在漢字中有些字的書寫順序往往因人而異,為了能適應這種情況,允許一個字有多種輸入碼,這些字就稱為容錯字。在五筆字型編碼輸入方案中,容錯字有500多個。



本文作者:未知

上一篇:五筆字型詞組編碼規則 文章瀏覽:3850  文章來源:五筆字根網
下一篇:五筆字型編碼的漢字拆分原則
□分類閱讀排行
01、萬能五筆簡明教程
02、五筆如何拆字
03、金山打字通之五筆教程
04、五筆輸入法拆字原則
05、五筆字型編碼的漢字拆分原則
06、五筆字型的鍵盤設計
□相關文章列表
00、沒有找到相關文章


黑龙江22选5开奖结果