極點五筆是一個開放碼表制作的輸入平臺,它可以靈活自如地掛接自己的碼表,大批量的給自己的詞庫自動編碼;還能借助“索引文件”和拼音碼表,生成字詞的反查編碼,實現拼音打生字詞顯示形碼編碼的反查功能。
索引文件的作用:
在極點6以前“索引文件”名為 freewb.dat ,極點6版本后,更名為 freeime.dat 。索引文件的作用就是:制作詞庫的時候,根據規則自動生成字詞組編碼,導入拼音詞庫的時候,自動生成字詞的反查編碼。
如何制作自己的索引文件呢?現在把我的制作過程寫出來供大家參考!
1、導出“極點五筆”的系統詞庫。
打開極點輸入法(右鍵點擊狀態欄),依次點擊【管理工具】——【詞庫工具】——【詞庫生成與維護】在【系統詞庫】里面點擊【導出】。導出了一個名為 freeime.txt 的碼表文件。如下圖所示:
2、提取單字碼表。
(1)轉換 freeime.txt 碼表文件的編碼格式,方法是:雙擊打開后點擊“另存為”,選擇編碼為“ANSI”,保存替換原有文件;
(2)用 ExtractWords.exe 工具提取單字碼表:下載 ExtractWords(酷極提詞工具),打開ExtractWords.exe ,碼表文件名選擇剛剛保存的 freeime.txt ,輸出碼表文件名填 output.txt (更改后綴為“txt”),要提取的編碼長度填寫 從 1 到 4 ,要提取的詞庫字數 從 1 到 1,【選項】里面不用動,OK點【提取】,如下圖:
這樣就導出了名為 output.txt 的單字碼表。
(PS:如果你已經制作了自己的單字碼表,也建議來做以上兩步,以便對照自己的單字碼表格式是否正確,或是一開始就先提取“五筆”的單字碼表來修改成自己的編碼。注意單字的編碼不能是1碼,必須是2-4碼,否則,其中的1碼單字以后不能生成詞組編碼?。?/p>
3、轉換單字碼表文件 output.txt 的編碼格式:這里我使用“cnbook”(中文記事本)打開 output.txt,另存為,選擇的編碼格式是“(936,GBK)”,保存替換原有文件。
4、用“極點工具箱 2.2”生成“索引文件”。
打開極點工具箱,會提示 “未找到極點安裝目錄”,不用管它,確定,點擊【詞組提取】——【生成索引】——選擇剛才制作好的 output.txt 的單字碼表,在極點工具箱文件夾里就會生成一個索引文件freewb.dat , 將其改名為 freeime.dat 。
至此一個索引文件就制作完成了。
接下來介紹如何運用極點強大的碼表工具,來制作自己的個人碼表:
1、用剛才提取的單字碼表編制成自己的主詞庫(參照極點五筆系統詞庫的格式及表頭來編寫)。
2、重新安裝官方原版的“極點五筆”,提取里面的拼音詞庫。
3、在mb目錄下新建自己的碼表文件夾,將先前做好的“索引文件” freeime.dat 拷貝到自己的碼表文件夾里。
4、打開極點的【詞庫生成與維護】,生成自己編好的系統詞庫,導入所提取的拼音詞庫。
5、此時,就可以把別人做的10萬、20萬的大詞庫去除編碼,批量添加到用戶詞庫中(極點會運用你的“索引文件”自動編碼哦,這功能強大吧?。?。
6、導出用戶詞組,精挑細選后合并到系統詞庫(主詞庫)中。
自己的輸入法就這樣做成了,還能和極點五筆一樣——拼音打字反查編碼呢!