RIME中州韵输入法词库扩充(搜狗词库,QQ拼音词库,清华词库,拆字词库U模式等)
- 实用技巧
- 2024-08-16
- 85热度
- 0评论
Rime输入法作为一款高度自定义的本地输入法,词库的配置尤为重要。
1.Rime输入法词库格式
Rime输入法的词库在用户配置文件夹下,是以.dict.yaml结尾的文件。
2.Rime输入法词库如何调用
Rime可以扩充很多词库,为了防止卡顿,词库在使用时通过递归调用的方法,首先我们定义一个总的词库,总词库的名称格式也为*.dict.yaml(名称根据自己定义,此处假设为myDict.dict.yaml),文件内容如下:
假设已下载了扩充词库A.dict.yaml,B.dict.yaml,C.dict.yaml,D.dict.yaml,E.dict.yaml
```bash
name: myDict #必须与文件名相同,此处不加文件后缀
version: "2014.10.28"
sort: by_weight
use_preset_vocabulary: true
import_tables: #导入词库
- A #将所有词库以这种方式写入
- B #注意,不需要写扩展名
- C
- D
#- E #此处加入#相当于屏蔽了词库E,后期需要使用去掉#即可 ...
注:Rime调用总的词库,总的词库再调用各个词库,各个词库之间也不互相影响
![image.png|1000](https://raw.githubusercontent.com/YiDaCP/Pictures/main/2024/08/15/31669132d1abb6bad25c9bcd797b72b2-20240815225610-2e6101.png)
完成以上设置相当于将词库ABCDE导入到了词库myDict词库中,此时设置Rime调用myDict即可,调用词库的设置如下:
用户文件夹找到文件你输入方案.custom.yaml(此处以小鹤双拼为例,打开double_pinyin_flypy.custom.yaml)加入以下语句:
` 'translator/dictionary': myDict`
只需将冒号后面内容修改为总词库词库名称即可。
## 3.搜狗词库下载
- 搜狗词库这里推荐下载[搜狗标准词库](https://pinyin.sogou.com/dict/detail/index/11640 "搜狗标准词库")与[搜狗网络词库](https://pinyin.sogou.com/dict/detail/index/4 "搜狗网络词库");其他词库按需下载。
- 词库下载后不能够直接用与Rime输入法,需要用[深蓝词库转换](https://github.com/studyzy/imewlconverter "深蓝词库转换")软件转换,转换完成后是txt文件,下文词库配置会用到该文件。
![image.png|1000](https://raw.githubusercontent.com/YiDaCP/Pictures/main/2024/08/15/216f9a3cf5c3a8497a3a87a2c870cb47-20240815225805-f33df2.png)
深蓝词库转换教程:
①软件下载可能出现无法访问的问题,这是自己下载的软件
链接:imewlconverter_Windows.zip - 蓝奏云
链接:https://pan.baidu.com/s/1K04UKRrfR6Z5_1BJbwizRA
提取码:xlit
复制这段内容后打开百度网盘手机App,操作更方便哦
②选择需要转换的文件,转出格式选择Rime
![image.png|1000](https://raw.githubusercontent.com/YiDaCP/Pictures/main/2024/08/15/c5bbfd21b5fc245cfb4b485fd9f015bb-20240815225758-363ee2.png)
## 4.词库配置
①词库配置还是需要在用户文件夹新建*.dict.yaml(名称设置为英文任意名称)文件,首先在该文件中加入以下代码
--- name: dict_sougou_standard #自定义的词库的名字,不加后缀 version: "2016.10.29" sort: by_weight use_preset_vocabulary: true ...
②接着在该文件的下方粘贴深蓝转换软件转换后的文本,如下图示
![image.png|1000](https://raw.githubusercontent.com/YiDaCP/Pictures/main/2024/08/15/c75ccd1ef3b9d886fbdc7116cacfff74-20240815225924-3ea205.png)
③将这个文件的名字加入到总词库文件myDict.dict.yaml中,并重新部署即可。
```cobol
---
name: myDict #必须与文件名相同,此处不加文件后缀
version: "2014.10.28"
sort: by_weight
use_preset_vocabulary: true
import_tables: #导入词库
- A #将所有词库以这种方式写入
- B #注意,不需要写扩展名
- C
- D
#- E #此处加入#相当于屏蔽了词库E,后期需要使用去掉#即可
- dict_sougou_standard ...
④效果验证
以搜狗标准词库中的词条“阿并洛古乡”为例
导入搜狗标准词库前
导入搜狗标准词库后
5.词条去重
在将多个词库整合为一个词库时,难免会出现重复词条,去重方法如下:
①将txt文件另存为ANSI格式,用excel打开
②选中单元格列——数据——删除重复项
6.简繁转换
下载简繁转换工具简繁转换
自用分享:opencc-0.4.2-win32.zip - 蓝奏云
7.拆字词库
下载拆字词库,根据相应输入法下载相应的拆字词库,此处以小鹤双拼拆字词库为例。
输入u然后打入拆分的字即可,如鑫:全拼ujinjinjin;小鹤双拼ujbjbjb
8.其他词库
除了以上两个主要词库,你还可以在搜狗网站下载其他词库,方法同上
- QQ拼音词库下载地址
- wiki词库
- rime增强词库
- THUOCL清华词库