RIME中州韵输入法词库扩充(搜狗词库,QQ拼音词库,清华词库,拆字词库U模式等)

Rime输入法作为一款高度自定义的本地输入法,词库的配置尤为重要。

1.Rime输入法词库格式

Rime输入法的词库在用户配置文件夹下,是以.dict.yaml结尾的文件。

2.Rime输入法词库如何调用

Rime可以扩充很多词库,为了防止卡顿,词库在使用时通过递归调用的方法,首先我们定义一个总的词库,总词库的名称格式也为*.dict.yaml(名称根据自己定义,此处假设为myDict.dict.yaml),文件内容如下:

假设已下载了扩充词库A.dict.yaml,B.dict.yaml,C.dict.yaml,D.dict.yaml,E.dict.yaml

```bash


name: myDict #必须与文件名相同,此处不加文件后缀
version: "2014.10.28"
sort: by_weight
use_preset_vocabulary: true ​
import_tables: #导入词库
- A #将所有词库以这种方式写入
- B #注意,不需要写扩展名
- C
- D
#- E #此处加入#相当于屏蔽了词库E,后期需要使用去掉#即可 ...

注:Rime调用总的词库,总的词库再调用各个词库,各个词库之间也不互相影响
![image.png|1000](https://raw.githubusercontent.com/YiDaCP/Pictures/main/2024/08/15/31669132d1abb6bad25c9bcd797b72b2-20240815225610-2e6101.png)

完成以上设置相当于将词库ABCDE导入到了词库myDict词库中,此时设置Rime调用myDict即可,调用词库的设置如下:

用户文件夹找到文件你输入方案.custom.yaml(此处以小鹤双拼为例,打开double_pinyin_flypy.custom.yaml)加入以下语句:
`   'translator/dictionary': myDict`
只需将冒号后面内容修改为总词库词库名称即可。

## 3.搜狗词库下载

- 搜狗词库这里推荐下载[搜狗标准词库](https://pinyin.sogou.com/dict/detail/index/11640 "搜狗标准词库")与[搜狗网络词库](https://pinyin.sogou.com/dict/detail/index/4 "搜狗网络词库");其他词库按需下载。

- 词库下载后不能够直接用与Rime输入法,需要用[深蓝词库转换](https://github.com/studyzy/imewlconverter "深蓝词库转换")软件转换,转换完成后是txt文件,下文词库配置会用到该文件。
    ![image.png|1000](https://raw.githubusercontent.com/YiDaCP/Pictures/main/2024/08/15/216f9a3cf5c3a8497a3a87a2c870cb47-20240815225805-f33df2.png)


深蓝词库转换教程:

①软件下载可能出现无法访问的问题,这是自己下载的软件

链接:imewlconverter_Windows.zip - 蓝奏云

链接:https://pan.baidu.com/s/1K04UKRrfR6Z5_1BJbwizRA 
提取码:xlit 
复制这段内容后打开百度网盘手机App,操作更方便哦

②选择需要转换的文件,转出格式选择Rime
![image.png|1000](https://raw.githubusercontent.com/YiDaCP/Pictures/main/2024/08/15/c5bbfd21b5fc245cfb4b485fd9f015bb-20240815225758-363ee2.png)

## 4.词库配置

①词库配置还是需要在用户文件夹新建*.dict.yaml(名称设置为英文任意名称)文件,首先在该文件中加入以下代码

--- name: dict_sougou_standard #自定义的词库的名字,不加后缀 version: "2016.10.29" sort: by_weight use_preset_vocabulary: true ...

②接着在该文件的下方粘贴深蓝转换软件转换后的文本,如下图示
![image.png|1000](https://raw.githubusercontent.com/YiDaCP/Pictures/main/2024/08/15/c75ccd1ef3b9d886fbdc7116cacfff74-20240815225924-3ea205.png)

③将这个文件的名字加入到总词库文件myDict.dict.yaml中,并重新部署即可。

```cobol
 --- 
name: myDict                 #必须与文件名相同,此处不加文件后缀 
version: "2014.10.28" 
sort: by_weight 
use_preset_vocabulary: true ​ 
import_tables:              #导入词库
   - A                       #将所有词库以这种方式写入
   - B                       #注意,不需要写扩展名
   - C
   - D
   #- E                      #此处加入#相当于屏蔽了词库E,后期需要使用去掉#即可   
   - dict_sougou_standard ...

④效果验证
以搜狗标准词库中的词条“阿并洛古乡”为例
image.png|1000

导入搜狗标准词库前
image.png|1000

导入搜狗标准词库后
image.png|1000

5.词条去重

在将多个词库整合为一个词库时,难免会出现重复词条,去重方法如下:

①将txt文件另存为ANSI格式,用excel打开

②选中单元格列——数据——删除重复项

6.简繁转换

下载简繁转换工具简繁转换

自用分享:opencc-0.4.2-win32.zip - 蓝奏云

image.png|1000

7.拆字词库

下载拆字词库,根据相应输入法下载相应的拆字词库,此处以小鹤双拼拆字词库为例。

输入u然后打入拆分的字即可,如鑫:全拼ujinjinjin;小鹤双拼ujbjbjb
image.png|1000

8.其他词库

除了以上两个主要词库,你还可以在搜狗网站下载其他词库,方法同上

  • QQ拼音词库下载地址
  • wiki词库
  • rime增强词库
  • THUOCL清华词库