元の構成とシソーラスは、Wusong Pinyin の af2480b コミットから変更されました。
Rime シソーラスの単語は比較的完成されていますが、単語の頻度と単語の頻度が適切ではなく、無駄な単語が多いことが主な問題でしたので、作り直しました。
主に語彙と単語の頻度を維持します。樹氷シソーラスに基づいて、不健全な単語が削除され、多数の一般的でない単語(頻度 == 1 で単語セグメンタで区別できない単語)が削除され、「デバ」や「デバ」などの非単語も削除されています。 「DeLe」の単語を削除/調整しました。多数の単語の頻度を手動で変更しました。最初のステップは引き算を行うことです。
次に、7 億 45,396,750 語の高品質コーパスを使用して、単語の分割、単語頻度、単語頻度の再カウント、および正規化を実行して、入力効果を向上させます。フルスペルとダブルスペルの両方が使用できます。
使用方法は基本的に Wusong Pinyin と同じですが、トリガー命令の微調整と Lua 補助コードのサポートが追加されています。補助コードはオプションです。` を押してオンにすると、通常の入力には影響しません。
Symbol/fh その他のシンボルについては、 https://github.com/gaboolic/rime-frost/blob/master/symbols_v.yaml
参照してください。
調性終止音 /a /e /u など。
日付と時刻 rq sj xq dt ts
補助コードをオンにする` Moqi 補助コード分割命令
コンポーネントの分割と逆方向検索 uU
ユニコード文字 U
大文字の数値 R
旧暦N
電卓V
圧縮パッケージのコードをダウンロードします - このウェアハウスの ZIP をダウンロード (またはリリースの最新のソースコード .zip をダウンロード) し、次のパスに解凍します。
Windows: %APPDATA%Rime
(右下隅の Xiaolanghao 入力方式を右クリックしてメニューを開き、ユーザー フォルダーを選択できます) コピー後、入力方式の設定に移動し、Baishuang Pinyin を選択し、再展開します。
マック
ウィスカーのパスは~/Library/Rime
です
fcitx5-Mac版のパスは~/.local/share/fcitx5/rime
です
Linux
fcitx5-rime パスは~/.local/share/fcitx5/rime
です。
fcitx5 flatpak バージョンのパス~/.var/app/org.fcitx.Fcitx5/data/fcitx5/rime
ibus-rime パスは~/.config/ibus/rime
です。
アンドロイド
fcitx5-Android バージョンのパスは/Android/data/org.fcitx.fcitx5.android/files/data/rime
です。
同じテキストパスは/rime
です
Swift には Hoarfrost シソーラスの単語頻度が組み込まれており、直接インストールして使用できます。
iOS ウェアハウスの入力方法は現在組み込まれており、Baishuang Pinyin は [入力スキーム設定 - 右上隅のプラス記号 - スキームのダウンロード - 上書きして展開] を通じて更新することもできます。
初めてのインストール:
ユーザーが使用するシステムとインストールされているソフトウェアに応じて、まず対応する構成ファイルの親ディレクトリ (たとえば、Windows の場合は%APPDATA%
、Mac の場合は~/Library/
) に移動し、次のコマンドを実行します。
git clone --depth 1 https://github.com/gaboolic/rime-frost Rime
その後の更新:
Rimeフォルダーでgit pull
実行するだけです。
Mac: cd ~/Library/Rime && git pull
Windows: cd "$env:APPDATARime" && git pull
他のシステムも同様に推定できます
インストールまたは更新するレシピ (others/recipes/*.recipe.yaml) を選択します。
℞ すべてのファイルをインストールまたは更新するには、bash rime-install gaboolic/rime-frost:others/recipes/full を実行します。
単語分割を整理した後、単語頻度は高いが語彙に含まれていない単語を追加します。
タイプミスとスペルミスのリマインダー Lua
文をピンインに変換する自動スクリプトを作成し、rime_api を呼び出してピンインを使用した文を生成し、精度を比較して反復します。
さらに、Moqi コードの最初と最後のグリフが逆チェックされます。たとえば、amq ガイド文字を入力してから mu cun と入力すると、「village 食器棚の木」などの単語を入力できます。
Luaブート補助コードの機能を追加
動詞+名詞の2つの単語の途中に「LE」と「END」を付け、最後に「MI」を付けると自動的に語彙を導き出します。
例:すごい→すごいじゃないですか?
抜歯:抜歯、抜歯、抜歯なし、抜歯なし、抜歯の有無
例えば:
形容詞の間に「not」を追加します。
「4 番目の列 = 4 番目の列」のような単語を追加します。
中国語コーパスにおける英単語頻度の統計
インテリジェントな言語モデルをトレーニングする
樹氷シソーラス https://github.com/iDvel/rime-ice 霧氷シソーラスの最初のシソーラスとほとんどの構成は樹氷シソーラスから来ています
吃音中国語単語の分割 https://github.com/fxsjy/jieba
中国語の文字をピンインに変換 (pypinyin) https://github.com/mozillazg/python-pinyin
MNBVC 超大規模中国語コーパス https://github.com/esbatmop/MNBVC のデータ量は現在 33 TB
kenlm https://github.com/kpu/kenlm 公式サイト https://kheafield.com/code/kenlm/
kenlm チュートリアル、Python 呼び出し https://github.com/mattzheng/py-kenlm-model
マスコット (2024-10-12 に入手):
Baishuang シソーラスを使用したソリューション
莫奇音形 https://github.com/gaboolic/rime-shuangpin-fuzhuma
Moqi Wubi 文 https://github.com/gaboolic/rime-wubi-sentence
ミントピンイン https://github.com/Mintimate/oh-my-rime
Yuyan 入力メソッド https://github.com/gurecn/YuyanIme Baishuang 語彙ライブラリが組み込まれた、すぐに使える Android 入力メソッド