Исходная конфигурация и тезаурус были изменены на основе коммита af2480b Усуна Пиньинь.
Слова в тезаурусе Rime относительно полные, но не очень полные. Основная проблема в том, что частота слов и частота слов неправильные, а также много бесполезных слов, поэтому я переделал его.
В основном поддерживайте словарный запас и частоту слов. На основе тезауруса рима удалены нездоровые слова, удалено большое количество редко встречающихся слов (слов с частотой == 1 и не различимых с помощью сегментатора слов), а также неслов, таких как «Деба» и «Деба». Слова «ДеЛе» удалены/исправлены. Вручную изменено большое количество частот слов. Первый шаг — выполнить вычитание.
Затем используйте высококачественный корпус из 745 396 750 слов, чтобы выполнить сегментацию слов, пересчитать частоту слов, частоту слов и нормализовать для достижения лучших входных эффектов. Можно использовать как полные, так и двойные заклинания.
Метод использования в основном такой же, как у Wusong Pinyin, с некоторой доработкой инструкций триггера и добавлением поддержки вспомогательного кода Lua. Вспомогательный код является необязательным. Нажмите `, чтобы включить его, и он не повлияет на обычный набор текста.
Символ/fh Дополнительные символы см. на https://github.com/gaboolic/rime-frost/blob/master/symbols_v.yaml
Тональные финалы /а /э /у и т. д.
Дата и время rq sj xq dt ts
Включите вспомогательный код. Инструкции по разделению вспомогательного кода Moqi.
Разделение компонентов и обратный поиск uU
символ Юникода U
Числовые суммы, капитализированные R
Лунный календарь N
Калькулятор В
Загрузите сжатый пакет. Код. Загрузите ZIP-архив этого хранилища (или загрузите последнюю версию исходного кода.zip) и разархивируйте его по следующему пути.
Windows: %APPDATA%Rime
(вы можете щелкнуть правой кнопкой мыши «Метод ввода Сяоланхао» в правом нижнем углу, чтобы открыть меню и выбрать папку пользователя). После копирования перейдите к настройкам метода ввода и выберите Байшуан Пиньинь, а затем повторно разверните
Мак
Путь к усам: ~/Library/Rime
Путь к версии fcitx5-Mac: ~/.local/share/fcitx5/rime
Линукс
Путь fcitx5-rime: ~/.local/share/fcitx5/rime
Путь к версии плоского пакета fcitx5 ~/.var/app/org.fcitx.Fcitx5/data/fcitx5/rime
Путь ibus-rime: ~/.config/ibus/rime
Андроид
Путь к версии fcitx5-Android: /Android/data/org.fcitx.fcitx5.android/files/data/rime
Тот же текстовый путь — /rime
Swift имеет встроенную частоту слов тезауруса Hoarfrost, вы можете установить его напрямую и использовать.
Метод ввода хранилища iOS в настоящее время встроен, и Байшуан Пиньинь также можно обновить через [Настройки схемы ввода — знак плюс в правом верхнем углу — Загрузка схемы — Перезаписать и развернуть].
Первая установка:
В зависимости от системы, используемой пользователем, и установленного программного обеспечения сначала перейдите в родительский каталог соответствующего файла конфигурации (например, %APPDATA%
для Windows, ~/Library/
для Mac), а затем выполните следующую команду:
git clone --depth 1 https://github.com/gaboolic/rime-frost Rime
Последующие обновления:
Просто выполните git pull
в папке Rime.
Mac: cd ~/Library/Rime && git pull
Windows: cd "$env:APPDATARime" && git pull
Остальные системы можно вывести аналогичным образом.
Выберите рецепт (others/recipes/*.recipe.yaml) для установки или обновления:
℞ Чтобы установить или обновить все файлы, выполните bash rime-install gaboolic/rime-frost:others/recipes/full.
После сортировки сегментации слов добавляются слова с высокой частотностью слов, которых нет в словаре.
Напоминание об опечатках и орфографических ошибках Lua
Напишите автоматический скрипт для преобразования предложений в пиньинь, затем вызовите rime_api, чтобы сгенерировать предложения с использованием пиньинь, сравните точность и выполните итерацию.
Кроме того, первый и последний символы кода Moqi проверяются в обратном порядке. Например, если вы наберете управляющий символ amq, а затем наберете mu cun, вы сможете ввести слова «дерево из деревенского шкафа» и так далее.
Добавьте функцию вспомогательного кода загрузки Lua.
2 слова, структура глагол + существительное, добавьте «LE» и «END» в середине и добавьте «MI» в конце, чтобы автоматически увеличить словарный запас.
Например: Потрясающе → Разве это не потрясающе?
Удаление зуба: зуб удален, зуб удален, зуб не удален, зуб не удален, зуб удален или нет
Например:
Добавьте «не» между прилагательными:
Добавьте слова типа «четвертый столбец = четвертый столбец».
Статистика частоты английских слов в корпусе китайского языка
Обучите интеллектуальную языковую модель
Тезаурус инея https://github.com/iDvel/rime-ice Исходный тезаурус и большинство конфигураций тезауруса инея взяты из тезауруса инея.
Сегментация заикающихся китайских слов https://github.com/fxsjy/jieba
Преобразование китайских иероглифов в пиньинь (pypinyin) https://github.com/mozillazg/python-pinyin
Сверхкрупный китайский корпус MNBVC https://github.com/esbatmop/MNBVC в настоящее время имеет объем данных 33 ТБ.
kenlm https://github.com/kpu/kenlm официальный сайт https://kheafield.com/code/kenlm/
Учебник по kenlm, вызов Python https://github.com/mattzheng/py-kenlm-model
Талисман (забран 12 октября 2024 г.):
Решение с использованием тезауруса Baishuang
Звуковая форма Моци https://github.com/gaboolic/rime-shuangpin-fuzhuma
Предложение Моки Вуби https://github.com/gaboolic/rime-wubi-sentence
Мятный пиньинь https://github.com/Mintimate/oh-my-rime
Метод ввода Yuyan https://github.com/gurecn/YuyanIme Готовый метод ввода Android со встроенной библиотекой словаря Baishuang.