romaji.c
1.0.0
Cで書かれたシンプルなロマジからヒラガナへのコンバーター
make romaji
プログラムを構築します。変数はmake
のとおりです。
CC
:Cコンパイラ(GCC)CFLAGS
:コンパイラ()に渡す追加のフラグlibc
以外には、それ以上の依存関係は必要ありません。
私はそれをlibkkcに統合する意図でこれを作りました。このセットアップを使用すると、普通のスペースを分離されたロマジーの日本の文を書いて、Kana+Kanji Outputを入手できます。これは、言語の研究に本当に役立ちます。
私のようなシステムが必要な場合は、このプログラムをコンパイルして、次のシェルスクリプトを書きます。
[[ -z $2 ]] && LVL=2 || LVL= $2
romaji " $1 " | sed " s/ $ / $LVL /g " | kkc |
awk -F: ' /^([0-9]+:|>> 0:) <[^mcQ]/ {
line=""
split($2, splitter, "/")
lim=length(splitter)
for (i = 0; i < lim; i++) {
sub(/^([ n]*<|.*<)/, "", splitter[i])
line=(line splitter[i])
}
print line
} '
このシェルコードは、 ~/.zshrc
によって供給される関数でラップし、スクリプト名の代わりに関数名を渡すことでこれを呼び出すことができますが、どちらの実装が機能しますか。 awkスクリプトは、 scripts/kkc.awk
としてリポジトリルートになり、配管KKCの出力で使用できます。
scripts/kkc.awk
と一緒に使用法は次のようになります。
$ romaji "kore ha nani" | sed 's/ $ / 4/' | kkc | kkc.awk
コレハナに
コレは何
これは何
これはなに
このリポジトリには、(kimi wa -君は)& e
のようなwa
(は)のような誤解を招く粒子の一般的な音訳のためのSEDスクリプトも含まれています(ニホンe -日本へ)。スクリプトはscripts/norm.sed
です。また、このプロジェクトは[kakasi]と統合して、グラフで示すように完全な変換をすることができます。
このリポジトリは、GPL-V3.0ライセンスの下でライセンスされています。