このプロジェクトは、Unicode 文字データベースに含まれるデータの一部へのアクセスを提供するライブラリで構成されています。
Unicode 13.0 絵文字 13.0
UnicodeRadicalStrokeCount.StrokeCount は、System.Byte 型ではなく System.SByte 型になりました。
NuGet でパッケージの最新バージョンを取得します: https://www.nuget.org/packages/UnicodeInformation/。ライブラリがプロジェクトにインストールされると、必要なものがすべて System.Unicode 名前空間に見つかります。
ライブラリによって提供されるものはすべて、名前空間System.Unicode
の下にあります。 XML ドキュメントは、迷うことなく API を操作できるように十分に充実している必要があります。
現在の状態では、プロジェクトは C# 7.3 で書かれており、Roslyn によってコンパイル可能で、.NET Standard 2.0 と .NET Standard 1.1 の両方をターゲットとしています。 UnicodeInformation ライブラリには、カスタム ファイル形式で保存された公式 Unicode 文字データベースの (大規模な) サブセットが含まれています。
次のプログラムは、いくつかの文字に関する情報を表示します。
using System ;
using System . Text ;
using System . Unicode ;
namespace Example
{
internal static class Program
{
private static void Main ( )
{
Console . OutputEncoding = Encoding . Unicode ;
PrintCodePointInfo ( 'A' ) ;
PrintCodePointInfo ( '∞' ) ;
PrintCodePointInfo ( 0x1F600 ) ;
}
private static void PrintCodePointInfo ( int codePoint )
{
var charInfo = UnicodeInfo . GetCharInfo ( codePoint ) ;
Console . WriteLine ( UnicodeInfo . GetDisplayText ( charInfo ) ) ;
Console . WriteLine ( "U+" + codePoint . ToString ( "X4" ) ) ;
Console . WriteLine ( charInfo . Name ?? charInfo . OldName ) ;
Console . WriteLine ( charInfo . Category ) ;
}
}
}
説明:
UnicodeInfo.GetCharInfo(int)
指定されたコード ポイントに関連付けられたさまざまな情報へのアクセスを提供する構造体UnicodeCharInfo
を返します。UnicodeInfo.GetDisplayText(UnicodeCharInfo)
は、指定されたコード ポイントの表示テキストを計算するヘルパー メソッドです。一部のコード ポイントはスタンドアロン形式で表示されるように設計されていないため、指定された文字をより表示しやすくしようとします。表示テキストを提供するために使用されるアルゴリズムは非常に単純化されており、非常に特定のコード ポイントにのみ影響します。 (例: 制御文字) ほとんどのコード ポイントでは、これは単純に直接の文字列表現を返します。UnicodeCharInfo.Name
、Unicode 標準で指定されているコード ポイントの名前を返します。一部のキャラクターは仕様上、標準では名前が割り当てられていないことに注意してください。 (制御文字など) ただし、これらの文字には、フォールバックとして使用できる代替名が割り当てられている場合があります。 (例: UnicodeCharInfo.OldName
)UnicodeCharInfo.OldName
該当する場合、および現在の名前と異なる場合に、Unicode 1.0 で定義されている文字の名前を返します。UnicodeCharInfo.Category
指定されたコード ポイントに割り当てられたカテゴリを返します。注意: UCD プロパティ ISO_Comment は、すべての新しい Unicode バージョンで空であるため、決して含まれません。
プロジェクト UnicodeInformation.Builder は、ucd.dat という名前のファイルの生成を処理します。このファイルには、.NET の deflate アルゴリズムによって圧縮された Unicode データが含まれており、コンパイル時に UnicodeInformation.dll に含める必要があります。