Web を頻繁に閲覧する人なら誰でも、HTML にはブラウザーが解析時に正しく表示できない予約文字がいくつかあることを目にしたことがあるはずです。このとき、文字エンティティを使用してそれらを置き換える必要があります。同時に、文字エンティティを使用して、キーボード上にないいくつかの記号を置き換えることもできます。
1. HTML 文字エンティティ
HTML 内の予約文字は文字エンティティに置き換える必要があります。キーボード上にない一部の文字も、文字エンティティを使用して置き換えることができます。
ブラウザは次の文字も空白として解釈します: スペース ( )、タブストップ (	)、ラインフィード (
)、キャリッジリターン (
)、および ( ) ;) 等々。したがって、空白スペースを表示したい場合は、代わりに HTML エンティティを使用する必要があります。
2. HTML エンティティ
HTML では、特定の文字が予約されています。
HTML では小なり記号 (<) と大なり記号 (>) を使用できません。ブラウザがタグと間違えてしまうためです。
予約文字を正しく表示したい場合は、HTML ソース コードで文字エンティティを使用する必要があります。文字エンティティは次のようになります。
&entity_name;または&#entity_number;
小なり記号を表示するには、次のように記述する必要があります。
数値の代わりにエンティティ名を使用する利点は、名前が覚えやすいことです。欠点は、ブラウザーがすべてのエンティティ名をサポートしていない可能性があることです (ただし、エンティティ番号のサポートは良好です)。
1. スペース文字
HTML には、異なる幅を持つ 5 種類のスペース エンティティ (スペース エンティティ) が用意されており、非改行スペース ( ) は通常のスペースの幅であり、すべての主要なブラウザで実行できます。他のいくつかのスペース (       ‌ ‍ ) はブラウザごとに幅が異なります。
それはノーブレイクスペースと呼ばれ、正式名称はノーブレイクスペースです。それは最も一般的なスペースであり、ほとんどの人がスペースを押すことによってのみ生成されるスペースです。鍵。 HTML では、スペースバーを使用してこのスペースを生成すると、スペースは蓄積されません (1 としてカウントされるだけです)。蓄積は、HTML エンティティ表現を使用することによってのみ実現できます。スペースの幅はフォントの影響を大きく受けます。
 
これは「半角スペース」と呼ばれ、正式名称は En スペースです。En はタイポグラフィの単位で、em の半分の幅です。定義上、これはフォント サイズの半分に相当します (例: 16 ピクセル フォントの 8 ピクセル)。名目上は小文字 n の幅です。このスペースは、スペース ファミリの一貫した特性を継承しています。つまり、このスペースは非常に安定した特性を持っています。つまり、占有する幅は中国語の幅のちょうど 1/2 であり、基本的にフォントの影響を受けません。
 
これは「全角スペース」と呼ばれ、正式名称は Em スペースです。 Em はタイポグラフィにおける測定単位で、現在指定されているポイント数に相当します。たとえば、16 ピクセルのフォントの 1 em は 16 ピクセルです。このスペースも、スペース ファミリの一貫した特性を継承しています。つまり、このスペースは非常に安定した特性を持っています。つまり、占有する幅は正確に 1 中国語の幅であり、基本的にフォントの影響を受けません。
 
それはナロースペースと呼ばれるもので、正式名称はThin Spaceです。これは「スキニースペース」と呼んでもいいかもしれません。これは、スペースが比較的薄く、本体が薄く、占有幅が比較的小さいことを意味します。幅は em の 6 分の 1 です。
‌
これは、ゼロ幅非ジョイナーと呼ばれ、正式名はゼロ幅非ジョイナー、または略して「ZWNJ」です。これは、電子テキストの 2 つの文字の間に配置され、代わりに発生する合字を抑制する非印刷文字です。では、これら 2 つの文字が使用され、文字は独自のグリフを使用して描画されます。 Unicode のゼロ幅の非結合文字は「」 (ゼロ幅の非結合文字、U+200C) にマップされ、HTML 文字値は次のように引用符で囲まれます。 ‌
‍
これは、ゼロ幅合字と呼ばれ、複雑な組版を必要とする特定の言語 (アラビア語など) で 2 つの文字の間に配置される非印刷文字です。およびヒンディー語)、通常はハイフンでつながれない 2 つの文字がハイフンでつながれた効果を生み出します。幅ゼロのハイフンの Unicode コード ポイントは U+200D (HTML:‍ ‍) です。
2. 非改行スペース
HTML で一般的な文字エンティティは、非改行スペース ( )です。
ブラウザは常に HTML ページ内のスペースを切り詰めます。テキストに 10 個のスペースを書き込むと、ブラウザはページを表示する前にそのうちの 9 個を削除します。ページ上のスペースの数を増やすには、 文字エンティティを使用する必要があります。
3. HTMLにおけるタブキーの表現
HTML 特殊文字には TAB は含まれません (TAB は 	 で表す必要があります。ただし、これは <PRE>...</PRE> などのタグ内でのみ機能し、それ以外の場所ではスペースとのみ同等です)。
表現をシミュレートしたい場合は、 this を使用できます。
などの 6 種類の空白の違い
HTML には、異なる幅を持つ 5 種類のスペース エンティティ (スペース エンティティ) が用意されており、非改行スペース ( ) は通常のスペースの幅であり、すべての主要なブラウザで実行できます。他のいくつかのスペース (      ‌‍) は、ブラウザごとに幅が異なります。
これはノーブレイク スペースと呼ばれ、正式名称はノーブレイク スペースです。これは最も一般的なスペースであり、ほとんどの人が最も頻繁に使用するスペースであり、 を押すことによって生成されるスペースです。スペースキー。 HTML では、スペースバーを使用してこのスペースを生成すると、スペースは蓄積されません (1 としてカウントされるだけです)。蓄積は、HTML エンティティ表現を使用することによってのみ実現できます。スペースの幅はフォントの影響を大きく受けます。
 
これは「半角スペース」と呼ばれ、正式名称は En スペースです。En はタイポグラフィの単位で、em の半分の幅です。定義上、これはフォント サイズの半分に相当します (例: 16 ピクセル フォントの 8 ピクセル)。名目上は小文字 n の幅です。このスペースは、スペース ファミリの一貫した特性を継承しています。つまり、このスペースは非常に安定した特性を持っています。つまり、占有する幅は中国語の幅のちょうど 1/2 であり、基本的にフォントの影響を受けません。
 
これは「全角スペース」と呼ばれ、正式名称は Em スペースです。 Em はタイポグラフィにおける測定単位で、現在指定されているポイント数に相当します。たとえば、16 ピクセルのフォントの 1 em は 16 ピクセルです。このスペースも、スペース ファミリの一貫した特性を継承しています。つまり、このスペースは非常に安定した特性を持っています。つまり、占有する幅は正確に 1 中国語の幅であり、基本的にフォントの影響を受けません。
 
それはナロースペースと呼ばれるもので、正式名称はThin Spaceです。これは「スキニースペース」と呼んでもいいかもしれません。これは、スペースが比較的薄く、本体が薄く、占有幅が比較的小さいことを意味します。幅は em の 6 分の 1 です。
‌
これは、ゼロ幅非ジョイナーと呼ばれ、正式名はゼロ幅非ジョイナー、または略して「ZWNJ」です。これは、電子テキストの 2 つの文字の間に配置され、代わりに発生する合字を抑制する非印刷文字です。では、これら 2 つの文字が使用され、文字は独自のグリフを使用して描画されます。 Unicode のゼロ幅の非結合文字は「」 (ゼロ幅の非結合文字、U+200C) にマップされ、HTML 文字値は次のように引用符で囲まれます。 ‌
‍
これは、ゼロ幅合字と呼ばれ、複雑な組版を必要とする特定の言語 (アラビア語など) で 2 つの文字の間に配置される非印刷文字です。およびヒンディー語)、通常はハイフンでつながれない 2 つの文字がハイフンでつながれた効果を生み出します。幅ゼロのハイフンの Unicode コード ポイントは U+200D (HTML: ‍ ‍) です。
さらに、ブラウザは次の文字を空白として解釈します: スペース ( )、タブストップ (	)、ラインフィード (
)、およびキャリッジリターン (
)。 ( ) などです。
4.発音記号を組み合わせる
発音記号は、文字に追加されるグリフです。
発音区別記号は、文字の上下、文字内、または 2 つの文字の間に表示できます。
発音区別符号は、アルファベットおよび数字と組み合わせて使用できます。
HTML の便利な文字エンティティ
注: エンティティ名では大文字と小文字が区別されます。