Pythonのisna()とisnull()の違いは何ですか

著者：Eve Cole 更新時間：2024-12-22 12:12:01

Downcodes のエディターでは、Python データ処理ライブラリ pandas で欠損値を検出するために使用される 2 つの関数、isna() と isnull() を理解することができます。これら 2 つの関数の機能はまったく同じで、どちらも元のデータと同じ形状のブールオブジェクトを返します。これは、データ内の各要素が欠損値であるかどうかを示すために使用されます。これらは、さまざまなプログラミング言語 (R 言語など) のイディオムと互換性を持ち、ユーザーがデータ分析ツールを切り替えるのを容易にするために存在します。この記事では、コード例とアプリケーションシナリオの説明を通じて、これら 2 つの関数の使用シナリオ、共通点、構文、選択の提案について詳しく説明し、これら 2 つの重要な pandas 関数をよりよく理解して使用し、データ処理効率を向上させるのに役立ちます。

Python のデータ処理ライブラリ pandas では、isna() と isnull() はどちらも欠損値を検出するために使用される関数です。これら 2 つの関数は機能的には同じで、どちらも元のデータと同じ形状のブールオブジェクトを返し、データ内の各要素が欠損値であるかどうかを示します。ただし、機能は同じであるにもかかわらず、名前の異なる 2 つの関数を提供することは、panda を他の言語 (R 言語など) のイディオムと整合性を持たせ、それによってユーザーが異なるデータ分析言語を切り替える学習コストを削減するためです。

具体的には、isnull() 関数は pandas が元々持っていた関数ですが、isna() は R 言語の命名規則に合わせて後から導入された関数です。したがって、使用習慣の観点からは、さまざまなユーザーがそれぞれの背景設定に基づいて、これら 2 つの機能のいずれかを使用することを選択する可能性があります。

1. ISNA() と ISNULL() の使用シナリオ

isna() と isnull() の間に機能的な違いはありませんが、それらの使用シナリオを理解することは、データ分析をより効果的に実行するのに役立ちます。日常のデータ処理では、多くの場合、欠損値を検出して処理し、どのデータが欠落しているかを効果的に特定する必要があります。これは、その後のデータのクリーニングと分析にとって非常に重要です。

2. ISNA() と ISNULL() の共通点

まず、両方の関数を pandas ライブラリの DataFrame オブジェクトと Series オブジェクトに適用できます。データセット全体を操作するか、データセット内の特定の列を操作するかに関係なく、ブールオブジェクトを返すことができます。True は欠損値 (NaN、None など) を表し、False は欠損していない値を表します。

例えば：

パンダをPDとしてインポート

numpyをnpとしてインポート

df = pd.DataFrame({'A': [1, np.nan, 3], 'B': [4, 5, np.nan]})

print(df.isnull())

print(df.isna())

上記のコードは 2 つの同一のブールデータフレームを出力し、元のデータの各位置に欠損値があるかどうかを示します。

3. ISNA() と ISNULL() の構文の比較

isna() と isnull() は同じことを行いますが、どちらも (呼び出し先のオブジェクト以外の) 引数を受け入れないという点で構文的に一貫しています。このことから、両者の使いやすさに差はないことがわかります。

4. ISNA() または ISNULL() を選択します。

実際の使用において、isna() または isnull() の選択は主に個人的な好みとプロジェクトチームの従来のルールによって決まります。チーム内または特定のプロジェクトでこれらのメソッドのいずれかの使用をすでに開始している場合は、コードの一貫性を維持するために、引き続き使用することをお勧めします。

5. 応用シナリオ例

データのクリーニングと前処理の段階では、欠損値を特定して処理することが非常に重要なステップです。たとえば、isna() または isnull() を使用して欠損値を含むすべての行をフィルターで除外し、データ分析のニーズに基づいてこれらの行を削除するか欠損値を埋めるかを決定できます。さらに、統計分析や機械学習モデルのトレーニングを実行する前に、欠損値を処理することも、データ品質を向上させ、分析結果の精度を確保するための重要なステップです。

6. まとめ

pandas の isna() と isnull() の関数はまったく同じで、どちらもデータ内の欠損値を検出するために使用されます。 2 つの機能は、主にさまざまなユーザーの使用習慣を考慮して提供されています。実際のアプリケーションでは、個人またはチームの好みに基づいていずれかを選択できます。これら 2 つの機能をマスターすると、データ分析およびデータサイエンス分野の基本スキルの 1 つであるデータ処理において、より柔軟に欠損値を特定して処理できるようになります。