テスト | |
パッケージ | |
メタ |
pandas は、「リレーショナル」データまたは「ラベル付き」データの操作を簡単かつ直観的に行えるように設計された、高速かつ柔軟で表現力豊かなデータ構造を提供する Python パッケージです。これは、Python で実践的な現実世界のデータ分析を行うための基本的な高レベルの構成要素となることを目指しています。さらに、あらゆる言語で利用できる最も強力で柔軟なオープンソース データ分析/操作ツールになるという、より広範な目標もあります。すでにこの目標に向けて順調に進んでいます。
主な特長
どこで入手できますか
依存関係
ソースからのインストール
ライセンス
ドキュメント
背景
助けを求める
ディスカッションと開発
パンダに貢献する
ここでは、パンダが得意とすることのほんの一部を紹介します。
浮動小数点および非浮動小数点データの欠損データ( NaN
、 NA
、またはNaT
として表される) の簡単な処理
サイズの変更可能性: DataFrame および高次元オブジェクトに対して列を挿入および削除できます。
自動かつ明示的なデータ配置: オブジェクトを一連のラベルに明示的に配置することも、ユーザーが単純にラベルを無視して、 Series
やDataFrame
などに計算中に自動的にデータを配置させることもできます。
データの集約と変換の両方のために、データセットに対して分割、適用、結合操作を実行するための強力で柔軟なグループ化機能
他の Python および NumPy データ構造の不規則で異なるインデックスが付けられたデータを DataFrame オブジェクトに簡単に変換できるようにする
インテリジェントなラベルベースのスライシング、高度なインデックス作成、および大規模なデータセットのサブセット化
データセットの直感的なマージと結合
データセットの柔軟な再形成とピボット
軸の階層的なラベル付け (ティックごとに複数のラベルを付けることが可能)
フラット ファイル(CSV および区切り文字付き)、 Excel ファイル、データベースからのデータのロード、および超高速HDF5 形式からのデータの保存/ロードのための堅牢な IO ツール
時系列固有の機能: 日付範囲の生成と頻度の変換、移動ウィンドウ統計、日付のシフトと遅延
ソース コードは現在 GitHub でホストされています: https://github.com/pandas-dev/pandas
最新リリース バージョンのバイナリ インストーラーは、Python Package Index (PyPI) および Conda で入手できます。
# condaconda install -c conda-forge pandas
# または PyPIpip でパンダをインストールする
各リリース間のパンダへの変更点のリストは、ここにあります。詳細については、https://github.com/pandas-dev/pandas でコミット ログを参照してください。
NumPy - これらの配列を操作するための大規模な多次元配列、行列、および高レベルの数学関数のサポートを追加します。
python-dateutil - 標準の datetime モジュールに強力な拡張機能を提供します
pytz - Olson tz データベースを Python に取り込み、正確なクロスプラットフォームのタイムゾーン計算を可能にします
必須、推奨、およびオプションの依存関係のサポートされる最小バージョンについては、完全なインストール手順を参照してください。
ソースからパンダをインストールするには、上記の通常の依存関係に加えて Cython が必要です。 Cython は PyPI からインストールできます。
pip インストール cython
pandas
ディレクトリ (git リポジトリのクローン作成後にこのファイルを見つけたディレクトリと同じディレクトリ) で、次のコマンドを実行します。
pip インストール 。
または開発モードでインストールする場合:
python -m pip install -ve 。 --no-build-isolation -Ceditable-verbose=true
ソースからインストールするための完全な手順を参照してください。
BSD3
公式ドキュメントは PyData.org でホストされています。
pandas
に関する取り組みは 2008 年に AQR (クオンツ ヘッジファンド) で開始され、それ以来積極的に開発が行われています。
使用方法に関する質問については、StackOverflow を参照するのが最適です。さらに、一般的な質問やディスカッションも pydata メーリング リストで行うことができます。
開発に関するディスカッションのほとんどは、このリポジトリの GitHub 問題トラッカーを介して GitHub 上で行われます。
さらに、pandas-dev メーリング リストは専門的なディスカッションや設計の問題にも使用でき、Slack チャネルは開発関連の簡単な質問に利用できます。
また、コミュニティに公開されたプロジェクト管理者向けのコミュニティ ミーティングが頻繁に開催されるほか、新しいコントリビューターをサポートするために月に一度の新しいコントリビューター ミーティングも開催されます。
コミュニケーション チャネルに関する追加情報は、寄稿者コミュニティ ページでご覧いただけます。
すべての貢献、バグレポート、バグ修正、ドキュメントの改善、拡張機能、アイデアを歓迎します。
貢献方法の詳細な概要については、貢献ガイドを参照してください。
単に pandas コードベースの操作を開始したい場合は、GitHub の「問題」タブに移動して、興味深い問題を調べ始めてください。ドキュメントの下に多数の問題がリストされているので、最初に始めるのに適した問題があります。
また、バグ レポートを再現したり、バージョン番号や再現手順などの重要な情報を尋ねたりするなど、問題を優先順位付けすることもできます。問題の優先順位付けを開始したい場合、簡単に始める方法の 1 つは、CodeTriage でパンダをサブスクライブすることです。
あるいは、パンダを使用することで独自のアイデアを持ったり、ドキュメントで何かを探して「これは改善できる」と考えたりすることもあります...それについて何かを行うことができます。
メーリングリストやSlackでお気軽にご質問ください。
このプロジェクトの貢献者およびメンテナーとして、パンダの行動規範に従うことが期待されます。詳細については、「貢献者の行動規範」を参照してください。
トップに戻る