테스트 | |
패키지 | |
메타 |
pandas 는 "관계형" 또는 "레이블이 지정된" 데이터 작업을 쉽고 직관적으로 만들 수 있도록 설계된 빠르고 유연하며 표현력이 풍부한 데이터 구조를 제공하는 Python 패키지입니다. Python에서 실용적이고 실제적인 데이터 분석을 수행하기 위한 기본적이고 높은 수준의 빌딩 블록이 되는 것을 목표로 합니다. 또한 모든 언어에서 사용할 수 있는 가장 강력하고 유연한 오픈 소스 데이터 분석/조작 도구가 되겠다는 더 넓은 목표를 가지고 있습니다. 이미 이 목표를 향해 잘 나아가고 있습니다.
주요 특징
어디서 구할 수 있나요?
종속성
소스에서 설치
특허
선적 서류 비치
배경
도움 받기
토론 및 개발
팬더에 기여
Pandas가 잘하는 일 중 몇 가지는 다음과 같습니다.
부동 소수점 및 비부동 소수점 데이터에서 누락된 데이터 ( NaN
, NA
또는 NaT
로 표시)를 쉽게 처리
크기 가변성: DataFrame 및 더 높은 차원의 개체에서 열을 삽입하고 삭제할 수 있습니다.
자동 및 명시적 데이터 정렬 : 객체는 레이블 집합에 명시적으로 정렬될 수 있습니다. 또는 사용자는 단순히 레이블을 무시하고 Series
, DataFrame
등이 자동으로 계산에서 데이터를 정렬하도록 할 수 있습니다.
데이터 집계 및 변환을 위해 데이터 세트에 대한 분할-적용-결합 작업을 수행하는 강력하고 유연한 기능별 그룹화
다른 Python 및 NumPy 데이터 구조의 불규칙하고 다르게 색인화된 데이터를 DataFrame 객체로 쉽게 변환 할 수 있습니다.
지능형 레이블 기반 슬라이싱 , 멋진 인덱싱 및 대규모 데이터 세트의 하위 설정
직관적인 데이터 세트 병합 및 결합
데이터 세트의 유연한 재구성 및 피버팅
축의 계층적 레이블 지정(틱당 여러 레이블을 가질 수 있음)
플랫 파일 (CSV 및 구분된 파일), Excel 파일 , 데이터베이스 에서 데이터를 로드하고 초고속 HDF5 형식 에서 데이터를 저장/로드하기 위한 강력한 IO 도구
시계열 별 기능: 날짜 범위 생성 및 빈도 변환, 이동 창 통계, 날짜 이동 및 지연
소스 코드는 현재 GitHub(https://github.com/pandas-dev/pandas)에서 호스팅됩니다.
최신 릴리스 버전의 바이너리 설치 프로그램은 Python Package Index(PyPI) 및 Conda에서 사용할 수 있습니다.
# condaconda install -c conda-forge pandas
# 또는 PyPipip 설치 팬더
각 릴리스 간의 팬더 변경 사항 목록은 여기에서 확인할 수 있습니다. 자세한 내용은 https://github.com/pandas-dev/pandas에서 커밋 로그를 참조하세요.
NumPy - 대규모 다차원 배열, 행렬 및 이러한 배열에서 작동하는 고급 수학 함수에 대한 지원을 추가합니다.
python-dateutil - 표준 datetime 모듈에 대한 강력한 확장을 제공합니다.
pytz - Olson tz 데이터베이스를 Python으로 가져오므로 정확한 플랫폼 간 시간대 계산이 가능합니다.
필수, 권장 및 선택적 종속성의 최소 지원 버전에 대해서는 전체 설치 지침을 참조하세요.
소스에서 팬더를 설치하려면 위의 일반적인 종속성 외에 Cython이 필요합니다. Cython은 PyPI에서 설치할 수 있습니다.
pip 설치 사이썬
pandas
디렉터리(git repo를 복제한 후 이 파일을 찾은 디렉터리와 동일)에서 다음을 실행합니다.
핍 설치 .
또는 개발 모드로 설치하는 경우:
python -m pip 설치 -ve . --no-build-isolation -Ceditable-verbose=true
소스에서 설치하는 방법에 대한 전체 지침을 참조하세요.
BSD 3
공식 문서는 PyData.org에서 호스팅됩니다.
pandas
에 대한 작업은 2008년 AQR(양적 헤지펀드)에서 시작되어 그 이후 활발하게 개발되고 있습니다.
사용법에 대한 질문이 있는 경우 가장 좋은 곳은 StackOverflow입니다. 또한 pydata 메일링 리스트에서는 일반적인 질문과 토론도 이루어질 수 있습니다.
대부분의 개발 토론은 GitHub 문제 추적기를 통해 이 리포지토리의 GitHub에서 진행됩니다.
또한 pandas-dev 메일링 리스트는 전문적인 토론이나 디자인 문제에 사용할 수도 있으며 Slack 채널을 통해 개발 관련 질문을 빠르게 처리할 수 있습니다.
또한 프로젝트 유지관리자를 위한 커뮤니티 회의가 커뮤니티에 자주 열려 있으며, 새로운 기여자를 지원하는 데 도움이 되는 월간 신규 기여자 회의도 있습니다.
커뮤니케이션 채널에 대한 추가 정보는 기여자 커뮤니티 페이지에서 확인할 수 있습니다.
모든 기여, 버그 보고서, 버그 수정, 문서 개선, 개선 및 아이디어를 환영합니다.
기여 방법에 대한 자세한 개요는 기여 가이드 에서 확인할 수 있습니다.
단순히 Pandas 코드베이스 작업을 시작하려는 경우 GitHub "문제" 탭으로 이동하여 흥미로운 문제를 살펴보세요. Docs 아래에는 여러 가지 문제가 나열되어 있으며 시작할 수 있는 좋은 첫 번째 문제가 있습니다.
또한 버그 보고서 재생산, 버전 번호나 재생산 지침과 같은 중요한 정보 요청 등의 문제를 분류할 수도 있습니다. 문제 분류를 시작하려는 경우 쉽게 시작하는 방법 중 하나는 CodeTriage에서 Pandas를 구독하는 것입니다.
아니면 팬더를 사용하여 자신만의 아이디어를 갖게 되거나 문서에서 뭔가를 찾고 '이것은 개선될 수 있다'고 생각하고 있을 수도 있습니다...당신은 그것에 대해 뭔가를 할 수 있습니다!
메일링 리스트나 Slack에 자유롭게 질문하세요.
이 프로젝트의 기여자 및 유지관리자로서 귀하는 Pandas의 행동 강령을 준수해야 합니다. 자세한 내용은 기여자 행동 강령에서 확인할 수 있습니다.
맨 위로 이동