팬더 gpt
1.0.0
pandas-gpt
ChatGPT로 데이터 과학 워크플로를 강화하세요.
pandas-gpt
는 ChatGPT 프롬프트를 사용하여 pandas DataFrame으로 거의 모든 작업을 수행하기 위한 Python 라이브러리입니다.
pip install pandas-gpt
OPENAI_API_KEY
환경 변수를 OpenAI API 키로 설정하거나 다음 코드 조각을 사용하십시오.
import openai
openai . api_key = ''
이 Google Colab 노트북 에서 설정 및 사용 예시를 확인할 수 있습니다.
import pandas as pd
import pandas_gpt
df = pd . DataFrame ( 'https://gist.githubusercontent.com/bluecoconut/9ce2135aafb5c6ab2dc1d60ac595646e/raw/c93c3500a1f7fae469cba716f09358cfddea6343/sales_demo_with_pii_and_all_states.csv' )
# Data transformation
df = df . ask ( 'drop purchases from Laurenchester, NY' )
df = df . ask ( 'add a new Category column with values "cheap", "regular", or "expensive"' )
# Queries
weekday = df . ask ( 'which day of the week had the largest number of orders?' )
top_10 = df . ask ( 'what are the top 10 most popular products, as a table' )
# Plotting
df . ask ( 'plot monthly and hourly sales' )
top_10 . ask ( 'horizontal bar plot with pastel colors' )
# Allow changes to original dataset
df . ask ( 'do something interesting' , mutable = True )
# Show source code before running
df . ask ( 'convert prices from USD to GBP' , verbose = True )
Azure OpenAI 서비스와 같은 다른 API 호스트를 사용하려는 경우:
import openai
openai . api_type = 'azure'
openai . api_base = ''
openai . api_version = ''
openai . api_key = ''
import pandas_gpt
# pandas_gpt.model = '' # Default is 'gpt-3.5-turbo'
pandas_gpt . completion_config = {
'engine' : '' ,
# 'deployment_id': '',
}
ChatGPT의 제한 사항은 이 라이브러리에도 적용됩니다. Google Colab, Kaggle 또는 GitPod와 같은 샌드박스 환경에서는 pandas-gpt
사용하는 것이 좋습니다.