ask your database

Kueri database Anda dengan GPT

Alat CLI yang memungkinkan Anda mengajukan pertanyaan GPT tentang database Postgres apa pun. Cukup berikan detail koneksi Anda, dan tanyakan-database Anda secara otomatis memuat skema, dapatkan contoh data, dan jalankan kueri untuk Anda. Ini berfungsi paling baik dengan GPT-4.

Catatan: Ini akan langsung menjalankan query yang disediakan oleh GPT pada database yang Anda berikan. Kecuali koneksi tersebut bersifat read-only, artinya koneksi tersebut mungkin menghapus atau memperbarui data secara tidak sengaja. Harap gunakan dengan hati-hati dan selalu simpan cadangan data Anda.

Penggunaan

Pertama, buat file konfigurasi JSON:

{
  "openAIAPIKey" : " xxx " ,
  "openAIModel" : " gpt-4 " ,
  "dbTimeoutMs" : 20000 ,
  "apiTimeoutMs" : 30000 ,
  "postgresConnection" : {
    "host" : " localhost " ,
    "port" : 5432 ,
    "database" : " imdb " ,
    "user" : " imdb " ,
    "password" : " 1234 "
  }
}

Kemudian, panggil ini dengan file konfigurasi seperti:

npx ask-your-database myConfig.json

Apa fungsinya

Contoh ini menggunakan contoh database postgres IMDB dari RyanMarcus/imdb_pg_dataset. Anda dapat memuatnya dengan mengunduh arsip ini dan menggunakan pg_restore --database=db_name --user=user imdb_pg11 .

Pertama, ini akan memberi tahu Anda sedikit tentang database Anda, dan menanyakan pertanyaan awal:

 > npx [email protected] imdbConfig.json

You are connected to the database imdb. It has the following tables:

aka_name, aka_title, cast_info, char_name, comp_cast_type, company_name, company_type,
complete_cast, info_type, keyword, kind_type, link_type, movie_companies, movie_info,
movie_info_idx, movie_keyword, movie_link, name, person_info, role_type, title

? Ask me a question about this database, and I'll try to answer! (q to quit)

Kemudian Anda bisa mengajukan pertanyaan, misalnya:

 > What movies did Keanu Reeves act in?

Jika responsnya menyertakan kueri SQL, alat ini akan menjalankannya secara otomatis untuk Anda dan menampilkan hasilnya:

 To answer your question, we'll need to join the 'name' table to find Keanu Reeves' person_id,
and then join the 'cast_info' table to get the movie_ids in which Keanu Reeves appeared as an
actor, and finally join the 'title' table to get the titles of those movies.

Please run the following query:

SELECT title.title
FROM name
JOIN cast_info ON name.id = cast_info.person_id
JOIN title ON cast_info.movie_id = title.id
JOIN role_type ON cast_info.role_id = role_type.id
WHERE name.name ILIKE 'Reeves, Keanu' AND role_type.role = 'actor';

Returned 253 rows. Here are the first 101 rows:
┌─────────┬────────────────────────────────────────────────────────────────────────────┐
│ (index) │                                   title                                    │
├─────────┼────────────────────────────────────────────────────────────────────────────┤
│    0    │                        '101 Biggest Celebrity Oops'                        │
│    1    │                          '1992 MTV Movie Awards'                           │
│    2    │                          '1993 MTV Movie Awards'                           │
│    3    │                          '1995 MTV Movie Awards'                           │
│    4    │                          '1999 MTV Movie Awards'                           │
│    5    │                  '2000 Blockbuster Entertainment Awards'                   │
│    6    │                          '2003 MTV Movie Awards'                           │
│    7    │                      '2004 Taurus World Stunt Awards'                      │
│    8    │                          '2006 MTV Movie Awards'                           │
│    9    │                                 '47 Ronin'                                 │
│   10    │                              "A Man's Story"                               │
│   11    │                             'A Scanner Darkly'                             │

... some results truncated

Saat Anda mengirimkan respons ke GPT, hasilnya akan disertakan:

 > This is great, but it includes things that aren't movies. Can you filter to only
movies, and also sort to show the most recent first?

Dengan menggunakan hasil baru dan konteks sebelumnya, GPT akan menjalankan lebih banyak kueri dan meningkatkan hasilnya:

 To filter only movies and sort them by the most recent first, we need to join the 'kind_type'
table to get the movie kind and filter by 'movie', and order the result by 'production_year'
in descending order. Please run the following query:

SELECT title.title, title.production_year
FROM name
JOIN cast_info ON name.id = cast_info.person_id
JOIN title ON cast_info.movie_id = title.id
JOIN role_type ON cast_info.role_id = role_type.id
JOIN kind_type ON title.kind_id = kind_type.id
WHERE name.name ILIKE 'Reeves, Keanu' AND role_type.role = 'actor' AND kind_type.kind = 'movie'
ORDER BY title.production_year DESC;

Returned 64 rows. Here are the first 51 rows:
┌─────────┬─────────────────────────────────────┬─────────────────┐
│ (index) │                title                │ production_year │
├─────────┼─────────────────────────────────────┼─────────────────┤
│    0    │             'John Wick'             │      null       │
│    1    │            'Passengers'             │      null       │
│    2    │              'Jekyll'               │      null       │
│    3    │              'Jekyll'               │      null       │
│    4    │          'Man of Tai Chi'           │      2013       │
│    5    │             '47 Ronin'              │      2013       │
│    6    │           'Side by Side'            │      2012       │
│    7    │         'Generation Um...'          │      2012       │
│    8    │           'Sunset Strip'            │      2012       │

... some results truncated

(Contoh kumpulan data kami hanya mencakup data hingga tahun 2013)

Kemudian, Anda dapat terus menyempurnakan hasilnya:

 > This is great, but can you omit the ones with null production_year?

Tanggapannya:

 To omit the ones with null production_year, add a condition in the WHERE clause. Please run the
following query:

SELECT title.title, title.production_year
FROM name
JOIN cast_info ON name.id = cast_info.person_id
JOIN title ON cast_info.movie_id = title.id
JOIN role_type ON cast_info.role_id = role_type.id
JOIN kind_type ON title.kind_id = kind_type.id
WHERE name.name ILIKE 'Reeves, Keanu' AND role_type.role = 'actor' AND kind_type.kind = 'movie' AND title.production_year IS NOT NULL
ORDER BY title.production_year DESC;

Returned 60 rows. Here are the first 51 rows:
┌─────────┬─────────────────────────────────────┬─────────────────┐
│ (index) │ title │ production_year │
├─────────┼─────────────────────────────────────┼─────────────────┤
│ 0 │ '47 Ronin' │ 2013 │
│ 1 │ 'Man of Tai Chi' │ 2013 │
│ 2 │ 'Sunset Strip' │ 2012 │
│ 3 │ 'Side by Side' │ 2012 │
│ 4 │ 'Generation Um...' │ 2012 │
│ 5 │ "A Man's Story" │ 2010 │
│ 6 │ "Henry's Crime" │ 2010 │
│ 7 │ 'The Private Lives of Pippa Lee' │ 2009 │
│ 8 │ 'Street Kings' │ 2008 │
│ 9 │ 'The Day the Earth Stood Still' │ 2008 │

... some results truncated

Dan sebagainya!

Mendekati

Ini menggabungkan beberapa hal sederhana menjadi satu:

Pertama, ia menanyakan database untuk semua tabel. Untuk setiap tabel, ia mendapatkan semua kolom, tipenya, dan satu contoh hasil. Semua ini disediakan sebagai awal dari prompt.
Skema dan pertanyaan Anda dikirim ke GPT.
Setiap pertanyaan yang dikembalikan sebagai bagian dari respons akan dieksekusi secara otomatis, dan hasilnya akan dicetak kepada Anda.
Saat Anda mengirimkan pertanyaan lanjutan, hasilnya otomatis dikirim sehingga GPT dapat menggunakannya sebagai konteks untuk respons berikut.

Pembangunan lokal

Menggunakan pnpm atau manajer paket Node pilihan Anda:

pnpm install
pnpm start yourConfig.json

Penafian tambahan

Perhatikan bahwa skema database Anda dan data apa pun yang ditanyakan oleh GPT akan dikirim ke OpenAI untuk diproses di cloud. Berhati-hatilah tergantung pada data Anda.

Memperluas