Neo4j Runway es una biblioteca de Python que simplifica el proceso de migración de datos relacionales a un gráfico. Proporciona herramientas que abstraen la comunicación con OpenAI para ejecutar el descubrimiento de sus datos y generar un modelo de datos, así como herramientas para generar código de ingestión y cargar sus datos en una instancia de Neo4j.
Nuestro modelo de datos parece abordar los tres casos de uso que nos gustaría responder:
Si deseamos modificar el modelo de datos, podemos solicitar al LLM que realice cambios.
gdm . iterate_model ( corrections = "Create a Capital node from the capital property." )
gdm . current_model . visualize ()
Ahora podemos usar nuestro modelo de datos para generar algún código de ingestión.
gen = PyIngestConfigGenerator ( data_model = gdm . current_model ,
username = os . environ . get ( "NEO4J_USERNAME" ),
password = os . environ . get ( "NEO4J_PASSWORD" ),
uri = os . environ . get ( "NEO4J_URI" ),
database = os . environ . get ( "NEO4J_DATABASE" ),
file_directory = data_directory , source_name = "countries.csv" )
pyingest_yaml = gen . generate_config_string ()
Usaremos la configuración yaml de PyIngest generada para ingerir nuestros datos en nuestra instancia Neo4j.
PyIngest ( config = pyingest_yaml , verbose = False )
También podemos guardar esto como un archivo .yaml y usarlo con el PyIngest original.
gen . generate_config_yaml ( file_name = "countries.yaml" )
¡Aquí hay una instantánea de nuestro nuevo gráfico!
Runway ofrece un módulo para ejecutar análisis fácilmente sobre un gráfico existente para obtener información como encontrar nodos aislados y clasificar los grados de los nodos superiores.
Consulte aquí para ver un ejemplo del módulo GraphEDA
de Runway.
Runway se encuentra actualmente en versión beta y en rápido desarrollo. Plantee problemas de GitHub y proporcione comentarios sobre las funciones que desee. Las siguientes son algunas de las limitaciones actuales: