Функции объединения данных JSON
v0.43.0 2024-11-13
Примечание. Это не официальный выпуск Apache Software Foundation, см. datafusion-contrib/datafusion-functions-json#5.
Этот набор предоставляет набор функций для запроса строк JSON в DataFusion. Функции реализованы как скалярные функции, которые можно использовать в запросах SQL.
Чтобы использовать эти функции, вам просто нужно вызвать:
datafusion_functions_json :: register_all ( & mut ctx ) ? ;
Чтобы зарегистрировать приведенные ниже функции JSON в вашем SessionContext
.
-- Create a table with a JSON column stored as a string
CREATE TABLE test_table (id INT , json_col VARCHAR ) AS VALUES
( 1 , ' {} ' ),
( 2 , ' { "a": 1 } ' ),
( 3 , ' { "a": 2 } ' ),
( 4 , ' { "a": 1, "b": 2 } ' ),
( 5 , ' { "a": 1, "b": 2, "c": 3 } ' );
-- Check if each document contains the key 'b'
SELECT id, json_contains(json_col, ' b ' ) as json_contains FROM test_table;
-- Results in
-- +----+---------------+
-- | id | json_contains |
-- +----+---------------+
-- | 1 | false |
-- | 2 | false |
-- | 3 | false |
-- | 4 | true |
-- | 5 | true |
-- +----+---------------+
-- Get the value of the key 'a' from each document
SELECT id, json_col - > ' a ' as json_col_a FROM test_table
-- +----+------------+
-- | id | json_col_a |
-- +----+------------+
-- | 1 | {null=} |
-- | 2 | {int=1} |
-- | 3 | {int=2} |
-- | 4 | {int=1} |
-- | 5 | {int=1} |
-- +----+------------+
json_contains(json: str, *keys: str | int) -> bool
— true, если строка JSON имеет определенный ключ (используется для оператора ?
) json_get(json: str, *keys: str | int) -> JsonUnion
— получить значение из строки JSON по ее «пути» json_get_str(json: str, *keys: str | int) -> str
— Получить строковое значение из строки JSON по ее «пути» json_get_int(json: str, *keys: str | int) -> int
— получить целочисленное значение из строки JSON по его «пути» json_get_float(json: str, *keys: str | int) -> float
— получить значение с плавающей запятой из строки JSON по ее «пути» json_get_bool(json: str, *keys: str | int) -> bool
— получить логическое значение из строки JSON по ее «пути» json_get_json(json: str, *keys: str | int) -> str
— Получить вложенную необработанную строку JSON из строки JSON по ее «пути» json_as_text(json: str, *keys: str | int) -> str
— Получить любое значение из строки JSON по ее «пути», представленному в виде строки (используется для оператора ->>
) json_length(json: str, *keys: str | int) -> int
— получить длину строки или массива JSON ->
оператор — псевдоним для json_get
->>
> — псевдоним для json_as_text
?
оператор — псевдоним для json_contains
Выражения приведения с помощью json_get
перезаписываются в соответствующий метод, например
select * from foo where json_get(attributes, ' bar ' )::string = ' ham '
Будет переписано на:
select * from foo where json_get_str(attributes, ' bar ' ) = ' ham '
json_keys(json: str, *keys: str | int) -> list[str]
— получить ключи строки JSON json_is_obj(json: str, *keys: str | int) -> bool
— true, если JSON является объектом json_is_array(json: str, *keys: str | int) -> bool
— true, если JSON является массивом json_valid(json: str) -> bool
— true, если JSON действителен