Variant

更新时间：2025-08-21

VARIANT 类型可以存储半结构化的 JSON 数据，允许存储包含不同数据类型（如整数、字符串、布尔值等）的复杂数据结构，而无需在表结构中预先定义具体的列。该类型特别适合处理复杂的嵌套结构，这些结构可能会随时发生变化。在写入过程中，VARIANT 类型能够自动推断列的结构和类型，动态合并写入的 schema，并通过将 JSON 键及其对应的值存储为列和动态子列。

使用限制

支持 CSV 和 JSON 格式。

CSV 格式导入

第 1 步：准备数据

创建名为 test_variant.csv 的 CSV 文件，内容如下：

SQL

114186154924|PushEvent|{"avatar_url":"https://avatars.githubusercontent.com/u/282080?","display_login":"brianchandotcom","gravatar_id":"","id":282080,"login":"brianchandotcom","url":"https://api.github.com/users/brianchandotcom"}|{"id":1920851,"name":"brianchandotcom/liferay-portal","url":"https://api.github.com/repos/brianchandotcom/liferay-portal"}|{"before":"abb58cc0db673a0bd5190000d2ff9c53bb51d04d","commits":[""],"distinct_size":4,"head":"91edd3c8c98c214155191feb852831ec535580ba","push_id":6027092734,"ref":"refs/heads/master","size":4}|1|2020-11-14 02:00:00

第 2 步：在库中创建表

执行以下 SQL 语句创建表：

SQL

1CREATE TABLE IF NOT EXISTS testdb.test_variant (
2    id BIGINT NOT NULL,
3    type VARCHAR(30) NULL,
4    actor VARIANT NULL,
5    repo VARIANT NULL,
6    payload VARIANT NULL,
7    public BOOLEAN NULL,
8    created_at DATETIME NULL,
9    INDEX idx_payload (`payload`) USING INVERTED PROPERTIES("parser" = "english") COMMENT 'inverted index for payload'
10)
11DUPLICATE KEY(`id`)
12DISTRIBUTED BY HASH(id) BUCKETS 10
13properties("replication_num" = "1");

第 3 步：导入数据

以 stream load 为例，使用以下命令导入数据：

SQL

1curl --location-trusted -u root:  -T test_variant.csv -H "column_separator:|" http://127.0.0.1:8030/api/testdb/test_variant/_stream_load

导入结果示例：

SQL

1{
2    "TxnId": 12,
3    "Label": "96cd6250-9c78-4a9f-b8b3-2b7cef0dd606",
4    "Comment": "",
5    "TwoPhaseCommit": "false",
6    "Status": "Success",
7    "Message": "OK",
8    "NumberTotalRows": 1,
9    "NumberLoadedRows": 1,
10    "NumberFilteredRows": 0,
11    "NumberUnselectedRows": 0,
12    "LoadBytes": 660,
13    "LoadTimeMs": 213,
14    "BeginTxnTimeMs": 0,
15    "StreamLoadPutTimeMs": 6,
16    "ReadDataTimeMs": 0,
17    "WriteDataTimeMs": 183,
18    "ReceiveDataTimeMs": 14,
19    "CommitAndPublishTimeMs": 20
20}

第 4 步：检查导入数据

使用以下 SQL 查询检查导入的数据：

SQL

1mysql> select * from testdb.test_variant\G
2*************************** 1. row ***************************
3        id: 14186154924
4      type: PushEvent
5     actor: {"avatar_url":"https://avatars.githubusercontent.com/u/282080?","display_login":"brianchandotcom","gravatar_id":"","id":282080,"login":"brianchandotcom","url":"https://api.github.com/users/brianchandotcom"}
6      repo: {"id":1920851,"name":"brianchandotcom/liferay-portal","url":"https://api.github.com/repos/brianchandotcom/liferay-portal"}
7   payload: {"before":"abb58cc0db673a0bd5190000d2ff9c53bb51d04d","commits":[""],"distinct_size":4,"head":"91edd3c8c98c214155191feb852831ec535580ba","push_id":6027092734,"ref":"refs/heads/master","size":4}
8    public: 1
9created_at: 2020-11-14 02:00:00

JSON 格式导入

第 1 步：准备数据

创建名为 test_variant.json 的 JSON 文件，内容如下：

SQL

1{"id": "14186154924","type": "PushEvent","actor": {"id": 282080,"login":"brianchandotcom","display_login": "brianchandotcom","gravatar_id": "","url": "https://api.github.com/users/brianchandotcom","avatar_url": "https://avatars.githubusercontent.com/u/282080?"},"repo": {"id": 1920851,"name": "brianchandotcom/liferay-portal","url": "https://api.github.com/repos/brianchandotcom/liferay-portal"},"payload": {"push_id": 6027092734,"size": 4,"distinct_size": 4,"ref": "refs/heads/master","head": "91edd3c8c98c214155191feb852831ec535580ba","before": "abb58cc0db673a0bd5190000d2ff9c53bb51d04d","commits": [""]},"public": true,"created_at": "2020-11-13T18:00:00Z"}

第 2 步：在库中创建表

执行以下 SQL 语句创建表：

SQL

1CREATE TABLE IF NOT EXISTS testdb.test_variant (
2    id BIGINT NOT NULL,
3    type VARCHAR(30) NULL,
4    actor VARIANT NULL,
5    repo VARIANT NULL,
6    payload VARIANT NULL,
7    public BOOLEAN NULL,
8    created_at DATETIME NULL,
9    INDEX idx_payload (`payload`) USING INVERTED PROPERTIES("parser" = "english") COMMENT 'inverted index for payload'
10)
11DUPLICATE KEY(`id`)
12DISTRIBUTED BY HASH(id) BUCKETS 10;

第 3 步：导入数据

以 stream load 为例，使用以下命令导入数据：

SQL

1curl --location-trusted -u root:  -T test_variant.json -H "format:json"  http://127.0.0.1:8030/api/testdb/test_variant/_stream_load

导入结果示例：

SQL

1{
2    "TxnId": 12,
3    "Label": "96cd6250-9c78-4a9f-b8b3-2b7cef0dd606",
4    "Comment": "",
5    "TwoPhaseCommit": "false",
6    "Status": "Success",
7    "Message": "OK",
8    "NumberTotalRows": 1,
9    "NumberLoadedRows": 1,
10    "NumberFilteredRows": 0,
11    "NumberUnselectedRows": 0,
12    "LoadBytes": 660,
13    "LoadTimeMs": 213,
14    "BeginTxnTimeMs": 0,
15    "StreamLoadPutTimeMs": 6,
16    "ReadDataTimeMs": 0,
17    "WriteDataTimeMs": 183,
18    "ReceiveDataTimeMs": 14,
19    "CommitAndPublishTimeMs": 20
20}

第 4 步：检查导入数据

使用以下 SQL 查询检查导入的数据：

SQL

1mysql> select * from testdb.test_variant\G
2*************************** 1. row ***************************
3        id: 14186154924
4      type: PushEvent
5     actor: {"avatar_url":"https://avatars.githubusercontent.com/u/282080?","display_login":"brianchandotcom","gravatar_id":"","id":282080,"login":"brianchandotcom","url":"https://api.github.com/users/brianchandotcom"}
6      repo: {"id":1920851,"name":"brianchandotcom/liferay-portal","url":"https://api.github.com/repos/brianchandotcom/liferay-portal"}
7   payload: {"before":"abb58cc0db673a0bd5190000d2ff9c53bb51d04d","commits":[""],"distinct_size":4,"head":"91edd3c8c98c214155191feb852831ec535580ba","push_id":6027092734,"ref":"refs/heads/master","size":4}
8    public: 1
9created_at: 2020-11-14 02:00:00

MAP

JSON

数据仓库 PALO

数据仓库 PALO

Variant

使用限制

CSV 格式导入

第 1 步：准备数据

第 2 步：在库中创建表

第 3 步：导入数据

第 4 步：检查导入数据

JSON 格式导入

第 1 步：准备数据

第 2 步：在库中创建表

第 3 步：导入数据

第 4 步：检查导入数据