import pyarrow.parquet as pq

# 读取Parquet文件
table = pq.read_table('train-00000-of-00001-2ea3039ca4da89f8.parquet')

import pandas as pd

# 将Parquet数据转换为DataFrame
df = table.to_pandas()


# 将DataFrame转换为JSON格式
json_data = df.to_json(orient='records', lines=True)

# 将JSON数据写入文件
with open('data.json', 'w') as f:
    f.write(json_data)
GitHub 加速计划 / js / json
41.72 K
6.61 K
下载
适用于现代 C++ 的 JSON。
最近提交(Master分支:1 个月前 )
960b763e 3 个月前
8c391e04 6 个月前
Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐