Huggingface的parquet数据 转 json文件
json
适用于现代 C++ 的 JSON。
项目地址:https://gitcode.com/gh_mirrors/js/json
免费下载资源
·
import pyarrow.parquet as pq
# 读取Parquet文件
table = pq.read_table('train-00000-of-00001-2ea3039ca4da89f8.parquet')
import pandas as pd
# 将Parquet数据转换为DataFrame
df = table.to_pandas()
# 将DataFrame转换为JSON格式
json_data = df.to_json(orient='records', lines=True)
# 将JSON数据写入文件
with open('data.json', 'w') as f:
f.write(json_data)
GitHub 加速计划 / js / json
41.72 K
6.61 K
下载
适用于现代 C++ 的 JSON。
最近提交(Master分支:1 个月前 )
960b763e
3 个月前
8c391e04
6 个月前
更多推荐
已为社区贡献8条内容
所有评论(0)