作者:yunjinqi 类别:
日期:2023-10-17 19:39:15 阅读:495 次 消耗积分:0 分
线程管理 另请参阅线程管理 API 参考线程池 许多 Arrow C++ 操作会将工作分配到多个线程以充分利用底层硬件并行性。例如,当读取...
作者:yunjinqi 类别:
日期:2023-10-17 19:35:45 阅读:503 次 消耗积分:0 分
Arrow...
作者:yunjinqi 类别:
日期:2023-10-17 19:27:04 阅读:513 次 消耗积分:0 分
Arrow Flight是一种用于高效传输Flight数据的RPC框架,可通过网络进行数据传输。另请参阅Flight协议文档...
作者:yunjinqi 类别:
日期:2023-10-17 19:14:17 阅读:458 次 消耗积分:0 分
读写分区数据 到目前为止,我们一直在处理包含平坦目录和文件的数据集。很多情况下,数据集将具有一个或多个经常进行筛选的列。与其读取然后筛选数据,通过将文件组...
作者:yunjinqi 类别:
日期:2023-10-17 09:32:29 阅读:469 次 消耗积分:0 分
Tabular Datasets 另请参阅 数据集 API 参考警告arrow::dataset 命名空间是实验性的,尚未保证稳定 API。Arrow...
作者:yunjinqi 类别:
日期:2023-10-17 09:05:33 阅读:505 次 消耗积分:0 分
读取JSON文件 逐行分隔的JSON文件可以通过TableReader读取为一个完整的Arrow表,也可以通过StreamingReader流式传输为Re...
作者:yunjinqi 类别:
日期:2023-10-17 09:00:32 阅读:478 次 消耗积分:0 分
读取和写入CSV文件 Arrow提供了一个快速的CSV阅读器,允许摄取外部数据以创建Arrow表或Arrow RecordBatches的流。另请参见...
作者:yunjinqi 类别:
日期:2023-10-16 21:11:42 阅读:466 次 消耗积分:0 分
读写Parquet文件 另请参见 Parquet读取器和写入器API参考。Parquet格式是一种高效的复杂数据的列式存储格式。Parquet...
作者:yunjinqi 类别:
日期:2023-10-16 20:40:46 阅读:475 次 消耗积分:0 分
读写ORC文件 Apache ORC项目提供了一个标准的开源列式存储格式,用于数据分析系统。最初是为了在Apache...
作者:yunjinqi 类别:
日期:2023-10-16 20:34:29 阅读:445 次 消耗积分:0 分
Arrow C++提供了用于Arrow...