作者:yunjinqi   类别:    日期:2023-10-17 19:39:15   阅读:495 次   消耗积分:0 分
线程管理 另请参阅线程管理 API 参考线程池 许多 Arrow C++ 操作会将工作分配到多个线程以充分利用底层硬件并行性。例如,当读取...
作者:yunjinqi   类别:    日期:2023-10-17 19:35:45   阅读:503 次   消耗积分:0 分
Arrow...
作者:yunjinqi   类别:    日期:2023-10-17 19:27:04   阅读:513 次   消耗积分:0 分
Arrow Flight是一种用于高效传输Flight数据的RPC框架,可通过网络进行数据传输。另请参阅Flight协议文档...
作者:yunjinqi   类别:    日期:2023-10-17 19:14:17   阅读:458 次   消耗积分:0 分
读写分区数据 到目前为止,我们一直在处理包含平坦目录和文件的数据集。很多情况下,数据集将具有一个或多个经常进行筛选的列。与其读取然后筛选数据,通过将文件组...
作者:yunjinqi   类别:    日期:2023-10-17 09:32:29   阅读:469 次   消耗积分:0 分
Tabular Datasets 另请参阅 数据集 API 参考警告arrow::dataset 命名空间是实验性的,尚未保证稳定 API。Arrow...
作者:yunjinqi   类别:    日期:2023-10-17 09:05:33   阅读:505 次   消耗积分:0 分
读取JSON文件 逐行分隔的JSON文件可以通过TableReader读取为一个完整的Arrow表,也可以通过StreamingReader流式传输为Re...
作者:yunjinqi   类别:    日期:2023-10-17 09:00:32   阅读:478 次   消耗积分:0 分
读取和写入CSV文件 Arrow提供了一个快速的CSV阅读器,允许摄取外部数据以创建Arrow表或Arrow RecordBatches的流。另请参见...
作者:yunjinqi   类别:    日期:2023-10-16 21:11:42   阅读:466 次   消耗积分:0 分
读写Parquet文件 另请参见 Parquet读取器和写入器API参考。Parquet格式是一种高效的复杂数据的列式存储格式。Parquet...
作者:yunjinqi   类别:    日期:2023-10-16 20:40:46   阅读:475 次   消耗积分:0 分
读写ORC文件 Apache ORC项目提供了一个标准的开源列式存储格式,用于数据分析系统。最初是为了在Apache...
作者:yunjinqi   类别:    日期:2023-10-16 20:34:29   阅读:445 次   消耗积分:0 分
Arrow C++提供了用于Arrow...
上一页   1   2   3   4   5   6   7   8   9   10   11   12   13   14   15   16   17   18   19   20   21   22   23   24   25   26   27   28   29   30   31   32   33   34   35   36   37   38   39   40   下一页