
作者:yunjinqi
类别:教程
日期:2023-10-16 20:40:46 阅读:626 次 消耗积分:0 分
读写ORC文件 Apache ORC项目提供了一个标准的开源列式存储格式,用于数据分析系统。最初是为了在Apache...

作者:yunjinqi
类别:教程
日期:2023-10-16 20:34:29 阅读:588 次 消耗积分:0 分
Arrow C++提供了用于Arrow...

作者:yunjinqi
类别:教程
日期:2023-10-16 20:31:11 阅读:598 次 消耗积分:0 分
Arrow提供了一系列的C++接口,抽象了输入/输出操作的具体细节。它们操作无类型二进制数据流。这些抽象用于各种目的,如读取CSV或Parquet数据,传...

作者:yunjinqi
类别:教程
日期:2023-10-16 20:27:13 阅读:627 次 消耗积分:0 分
Gandiva是一个运行时表达式编译器,使用LLVM生成用于在Arrow记录批次上进行计算的高效本机代码。Gandiva仅处理投影和过滤操作;对于其他转换...

作者:yunjinqi
类别:教程
日期:2023-10-16 20:11:40 阅读:548 次 消耗积分:0 分
条件这些函数根据给定的条件选择两个输入之一(或不作选择)。(1) 此函数的行为类似于SQL中的"case...

作者:yunjinqi
类别:教程
日期:2023-10-16 09:28:31 阅读:561 次 消耗积分:0 分
计算函数通用计算 APIAPI...

作者:yunjinqi
类别:教程
日期:2023-10-15 20:50:11 阅读:643 次 消耗积分:0 分
虽然数组和分块数组代表同质值的一维序列,但数据通常呈现为异构数据的二维集合(如数据库表、CSV 文件等)。Arrow...

作者:yunjinqi
类别:教程
日期:2023-10-15 20:41:48 阅读:552 次 消耗积分:0 分
数据类型决定了如何解释物理数据。它们的规范允许不同的Arrow实现之间进行二进制互操作,包括不同的编程语言和运行时环境(例如,可以使用pyarrow.jv...

作者:yunjinqi
类别:教程
日期:2023-10-15 20:20:47 阅读:579 次 消耗积分:0 分
Arrow中的核心类型是arrow::Array类。数组代表具有相同类型的已知长度值的序列。在内部,这些值由一个或多个缓冲区表示,缓冲区的数量和含义取决于...

作者:yunjinqi
类别:教程
日期:2023-10-15 20:06:25 阅读:639 次 消耗积分:0 分
缓冲区 为了避免传递具有不同和不明显的生命周期规则的原始数据指针,Arrow提供了一个称为arrow::Buffer的通用抽象。缓冲区封装了指针和数据大小...
最新文章