作者:yunjinqi   类别:    日期:2023-10-16 20:31:11   阅读:129 次   消耗积分:0 分
Arrow提供了一系列的C++接口,抽象了输入/输出操作的具体细节。它们操作无类型二进制数据流。这些抽象用于各种目的,如读取CSV或Parquet数据,传输IPC流等。另请参见输入/输...
作者:yunjinqi   类别:    日期:2023-10-16 20:27:13   阅读:121 次   消耗积分:0 分
Gandiva是一个运行时表达式编译器,使用LLVM生成用于在Arrow记录批次上进行计算的高效本机代码。Gandiva仅处理投影和过滤操作;对于其他转换,请参见Compute Functions(计算...
作者:yunjinqi   类别:    日期:2023-10-16 20:11:40   阅读:117 次   消耗积分:0 分
条件这些函数根据给定的条件选择两个输入之一(或不作选择)。(1) 此函数的行为类似于SQL中的"case when"语句或开关-情况。输入是一个"条件"值,它是一个包含布尔值的结构,...
作者:yunjinqi   类别:    日期:2023-10-16 09:28:31   阅读:114 次   消耗积分:0 分
计算函数通用计算 APIAPI 函数和函数注册表 函数表示对可能具有不同类型的输入进行计算操作。在内部,一个函数由一个或多个“核”实现,具体取决于具体的输入类型(例如,一...
作者:yunjinqi   类别:    日期:2023-10-15 20:50:11   阅读:113 次   消耗积分:0 分
虽然数组和分块数组代表同质值的一维序列,但数据通常呈现为异构数据的二维集合(如数据库表、CSV 文件等)。Arrow 提供了几种抽象,以便方便且高效地处理此类数据。字段 字...
作者:yunjinqi   类别:    日期:2023-10-15 20:41:48   阅读:113 次   消耗积分:0 分
数据类型决定了如何解释物理数据。它们的规范允许不同的Arrow实现之间进行二进制互操作,包括不同的编程语言和运行时环境(例如,可以使用pyarrow.jvm桥接模块从Python和Jav...
作者:yunjinqi   类别:    日期:2023-10-15 20:20:47   阅读:124 次   消耗积分:0 分
Arrow中的核心类型是arrow::Array类。数组代表具有相同类型的已知长度值的序列。在内部,这些值由一个或多个缓冲区表示,缓冲区的数量和含义取决于数组的数据类型,如Arrow数...
作者:yunjinqi   类别:    日期:2023-10-15 20:06:25   阅读:121 次   消耗积分:0 分
缓冲区 为了避免传递具有不同和不明显的生命周期规则的原始数据指针,Arrow提供了一个称为arrow::Buffer的通用抽象。缓冲区封装了指针和数据大小,并通常将其生命周期与底层...
作者:yunjinqi   类别:    日期:2023-10-15 19:43:05   阅读:127 次   消耗积分:0 分
Arrow C++库由不同的部分组成,每个部分都具有特定的目的。物理层 内存管理抽象提供了对内存的统一API,这些内存可以通过各种方式分配,如堆分配、文件的内存映射或静态内存...
作者:yunjinqi   类别:    日期:2023-10-15 16:33:09   阅读:122 次   消耗积分:0 分
1、CMakeLists.txtcmake_minimum_required(VERSION 3.16) project(MyExample) find_package(Arrow REQUIRED) find_package(Parquet REQUIRED) find_package(ArrowDataset...
上一页   1   2   3   4   5   6   7   8   9   10   11   12   13   14   15   16   17   18   19   20   21   22   23   24   25   26   27   28   29   30   31   32   33   34   35   36   37   38   39   下一页