torcharrow.Column¶
torcharrow.Column
是一种一维类似 torch.Tensor 的数据结构,包含单个数据类型元素。它还支持非数值类型,例如字符串、列表、结构体。
数据类型¶
TorchArrow 为列定义了以下数据类型,位于模块 torcharrow.dtypes
中(在下表中缩写为 dt
)
数据类型 |
dtype |
---|---|
32 位浮点数 |
|
64 位浮点数 |
|
8 位有符号整数 |
|
16 位有符号整数 |
|
32 位有符号整数 |
|
64 位有符号整数 |
|
布尔值 |
|
字符串 |
|
列表 |
|
结构体 |
|
Column 类参考¶
- class torcharrow.Column¶
- Column.dtype¶
torcharrow.Column
的数据类型
- Column.device¶
torcharrow.Column
所在或将要分配到的设备。
- Column.length¶
返回行数,包括空值
- Column.null_count¶
返回空值的数量
返回前 n 行。 |
|
返回最后 n 行。 |
|
将列转换为给定的 dtype |
|
(实验性 API) 返回索引 i 处的数据是否有效,即非空 |
|
返回追加了值的列/数据框。 |
|
检查列中的每个元素是否包含在 values 中。 |
|
返回所有非空元素是否为 True |
|
返回任何非空元素是否为 True |
|
根据输入对应关系映射行。 |
|
选择谓词为 True 的行。 |
|
根据输入对应关系将行映射到行列表,如果结果类型 != 项目类型,则需要 dtype。 |
|
类似 map(),但一次调用可调用对象处理一批行。 |
|
使用指定的方法填充空值。 |
|
返回删除了任何或所有空值的行的列/数据框。 |
|
(实验性 API) 删除行/数据框中的重复值,但保留第一个、最后一个或都不保留 |
|
将自身转换为箭头数组 |
|
转换为 PyTorch 容器(张量、PackedList、PackedMap 等) |
|
转换为普通 Python 容器(标量或容器列表) |
|
将自身转换为 Pandas Series |
NumericalColumn 类参考¶
- class torcharrow.NumericalColumn¶
系列中每个元素的绝对值。 |
|
将每个值向上舍入到最小的整数 |
|
将每个值向下舍入到最大的整数 |
|
将数据中的每个值舍入到指定的小数位数。 |
|
返回一个新列,包含元素的自然对数 |
|
生成描述性统计信息。 |
|
返回非空值的最小值。 |
|
返回非空值的最大值。 |
|
返回非空值的总和。 |
|
返回非空值的平均值。 |
|
返回数据的标准差。 |
|
返回数据中值的中间值。 |
StringColumn 类参考¶
- class torcharrow.StringColumn¶
计算列中每个元素的长度。 |
|
从列中每个元素切片子字符串。 |
|
根据给定的分隔符/定界符拆分字符串。 |
|
删除前导和尾随空格。 |
|
如果字符串是字母字符串,则返回 True,否则返回 False。 |
|
如果所有字符都是数字,则返回 True,否则返回 False。 |
|
如果字符串中的所有字符都是字母数字(字母或数字),则返回 True,否则返回 False。 |
|
如果字符串中的所有字符都是数字,则返回 True,否则返回 False。 |
|
如果字符串仅包含十进制数字(从 0 到 9),则返回 True,否则返回 False。 |
|
如果字符串中的所有字符都是空格,则返回 True,否则返回 False。 |
|
如果非空字符串为小写,则返回 True,否则返回 False。 |
|
如果非空字符串为大写,则返回 True,否则返回 False。 |
|
如果字符串的每个单词都以大写字母开头,则返回 True,否则返回 False。 |
|
将列中的字符串转换为小写。 |
|
将列中的字符串转换为大写。 |
|
测试每个字符串元素的开头是否与模式匹配。 |
|
测试每个字符串元素的结尾是否与模式匹配。 |
|
统计列中每个字符串中模式出现的次数 |
|
返回列中每个字符串的最低索引。 |
|
替换列中模式的每次出现。 |
|
确定每个字符串是否与正则表达式匹配 |
|
测试每个项目模式是否包含在字符串中;返回布尔值 |
|
查找每个项目中模式的所有出现次数(参见 re.findall()) |
ListColumn 类参考¶
- class torcharrow.ListColumn¶
计算列中每个元素的长度。 |
|
从列中的每个元素切片子列表 |
|
(实验性 API) 向量化映射。 |