torcharrow.column¶
- torcharrow.column(data: Optional[Union[Iterable, DType]] = None, dtype: Optional[DType] = None, device: str = '')¶
创建 TorchArrow Column。在设备或默认设备上分配内存。
- 参数:
data (类数组 或 Iterable) – 定义列的内容。
dtype (dtype, 默认 None) – 要强制的数据类型。如果为 None,则将在可能的情况下自动推断类型。
device (设备, 默认 "") – 设备从作用域中选择要使用的运行时。TorchArrow 支持多种运行时(CPU 和 GPU)。如果未提供,则使用 Velox 向量化运行时。有效值为“cpu”(Velox)、“gpu”(即将推出)。
示例
使用自动推断类型创建列
>>> import torcharrow as ta >>> s = ta.column([1,2,None,4]) >>> s 0 1 1 2 2 None 3 4 dtype: Int64(nullable=True), length: 4, null_count: 1
创建具有任意数据类型的列,此处为非空列,包含任意长度的非空字符串列表
>>> sf = ta.column([ ["hello", "world"], ["how", "are", "you"] ], dtype =dt.List(dt.string)) >>> sf.dtype List(item_dtype=String(nullable=False), nullable=False, fixed_size=-1)
创建平均气候数据列,每个大洲一个地图,以城市为键,包含每年的平均最低和最高温度
>>> mf = ta.column([ >>> {'helsinki': [-1.3, 21.5], 'moscow': [-4.0,24.3]}, >>> {'algiers':[11.2, 25.2], 'kinshasa':[22.2,26.8]} >>> ]) >>> mf 0 {'helsinki': [-1.3, 21.5], 'moscow': [-4.0, 24.3]} 1 {'algiers': [11.2, 25.2], 'kinshasa': [22.2, 26.8]} dtype: Map(string, List(float64)), length: 2, null_count: 0