torcharrow.DataFrame.select¶
- DataFrame.select(*args, **kwargs)¶
类似于 SQL 的 SELECT。
通过选择旧列和新(计算)列来转换数据帧。
特殊符号 me 可以用来引用自身。
- 参数:
args (位置字符串参数) – 要保留在投影中的列名。列名 “*” 是表示所有列的快捷方式。以 “-” 开头的列名表示删除此列。
kwargs (命名值参数) – 要添加到投影中的新列名表达式
示例
>>> from torcharrow import ta >>> xf = ta.dataframe({ >>> 'A': ['a', 'b', 'a', 'b'], >>> 'B': [1, 2, 3, 4], >>> 'C': [10,11,12,13]}) >>> xf.select(*xf.columns,D=me['B']+me['C']) index A B C D ------- --- --- --- --- 0 a 1 10 11 1 b 2 11 13 2 a 3 12 15 3 b 4 13 17 dtype: Struct([Field('A', string), Field('B', int64), Field('C', int64), Field('D', int64)]), count: 4, null_count: 0
使用 ‘*’ 和 ‘-colname’
>>> xf.select('*','-B',D=me['B']+me['C']) index A C D ------- --- --- --- 0 a 10 11 1 b 11 13 2 a 12 15 3 b 13 17 dtype: Struct([Field('A', string), Field('C', int64), Field('D', int64)]), count: 4, null_count: 0