当前位置 : 主页 > 编程语言 > python >

python – 在pandas DataFrame中的列上的.str.split()操作之后获取最后一个“列”

来源:互联网 收集:自由互联 发布时间:2021-06-25
我在pandas DataFrame中有一个列,我想在一个空格上拆分.使用DataFrame.str.split(”)分割很简单,但我不能从最后一个条目创建一个新列.当我.str.split()列我得到一个数组列表,我不知道如何操纵它
我在pandas DataFrame中有一个列,我想在一个空格上拆分.使用DataFrame.str.split(”)分割很简单,但我不能从最后一个条目创建一个新列.当我.str.split()列我得到一个数组列表,我不知道如何操纵它来获取我的DataFrame的新列.

这是一个例子.该列中的每个条目都包含“符号数据价格”,我想分拆价格(最终在一半的情况下删除“p”…或“c”).

import pandas as pd
temp = pd.DataFrame({'ticker' : ['spx 5/25/2001 p500', 'spx 5/25/2001 p600', 'spx 5/25/2001 p700']})
temp2 = temp.ticker.str.split(' ')

产量

0    ['spx', '5/25/2001', 'p500']
1    ['spx', '5/25/2001', 'p600']
2    ['spx', '5/25/2001', 'p700']

但是temp2 [0]只给出了一个列表条目的数组,而temp2 [:] [ – 1]失败了.如何将每个数组中的最后一个条目转换为新列?谢谢!

您可以使用tolist方法作为中介:

In [99]: import pandas as pd

In [100]: d1 = pd.DataFrame({'ticker' : ['spx 5/25/2001 p500', 'spx 5/25/2001 p600', 'spx 5/25/2001 p700']})

In [101]: d1.ticker.str.split().tolist()
Out[101]: 
[['spx', '5/25/2001', 'p500'],
 ['spx', '5/25/2001', 'p600'],
 ['spx', '5/25/2001', 'p700']]

您可以从中创建一个新的DataFrame:

In [102]: d2 = pd.DataFrame(d1.ticker.str.split().tolist(), 
   .....:                   columns="symbol date price".split())

In [103]: d2
Out[103]: 
  symbol       date price
0    spx  5/25/2001  p500
1    spx  5/25/2001  p600
2    spx  5/25/2001  p700

为了更好的衡量,您可以确定价格:

In [104]: d2["price"] = d2["price"].str.replace("p","").astype(float)

In [105]: d2
Out[105]: 
  symbol       date  price
0    spx  5/25/2001    500
1    spx  5/25/2001    600
2    spx  5/25/2001    700

PS:但如果你真的只想要最后一栏,申请就足够了:

In [113]: temp2.apply(lambda x: x[2])
Out[113]: 
0    p500
1    p600
2    p700
Name: ticker
网友评论