我试图根据我在两个不同数据集中的信息进行计算。我需要第一个数据帧的所有信息重复与第二个数据帧的信息一样多次。
示例:
DataFrame 1:
name price
A 1
B 2
DataFrame 2:
currency value
Dollar 1
Euro 2
预期产出:
合并DataFrame:
name price currency Value
A 1 Dollar 1
A 1 Euro 1
B 2 Dollar 4
B 2 Euro 4
我一直尝试类似这样的东西,使用应用和列表,然后将其转换为DataFrame,但没有结果。不知何故,每个名字都会重复出现currs值:
lst = []
for index, currs in currencies.iterrows():
lst.append(prices.apply(lambda pmRow: pd.Series({'name':pmRow['prices'], 'curr':currs['currency']}), axis=1))
有什么建议吗?谢谢!
答案 0 :(得分:3)
您似乎需要cross join
:
df = pd.merge(df1.assign(A=1), df2.assign(A=1), on='A').drop('A', 1)
print (df)
name price currency value
0 A 1 Dollar 1
1 A 1 Euro 2
2 B 2 Dollar 1
3 B 2 Euro 2
然后,如果有必要,多列price
和value
:
df['value'] *= df['price']
print (df)
name price currency value
0 A 1 Dollar 1
1 A 1 Euro 2
2 B 2 Dollar 2
3 B 2 Euro 4