Question

我试图根据我在两个不同数据集中的信息进行计算。我需要第一个数据帧的所有信息重复与第二个数据帧的信息一样多次。

示例：

DataFrame 1：

name   price 
 A       1
 B       2

DataFrame 2：

 currency    value
  Dollar       1
  Euro         2

预期产出：

合并DataFrame：

name   price   currency    Value
 A       1       Dollar      1
 A       1       Euro        1
 B       2       Dollar      4
 B       2       Euro        4

我一直尝试类似这样的东西，使用应用和列表，然后将其转换为DataFrame，但没有结果。不知何故，每个名字都会重复出现currs值：

lst = []
for index, currs in currencies.iterrows():
    lst.append(prices.apply(lambda pmRow: pd.Series({'name':pmRow['prices'], 'curr':currs['currency']}), axis=1))

有什么建议吗？谢谢！

Answer 1

您似乎需要cross join：

df = pd.merge(df1.assign(A=1), df2.assign(A=1), on='A').drop('A', 1)
print (df)
  name  price currency  value
0    A      1   Dollar      1
1    A      1     Euro      2
2    B      2   Dollar      1
3    B      2     Euro      2

然后，如果有必要，多列price和value：

df['value'] *= df['price']
print (df)
  name  price currency  value
0    A      1   Dollar      1
1    A      1     Euro      2
2    B      2   Dollar      2
3    B      2     Euro      4

加入两个没有公共列的DataFrame进行计算

1 个答案: