我有多个数据集,并希望将行合并为一个数据集以适合分类器。有没有很好的方法来合并输入数据集?
我的数据由股票市场的历史价值组成-我想使用完整的数据仅适合一个分类器。
如果我要创建一个大表-每个数据集的结尾和开头都会出现问题。
例如-列表中第一只股票的最后几天将用于训练列表中第二只股票的开始的分类器。
也许我应该在将所有数据连接到一个数据集之前对每个数据集进行规范化?
由usr解答:与训练分类器有关的所有历史数据已经在列中-因此-附加所有行都可以,不会对不同股票/数据集的第一天和最后一天造成问题< / p>
答案 0 :(得分:2)
如果您希望将数据帧合并为一个,则可以使用Pandas进行多种选择。
.append()
例如df = df1.append(df2, ignore_index=True)
.concat()
。使用concat,您可以连接两个以上的数据帧例如df = pd.concat([df1, df2], ignore_index=True)
以下是一些带有示例的更多信息:https://pandas.pydata.org/pandas-docs/stable/merging.html