将numpy数组组合到pandas数据框架中(但数组的格式很奇怪)。

我有这三个numpy数组(它们是一些回归预测的输出,但我已经重新命名了)。

target = np.array([[ 2919],
   [  912],
   [ 2365],
   [11666],
   [ 1881]])

prediction = np.array([[ 4059.],
       [ 1071.],
       [ 2123.],
       [10550.],
       [ 2287.]])

abs_diff = np.array([[1140.],
       [ 159.],
       [ 242.],
       [1116.],
       [ 406.]])

我如何将它们组合到一个pandas数据框架中?

我尝试了一些方法,包括这个,但我不能让它工作。

fields = [list(target), list(prediction), list(abs_diff)]
dat = pd.DataFrame(data = fields, columns = ['target', 'prediction', 'absolute_diff'])

这给了我一个错误。

AssertionError: 3列通过,通过的数据有5列

解决方案:

使用 numpy.hstack 用于将数组连接在一起并传递给 Dataframe 构造者。

fields = np.hstack((target, prediction, abs_diff))
dat = pd.DataFrame(data = fields, columns = ['target', 'prediction', 'absolute_diff'])
print (dat)
    target  prediction  absolute_diff
0   2919.0      4059.0         1140.0
1    912.0      1071.0          159.0
2   2365.0      2123.0          242.0
3  11666.0     10550.0         1116.0
4   1881.0      2287.0          406.0

本文来自投稿,不代表实战宝典立场,如若转载,请注明出处:https://www.shizhanbaodian.com/29105.html

(0)
上一篇 1天前
下一篇 1天前

相关推荐

发表评论

登录后才能评论