python - 使用Tensorflow tf.data

设置

数据是一维时间序列数据。滑动窗口（框架）在数据上运行并提取特征f_ {i}（t_ {j}）的100维向量，其中i是文件索引，j是帧的时间索引。来自n个连续帧的能量被堆叠以形成2D＆＃34;图像＆＃34;，其是分类器的输入。

基本方法

只需将堆积的矢量保存在tfrecords文件中即可。缺点是堆叠的矢量具有大量重复数据并且消耗大量空间。如果我们有10演出的特征向量，那么堆叠10帧历史将需要50演出（+开销）的空间。但是，我们可以让tf.data进行洗牌，预取，批量创建等等。很方便！

期望的方法

一种实现，我们只将特征向量保存为tfrecords文件，并动态创建堆叠特征向量（图像）。

问题

之前是否遇到并处理过这个问题？大多数人会不关心他们的数据中的高重复次数或消耗的空间量？

获得所需的实施有多困难。即使天真地改变数据也会扰乱订购时间。我也只是以一种方式使用tf.data，我调用iterator.get_next（）来获取功能和标签形式的一个例子，然后将其提供给图形。我想我还需要弄清楚如何不仅获得当前示例的专长和标签，而且还要及时了解它的前辈们！所以，我正在寻找有关如何实现这一目标的一些提示。

这是由2帧特征向量形成的图像处理的图像。请注意，在这种情况下，每个特征向量将在tfrecords数据文件中出现两次：

使用Tensorflow tf.data

0 个答案: