地质时间序列的动态时间扭曲,Matlab

时间:2012-02-02 15:55:40

标签: matlab

背景:           基本上我正在使用像语音识别中使用的动态时间扭曲算法来尝试扭曲地质数据(从环境条件中滤除噪声)这两个问题之间的主要区别在于dtw打印出一个允许两个输入矢量的扭曲函数要扭曲,而对于我试图解决的问题,我需要保持一个参考向量不变,同时拉伸和缩小测试变量向量以适应。

这是matlab中的dtw:

function [Dist,D,k,w]=dtw()
%Dynamic Time Warping Algorithm
%Dist is unnormalized distance between t and r
%D is the accumulated distance matrix
%k is the normalizing factor
%w is the optimal path
%t is the vector you are testing against
%r is the vector you are testing
[t,r,x1,x2]=randomtestdata();
[rows,N]=size(t);
[rows,M]=size(r);
%for n=1:N
%    for m=1:M
%        d(n,m)=(t(n)-r(m))^2;
%    end
%end
d=(repmat(t(:),1,M)-repmat(r(:)',N,1)).^2; %this replaces the nested for loops from         above Thanks Georg Schmitz 

D=zeros(size(d));
D(1,1)=d(1,1);

for n=2:N
    D(n,1)=d(n,1)+D(n-1,1);
end
for m=2:M
    D(1,m)=d(1,m)+D(1,m-1);
end
for n=2:N
    for m=2:M
        D(n,m)=d(n,m)+min([D(n-1,m),D(n-1,m-1),D(n,m-1)]);
    end
end

Dist=D(N,M);
n=N;
m=M;
k=1;
w=[];
w(1,:)=[N,M];
while ((n+m)~=2)
    if (n-1)==0
        m=m-1;
    elseif (m-1)==0
        n=n-1;
    else 
      [values,number]=min([D(n-1,m),D(n,m-1),D(n-1,m-1)]);
      switch number
      case 1
        n=n-1;
      case 2
        m=m-1;
      case 3
        n=n-1;
        m=m-1;
      end
  end
    k=k+1;
    w=cat(1,w,[n,m]);
end
w=flipud(w)

%w is a matrix that looks like this:

%    1 1
%    1 2
%    2 2
%    3 3
%    3 4
%    3 5
%    4 5
%    5 6
%    6 6

所以这就是说第二个矢量的第一个和第二个点都应该映射到第一个矢量的第一个点。即1 1                                                               1 2 并且第一个矢量上的第五个和第六个点应该映射到第六个点的第二个矢量。等等,因此w包含扭曲数据的x坐标。

通常我可以说

X1=w(:,1);
X2=w(:,2);
for i=1:numel(reference vector)
 Y1(i)=reference vector(X1(i));
 Y2(i)=test vector(X2(i));
end

但我不需要拉伸参考向量,所以我需要使用X1中的重复来知道如何缩小Y2和X2中的重复以知道如何拉伸Y2而不是使用X1中的重复来拉伸Y1并重复X2伸展Y2。

我尝试使用find方法在X1和X2中找到重复,然后根据需要进行平均(收缩)或线性(拉伸)插值,但代码变得非常复杂且难以调试。

这真的不清楚吗?我很难解释这个问题,但我只需要知道如何使用w并创建一个相应拉伸和收缩的Y2。

1 个答案:

答案 0 :(得分:0)

我没有答案,但我一直在玩从维基百科文章中的伪代码实现的@tokkot 代码。它有效,但我认为它缺少 DTW 的三个要求:

  1. 两个序列的第一个和最后一个点必须匹配,使用 min() 时,其中一个序列的第一个和结束点中的一些(或多个)丢失。
  2. 输出序列不是单调递增的。我使用了 x1(sort(path)) 代替,但我不相信这是真正的最小距离。
  3. 此外,由于我还没有找到的原因,扭曲序列的一些中间点丢失了,我认为这与 DTW 不兼容。

我仍在寻找像 DTW 这样的算法,其中一个序列是固定的(未扭曲)。我需要将等距温度测量的时间序列与另一个序列进行比较。第一个不能时移,没有意义。