Question

我已经尝试了所有方法，但无法弄清楚为什么我的梯度下降无法正常工作。我看了无数示例，并多次更改了梯度下降代码。当我运行程序时，得到的响应为NaN。然后，我打印出每个迭代，并发现在到达NaN之前，该值越来越高（或越来越低至负无穷大）。我尝试了不同的alpha值，开始的beta值，迭代次数以及每一次都不起作用。发生了什么事？

这是我的代码：

A = load('A2-datasets/data-build-stories.mat');
X = [ones(60,1) A.data_build_stories(:,1)];
y = A.data_build_stories(:,2);
b = gradDes(X, y);

function beta = gradDes(X,y)
    alpha = 0.01;
    beta = [0;0];
    m = length(y);
    for i = 1:1000
        beta = beta - (alpha/m) * (X' * (X * beta - y));
    end
end

这是data-build-stories.mat：

Answer 1

您正在使用一个对于您的数据而言，alpha太大。

尝试更改它：

    A = load('tmp.txt');
    X = [ones(60,1) A(:,1)];
    y = A(:,2);
    b = gradDes(X, y);

    function beta = gradDes(X,y)
        alpha = 0.00000001;
        beta = [0;0];
        m = length(y);
        for i = 1:1000
            beta = beta - (alpha/m) * (X' * (X * beta - y));
        end
    end

    b =[  0.0001 0.0719]

梯度下降总是无穷大

1 个答案: