NServiceBus - 分发服务器控制消息错误

时间:2013-04-30 12:42:43

标签: msmq nservicebus nservicebus-distributor

我们已经购买了很多许可证,进行了大量的测试,结果很多,并且处于我们首次发布的边缘:)。

但是现在我们在路上遇到了很大的打击,这意味着如果我们无法解释并修复它,我们可能不得不放弃公共汽车:/。

我们的经销商突然出现如下控件错误消息:

<?xml version="1.0"?>
<ArrayOfHeaderInfo xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema">
    <HeaderInfo>
        <Key>NServiceBus.ControlMessage</Key>
        <Value>True</Value>
    </HeaderInfo>
    <HeaderInfo>
        <Key>NServiceBus.Distributor.WorkerCapacityAvailable</Key>
        <Value>20</Value>
    </HeaderInfo>
    <HeaderInfo>
        <Key>NServiceBus.Distributor.WorkerStarting</Key>
        <Value>True</Value>
    </HeaderInfo>
    <HeaderInfo>
        <Key>CorrId</Key>
        <Value>58dd98f5-9ac0-44fb-8604-3a0f06787a35\295075</Value>
    </HeaderInfo>
    <HeaderInfo>
        <Key>NServiceBus.ExceptionInfo.Reason</Key>
        <Value>ProcessingFailed</Value>
    </HeaderInfo>
    <HeaderInfo>
        <Key>NServiceBus.ExceptionInfo.ExceptionType</Key>
        <Value>System.InvalidOperationException</Value>
    </HeaderInfo>
    <HeaderInfo>
        <Key>NServiceBus.ExceptionInfo.HelpLink</Key>
    </HeaderInfo>
    <HeaderInfo>
        <Key>NServiceBus.ExceptionInfo.Message</Key>
        <Value>Property ResponseQueue was not retrieved when receiving the message. Ensure that the PropertyFilter is set correctly.</Value>
    </HeaderInfo>
    <HeaderInfo>
        <Key>NServiceBus.ExceptionInfo.Source</Key>
        <Value>NServiceBus.Core</Value>
    </HeaderInfo>
    <HeaderInfo>
        <Key>NServiceBus.ExceptionInfo.StackTrace</Key>
        <Value>   at NServiceBus.Unicast.Transport.Transactional.TransactionalTransport.ProcessMessage(TransportMessage m) in c:\BuildAgent\work\nsb.master_6\src\impl\unicast\transport\NServiceBus.Unicast.Transport.Transactional\TransactionalTransport.cs:line 312
   at NServiceBus.Unicast.Transport.Transactional.TransactionalTransport.ReceiveMessage() in c:\BuildAgent\work\nsb.master_6\src\impl\unicast\transport\NServiceBus.Unicast.Transport.Transactional\TransactionalTransport.cs:line 275
   at NServiceBus.Utils.TransactionWrapper.RunInTransaction(Action callback, IsolationLevel isolationLevel, TimeSpan transactionTimeout) in c:\BuildAgent\work\nsb.master_6\src\utils\TransactionWrapper.cs:line 32
   at NServiceBus.Unicast.Transport.Transactional.TransactionalTransport.Process() in c:\BuildAgent\work\nsb.master_6\src\impl\unicast\transport\NServiceBus.Unicast.Transport.Transactional\TransactionalTransport.cs:line 220</Value>
    </HeaderInfo>
    <HeaderInfo>
        <Key>NServiceBus.OriginalId</Key>
        <Value>58dd98f5-9ac0-44fb-8604-3a0f06787a35\295075</Value>
    </HeaderInfo>
    <HeaderInfo>
        <Key>NServiceBus.FailedQ</Key>
        <Value>someservice.processId.distributor.control@testservices01</Value>
    </HeaderInfo>
    <HeaderInfo>
        <Key>NServiceBus.TimeOfFailure</Key>
        <Value>2013-04-30 10:07:40:750707 Z</Value>
    </HeaderInfo>
</ArrayOfHeaderInfo>
Google告诉我们,这可能与某些线程问题有关,甚至可能与使用peek / receive实现NSB的方式有关。

上述异常与GitHub上的此文件有关:https://github.com/NServiceBus/NServiceBus/blob/master/src/impl/unicast/transport/NServiceBus.Unicast.Transport.Transactional/TransactionalTransport.cs

有关我们实施的详情:

我们使用自定义的IManageUnitsOfWork,由于一些遗留问题,这意味着还没有针对数据库的DTC。我不认为这可能是原因,但我认为值得一提。这是实施:

public class ManagedUnitOfWorkWithDtcSuppression : IManageUnitsOfWork
{
    private readonly IContainer _container;
    private IUnitOfWork _unitOfWork;
    private readonly TransactionScope _scope;

    public ManagedUnitOfWorkWithDtcSuppression()
    {
        _scope = new TransactionScope(TransactionScopeOption.Suppress);
        _container = ObjectFactory.GetInstance<IContainer>();
    }

    public void Begin()
    {
        _unitOfWork = _container.GetInstance<IUnitOfWork>();
    }

    public void End(Exception exception = null)
    {
        if (exception == null)
        {
            _unitOfWork.Commit();
        }

        _unitOfWork.Dispose();
        _scope.Complete();
        _scope.Dispose();
    }
}

我们还有一个特殊的设置,我们在一个服务运行中运行4个相同的AppDomain,这意味着当我们作为分销商启动服务时,实际上有4个分销商正在运行。但这些都是公关。定义完全相互隔离。 IBus对于每个AppDomain都是唯一的,已经过测试。

我们的分销商配置如下所示:

        return NServiceBus.Configure.With()
            .DefineEndpointName(queuePrefix)
            .Log4Net(ObjectFactory.GetInstance<IServiceBusLog>().Build())
            .StructureMapBuilder()
            .JsonSerializer()
            .AsMasterNode()
            .RunDistributorWithNoWorkerOnItsEndpoint()
            .MsmqTransport()
            .IsTransactional(true)
            .DisableTimeoutManager()
            .DisableSecondLevelRetries()
            .UnicastBus()
            .CreateBus()
            .Start(() => NServiceBus.Configure.Instance.ForInstallationOn<NServiceBus.Installation.Environments.Windows>().Install());

问题:

这里发生了什么?

我们是否正在使用NSB,因为我们正在使用DTC抑制,是否存在MSMQ错误或是否存在NSB错误?

1 个答案:

答案 0 :(得分:0)

让我迟到一年回答! :)我很确定你会看到https://github.com/Particular/NServiceBus/pull/2250。基本上,Microsoft对.NET 3.5和.NET 4之间的MessageQueue实现进行了更改,使NSB代码非线程安全。这已在https://github.com/Particular/NServiceBus/releases/tag/3.3.10

中修复