DCOM:如何在客户端崩溃时关闭服务器中的连接?

时间:2011-01-25 14:39:33

标签: c++ atl dcom

我有一个相当古老的项目:DCOM客户端和服务器,都在C ++ \ ATL中,只有Windows平台。一切正常:本地和远程客户端连接到服务器并同时工作没有任何问题。

但是当远程客户端崩溃或被任务管理器或“taskkill”命令或电源关闭杀死时 - 我遇到了问题。我的服务器对客户端崩溃一无所知,并尝试向所有客户端发送新事件(也已经崩溃)。结果我有暂停(服务器无法向已经崩溃的客户端发送数据),它的持续时间与崩溃的远程客户端的数量成正比。在5次崩溃后,客户端暂停时间过长,等于完全服务器停止。

我知道DCOM“ping”机制(DCOM应该断开6分钟静默后无响应“每2分钟ping一次”的客户端)。实际上,在挂机6分钟后,我有一段时间的正常工作,但服务器又回到“暂停”状态。

我能做些什么呢?如何使DCOM“ping”工作正常?如果我将实现自己的“ping”代码,是否可以手动断开旧的DCOM客户端连接?怎么做?

4 个答案:

答案 0 :(得分:1)

我不确定DCOM ping系统,但是您可以选择将通知简单地转移到单独的线程池。这将有助于减轻拥有少量阻止客户端的影响 - 当然,当有太多阻塞客户端时,你会遇到问题。

执行此操作的简单方法是使用QueueUserWorkItem - 这将调用应用程序的系统线程池上传递的回调。假设您正在使用MTA,这就是您需要做的所有事情:

static InfoStruct {
    IRemoteHost *pRemote;
    BSTR someData;
};

static DWORD WINAPI InvokeClientAsync(LPVOID lpInfo) {
  CoInitializeEx(COINIT_MULTITHREADED);

  InfoStruct *is = (InfoStruct *)lpInfo;
  is->pRemote->notify(someData);
  is->pRemote->Release();
  SysFreeString(is->someData);
  delete is;

  CoUninitialize();
  return 0;
}

void InvokeClient(IRemoteHost *pRemote, BSTR someData) {

  InfoStruct *is = new InfoStruct;
  is->pRemote = pRemote;
  pRemote->AddRef();

  is->someData = SysAllocString(someData);
  QueueUserWorkItem(InvokeClientAsync, (LPVOID)is, WT_EXECUTELONGFUNCTION);
}

如果你的主线程在STA中,这只是稍微复杂一些;您只需使用CoMarshalInterThreadInterfaceInStreamCoGetInterfaceAndReleaseStream来传递公寓之间的接口指针:

static InfoStruct {
    IStream *pMarshalledRemote;
    BSTR someData;
};

static DWORD WINAPI InvokeClientAsync(LPVOID lpInfo) {
  CoInitializeEx(COINIT_MULTITHREADED); // can be STA as well

  InfoStruct *is = (InfoStruct *)lpInfo;
  IRemoteHost *pRemote;
  CoGetInterfaceAndReleaseStream(is->pMarshalledRemote, __uuidof(IRemoteHost), (LPVOID *)&pRemote);

  pRemote->notify(someData);
  pRemote->Release();
  SysFreeString(is->someData);
  delete is;

  CoUninitialize();

  return 0;
}

void InvokeClient(IRemoteHost *pRemote, BSTR someData) {
  InfoStruct *is = new InfoStruct;
  CoMarshalInterThreadInterfaceInStream(__uuidof(IRemoteHost), pRemote, &is->pMarshalledRemote);

  is->someData = SysAllocString(someData);
  QueueUserWorkItem(InvokeClientAsync, (LPVOID)is, WT_EXECUTELONGFUNCTION);
}

请注意,为了清楚起见,错误检查已被省略 - 您当然希望错误检查所有调用 - 特别是,您要检查RPC_S_SERVER_UNAVAILABLE和其他此类网络错误,并删除有问题的客户端。

您可能需要考虑的一些更复杂的变体包括确保每个客户端一次只有一个请求(因此进一步减少卡住的客户端的影响)并缓存MTA中的编组接口指针(如果您的主要线程是一个STA) - 因为我认为CoMarshalInterThreadInterfaceInStream可能会执行网络请求,所以当您知道客户端已连接时,您理想地希望提前处理它,而不是冒着风险阻止主线程。

答案 1 :(得分:0)

一种解决方案是消除事件 - 让客户查询服务器是否有任何感兴趣的内容。

答案 2 :(得分:0)

使用DCOM建立名为pipe的通知。 使用管道可以更好地处理断开连接。 监听器(几乎)立即响应消息。 例如服务器 - >客户端(你的管道名称是什么?)。 客户端 - >服务器响应名称,包括机器。 客户端创建命名管道并进行侦听。 服务器立即或在需要时打开管道。

答案 3 :(得分:0)

您可以实现自己的ping机制,以便客户端不时调用服务器的ping方法。您已在服务器端为您的客户端维护某种容器。在该映射中,为每个客户端标记最后一次ping的时间戳。然后在向该客户端发送事件之前检查客户端是否处于活动状态。 您可以自定义何时停止发送事件的策略,可能基于错过的时间或错过的数量或事件类型或其他因素。 您可能不需要担心删除客户端 - 可以等到DCOM意识到特定客户端已经死亡。 此方案可能无法完全消除此问题,因为客户端可能在事件需要发送之前就已经死亡,但您可以通过调整ping周期来完全控制可能存在的客户端数量。这个时期越小,死亡客户就越少,尽管您需要支付流量。