Netty messageReceived()在长时间连接一段时间后不会被调用

时间:2012-04-12 11:53:16

标签: tcp netty gprs

最终编辑/结论

这是一个与netty无关的问题,仍然很难调试。有时会阻止messageReceived中的工作线程,所以一段时间后池中没有可用的线程。

原始问题

在我的公司,我们正在使用netty来监听GPS跟踪设备的连接。跟踪器通过GPRS进行通信。

我们经历过netty 3.2.4-final的非常奇怪的行为。

过了一段时间(我无法确切知道多少,但接近一天)我们没有得到跟踪器的任何消息。这意味着我们不会调用我们实现的SimpleCahnnelUpstreamHandler的messageReceived方法!但是,如果我使用tcpdump捕获所有数据包,我可以看到所有消息进入!

这是一个已知问题,已在更高版本的netty中修复了吗?

我们的渠道渠道如下:

...
final TcpListenerChannelHandler tcpChannelHandler;


@Inject
public TcpListenerPipeline(TcpListenerChannelHandler tcpChannelHandler) {
     this.tcpChannelHandler = tcpChannelHandler;
}

@Override
public ChannelPipeline getPipeline() throws Exception {
        ChannelPipeline p = Channels.pipeline();
        p.addLast("frameDecoder", new DelimiterBasedFrameDecoder(2048, Delimiters.lineDelimiter()));
        p.addLast("encoder", new ByteArrayWrapperEncoder());
        p.addLast("handler", tcpChannelHandler);
        return p;
}
...

我们以下列方式实例化听取:

public void startListen() {
        ChannelFactory channelFactory = new NioServerSocketChannelFactory(Executors.newCachedThreadPool(), Executors.newCachedThreadPool(),20);
        bootstrap = new ServerBootstrap(channelFactory);
        bootstrap.setPipelineFactory(pipeline);
        bootstrap.setOption("child.tcpNoDelay", true);
        bootstrap.setOption("child.keepAlive", true);
        lazyLogger.getLogger().info("Binding Tcp listener to 0.0.0.0 on port '{}'", listenPort);
        serverChannel = bootstrap.bind(new InetSocketAddress("0.0.0.0", listenPort));
}

有没有人知道哪些是错的?或者,我们是否应该每隔一小时左右手动断开所有频道?

修改

我有更多关于此问题的信息

如果没有处理任何消息,也会发生在成功远程连接时未调用channelConnected。我远程调试了这个问题,发现:

  • 在NioServerSocketPipelineSink.java第246行 registerAcceptedChannel(acceptedSocket,currentThread);发生
  • 软件执行一直到 DefaultChannelPipeline行#781包含不同的事件,但我的TcpListenerChannelHandler永远不会在上下文中。

最奇怪的是,有时netty会注意到某个频道已连接,有时却没有。

EDIT2:

TcpListenerCahnnelHandler是SimpleChannelUpstreamHandler的简单实现

它的亮点:

public class TcpListenerChannelHandler extends SimpleChannelUpstreamHandler {
...
@Override
public void channelConnected(ChannelHandlerContext ctx, ChannelStateEvent e) throws Exception {
    super.channelConnected(ctx, e);
    _logger.info("{} device connected from: {}", deviceProtocol.getName(),  ctx.getChannel().getRemoteAddress());
    deviceConnectionRegistry.channelConnected(ctx.getChannel());
}

@Override
public void channelDisconnected(ChannelHandlerContext ctx, ChannelStateEvent e) throws Exception {
    super.channelDisconnected(ctx, e);
    _logger.info("{} device from endpoint '{}' disconnected.", deviceProtocol.getName(), ctx.getChannel().getRemoteAddress());
    deviceConnectionRegistry.channelDisconnected(ctx.getChannel());
}

@Override
public void messageReceived(ChannelHandlerContext ctx, MessageEvent messageEvent) throws Exception  {
    super.messageReceived(ctx, messageEvent);

    ...
    NOTE: here we process the meassage, I do not think it can cause any problem
}


@Override
public void exceptionCaught(ChannelHandlerContext ctx, ExceptionEvent e) throws Exception {
        if(_logger.isWarnEnabled())
            _logger.warn(deviceProtocol.getName()+ " device"
                    +e.getChannel().getRemoteAddress()+" channel", e.getCause());

        if (!(e.getCause() instanceof ConnectException))
            e.getChannel().close();
}

同时我升级到3.3.1决赛。如果问题再次出现,我知道在哪里继续调试。

编辑3:

我已经升级到3.3.1决赛,两天之后又出现了同样的问题。

我不知道它是否相关,但我们在同一物理接口上有更多IP地址。我们应该只尝试一个界面吗?是否存在更多eth接口的已知问题?

但是再次:tcpdump识别跟踪器的消息,但netty不会在我的自定义处理程序中调用messageReceived。

编辑4:

我进一步调试了代​​码。问题发生在NioWorker.java 在第131行(布尔提供= registerTaskQueue.offer(registerTask);)运行正常,但随后将永远不会处理该任务。这意味着第748行的RegisterTask.run()永远不会被调用。

1 个答案:

答案 0 :(得分:1)

不知道,您是否尝试添加LoggingHandler来观看所有内容? 我用来使用自定义处理程序:

/**
 *
 * Adapted from the original LoggingHandler in Netty.
 */
public class LoggingHandler implements ChannelUpstreamHandler, ChannelDownstreamHandler {

    String name;
    boolean hexDump;

    public LoggingHandler(String name, boolean hexDump) {
        this.name = name;
        this.hexDump = hexDump;
    }

    /**
     * Logs the specified event to the {@link InternalLogger} returned by
     * {@link #getLogger()}. If hex dump has been enabled for this handler,
     * the hex dump of the {@link ChannelBuffer} in a {@link MessageEvent} will
     * be logged together.
     */
    public void log(ChannelEvent e) {

        String msg = name + " >> " + e.toString();

        // Append hex dump if necessary.
        if (hexDump && e instanceof MessageEvent) {
            MessageEvent me = (MessageEvent) e;
            if (me.getMessage() instanceof ChannelBuffer) {
                ChannelBuffer buf = (ChannelBuffer) me.getMessage();
                msg = msg + " - (HEXDUMP: " + ChannelBuffers.hexDump(buf) + ')';
            }
        }

        // Log the message (and exception if available.)
        if (e instanceof ExceptionEvent) {
            Logger.debug(this, msg, ((ExceptionEvent) e).getCause());
        } else {
            Logger.debug(this, msg);
        }

    }



    public void handleUpstream(ChannelHandlerContext ctx, ChannelEvent e)
            throws Exception {
        log(e);
        ctx.sendUpstream(e);
    }

    public void handleDownstream(ChannelHandlerContext ctx, ChannelEvent e)
            throws Exception {
        log(e);
        ctx.sendDownstream(e);
    }

在客户端和服务器端插入。 在服务器端,我用它将它添加到子和父:

ChannelFactory factory = new NioServerSocketChannelFactory(Executors.newCachedThreadPool(),
                Executors.newCachedThreadPool());
        ServerBootstrap bootstrap = new ServerBootstrap(factory);
        bootstrap.setOption("child.tcpNoDelay", true);
        bootstrap.setOption("child.keepAlive", true);

        bootstrap.setPipelineFactory(new ChannelPipelineFactory() {

            public ChannelPipeline getPipeline() throws Exception {
                ChannelPipeline pipeline = Channels.pipeline();
                pipeline.addLast("LOGGER", new LoggingHandler("SERVER", true));
                pipeline.addLast("LAUNCHER", handler.new OnChannelConnectedPlugger());
                return pipeline;
            }
        });
        bootstrap.setParentHandler(new LoggingHandler("SERVER-PARENT", true));