启动Apache Storm Supervisor时出错

时间:2015-04-29 11:17:52

标签: java apache-storm

我正在尝试重新启动Apache Storm群集,但我遇到了一些问题。我有两个不会重启的主管。当我查看主管日志时,我看到以下错误:

java.lang.RuntimeException: java.io.StreamCorruptedException: invalid stream header: 00000000
  at backtype.storm.serialization.DefaultSerializationDelegate.deserialize(DefaultSerializationDelegate.java:56) ~[storm-core-0.9.3.jar:0.9.3]
  at backtype.storm.utils.Utils.deserialize(Utils.java:89) ~[storm-core-0.9.3.jar:0.9.3]
  at backtype.storm.utils.LocalState.deserializeLatestVersion(LocalState.java:65) ~[storm-core-0.9.3.jar:0.9.3]
  at backtype.storm.utils.LocalState.snapshot(LocalState.java:47) ~[storm-core-0.9.3.jar:0.9.3]
  at backtype.storm.utils.LocalState.get(LocalState.java:72) ~[storm-core-0.9.3.jar:0.9.3]
  at backtype.storm.daemon.supervisor$read_worker_heartbeat.invoke.(supervisor.clj:96) ~[storm-core-0.9.3.jar:0.9.3]
  at backtype.storm.daemon.supervisor$read_worker_heartbeats$iter__3992__3996$fn__3997.invoke(supervisor.clj:109) ~[storm-core-0.9.3.jar:0.9.3]
  at clojure.lang.LazySeq.sval(LazySeq.java:42) ~[clojure-1.5.1.jar:na]
  at clojure.lang.LazySeq.seq(LazySeq.java:60) ~[clojure-1.5.1.jar:na]
  at clojure.lang.RT.seq(RT.java:484) ~[clojure-1.5.1.jar:na]
  at clojure.core$seq.invoke(core.clj:133) ~[clojure-1.5.1.jar:na]
  at clojure.core$dorun.invoke(core.clj:2780) ~[clojure-1.5.1.jar:na]
  at clojure.core$doall.invoke(core.clj:2796) ~[clojure-1.5.1.jar:na]
  at backtype.storm.daemon.supervisor$read_worker_heartbeats.invoke(supervisor.clj:108) ~[storm-core-0.9.3.jar:0.9.3]
  at backtype.storm.daemon.supervisor$read_allocated_workers.invoke(supervisor.clj:125) ~[storm-core-0.9.3.jar:0.9.3]
  at backtype.storm.daemon.supervisor$sync_processes.invoke(supervisor.clj:230) ~[storm-core-0.9.3.jar:0.9.3]
  at clojure.lang.Afn.applyToHelper(AFn.java:161) ~[clojure-1.5.1.jar:na]
  at clojure.lang.AFn.applyTo(AFn.java:151) ~[clojure-1.5.1.jar:na]
  at clojure.core$apply.invoke(core.clj:619) ~[clojure-1.5.1.jar:na]
  at clojure.core$partial$fn__4190.doInvoke(core.clj:2396) ~[clojure-1.5.1.jar:na]
  at clojure.lang.RestFn.invoke(RestFn.java:397) ~[clojure-1.5.1.jar:na]
  at backtype.storm.event$event_manager$fn__2467.invoke(event.clj:40) ~[storm-core-0.9.3.jar:0.9.3]
  at clojure.lang.AFn.run(AFn.java:24) ~[clojure-1.5.1.jar:na]
  at java.lang.Thread.run(Thread.java:853) [na:1.7.0]
Caused by java.io.StreamCorruptedExceptionL invalid stream header: 00000000
  at java.io.ObjectInputStream.readStreamHeader(ObjectInputStream.java:885)
  at java.io.ObjectInputStream.<init>(ObjectInputStream.java:348)
  at backtype.storm.serialization.DefaultSerializationDelegate.deserialized(DefaultSerializationDelegate.java:51)
  ... 23 common frames omitted
2015-04-29T10:36:34.096+0000 b.s.util [ERROR] Halting process: ("Error when processing an event")
java.lang.RuntimeException: ("Error when processing an event")
  at backtype.storm.util$exit_process_BANG_.doInvoke(util.clj:325)
  at clojure.lang.RestFn.invoke(RestFn.java:423)
  at backtype.storm.event$event_manager$fn__2467.invoke(event.clj:48)
  at clojure.lang.AFn.run(AFn.java:24)
  at java.lang.Thread.run(Thread.java:853)

我猜这个错误与分配给现在已损坏的主管的数据有关。处理损坏数据的最佳方法是什么?我是Storm的新手,只知道它的基本信息。

风暴0.9.3 Java - IBM J9 VM(build 2.7,JRE 1.7.0 Linux PPC64-64)

2 个答案:

答案 0 :(得分:3)

所以在worker目录下有文件。这些文件已损坏,我不得不删除workers目录下的所有内容。然后我重新启动了主管,这又开始了。

答案 1 :(得分:0)

只是添加更多信息。

conf/storm.yaml中,您将获得storm.local.dir的位置。对我而言,它设置为/var/storm。在这个目录里,你会发现工人的心跳,风暴文件......

尝试停止风暴管理员,删除workers目录中的所有数据,然后重新启动主管。如果此dosnt有助于尝试删除storm.local.dir中的所有文件。