Hadoop外部罐子

时间:2015-01-16 23:57:27

标签: java hadoop jar hdfs

我正在尝试在服务器上运行hadoop作业。版本为0.20.2

我有大量的罐子,我正在运行:

hadoop jar GenData.jar -libjars /path/jar1,path/jar2,...

即使相应的类在jar中,我也会收到以下错误:

  

线程中的异常" main" java.lang.NoClassDefFoundError:   org / apache / avro / mapreduce / AvroKeyInputFormat at   GenerateTrainningData.main(GenerateTrainningData.java:256)at   sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)at   sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)     在   sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)     在java.lang.reflect.Method.invoke(Method.java:606)at   org.apache.hadoop.util.RunJar.main(RunJar.java:197)引起:   抛出java.lang.ClassNotFoundException:   org.apache.avro.mapreduce.AvroKeyInputFormat at   java.net.URLClassLoader $ 1.run(URLClassLoader.java:366)at   java.net.URLClassLoader $ 1.run(URLClassLoader.java:355)at   java.security.AccessController.doPrivileged(Native Method)at   java.net.URLClassLoader.findClass(URLClassLoader.java:354)at   java.lang.ClassLoader.loadClass(ClassLoader.java:425)at   java.lang.ClassLoader.loadClass(ClassLoader.java:358)

2 个答案:

答案 0 :(得分:1)

看起来你从Hadoop客户端获得此异常,Mapreduce驱动程序代码执行发生在Client JVM中。在hadoop -libjars中是一个通用选项,用于向mapper / reducer添加依赖jar。在您将Jars添加到客户端集的情况下,您可以在执行hadoop命令之前设置以下环境变量。

export HADOOP_CLASSPATH=<PATH_to_jar>/Jar1:<PATH_to_jar>/Jar2;    

(冒号&#34;:&#34;可用于指定多个1个罐子,在您的情况下,您可以添加包含类org.apache.avro.mapreduce.AvroKeyInputFormat的Jar)。

新修改

首先,您需要找到包含类org.apache.avro.mapreduce.AvroKeyInputFormat的jar。您可以使用上面的命令在jar avro-mapred*.jar中找到该类(从互联网获取avro-mapred-version.jar的兼容版本),在类路径中包含相同的内容。

答案 1 :(得分:0)

您缺少avro-mapred依赖项。