【新闻门户源码】【菜鸟电子面单自定义源码】【外包源码问题解决方案】TextOutputFormat源码-皮皮网

【新闻门户源码】【菜鸟电子面单自定义源码】【外包源码问题解决方案】TextOutputFormat源码

2025-01-20 12:04:10 来源：编译xp泄露源码分类：娱乐

1.å¦ä½å¨win7ä¸çeclipseä¸è°è¯Hadoop2.2.0çç¨åº
2.hiveåå¨parquetè¡¨

TextOutputFormat源码

å¦ä½å¨win7ä¸çeclipseä¸è°è¯Hadoop2.2.0çç¨åº

ä¸é¢å¼å§è¿å¥æ£é¢:

åºå· åç§° æè¿°

1 eclipse Juno Service Release 4.2çæ¬

2 æä½ç³»ç» Windows7

3 hadoopçeclipseæä»¶ hadoop-eclipse-plugin-2.2.0.jar

4 hadoopçéç¾¤ç¯å¢ èææºLinuxçCentos6.5åæºä¼ªåå¸å¼

5 è°è¯ç¨åº Hellow World

éå°çå ä¸ªé®é¢å¦ä¸ï¼

Javaä»£ç

java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries.

è§£å³åæ³:

å¨org.apache.hadoop.util.Shellç±»çcheckHadoopHome()æ¹æ³çè¿åå¼éååºå®ç

æ¬æºhadoopçè·¯å¾ï¼æ£ä»å¨è¿éæ´æ¹å¦ä¸ï¼

Javaä»£ç

private static String checkHadoopHome() {

// first check the Dflag hadoop.home.dir with JVM scope

//System.setProperty("hadoop.home.dir", "...");

String home = System.getProperty("hadoop.home.dir");

// fall back to the system/user-global env variable

if (home == null) {

home = System.getenv("HADOOP_HOME");

}

try {

// couldn't find either setting for hadoop's home directory

if (home == null) {

throw new IOException("HADOOP_HOME or hadoop.home.dir are not set.");

}

if (home.startsWith("\"") && home.endsWith("\"")) {

home = home.substring(1, home.length()-1);

}

// check that the home setting is actually a directory that exists

File homedir = new File(home);

if (!homedir.isAbsolute() || !homedir.exists() || !homedir.isDirectory()) {

throw new IOException("Hadoop home directory " + homedir

+ " does not exist, is not a directory, or is not an absolute path.");

}

home = homedir.getCanonicalPath();

} catch (IOException ioe) {

if (LOG.isDebugEnabled()) {

LOG.debug("Failed to detect a valid hadoop home directory", ioe);

}

home = null;

}

//åºå®æ¬æºçhadoopå°å

home="D:\\hadoop-2.2.0";

return home;

}

ç¬¬äºä¸ªå¼å¸¸ï¼Could not locate executable D:\Hadoop\tar\hadoop-2.2.0\hadoop-2.2.0\bin\winutils.exe in the Hadoop binaries. æ¾ä¸å°winä¸çæ§è¡ç¨åºï¼å¯ä»¥å»ä¸è½½binåï¼è¦çæ¬æºçhadoopè·ç®å½ä¸çbinåå³å¯

ç¬¬ä¸ä¸ªå¼å¸¸ï¼

Javaä»£ç

Exception in thread "main" java.lang.IllegalArgumentException: Wrong FS: hdfs://...:/user/hmail/output/part-, expected: file:///

at org.apache.hadoop.fs.FileSystem.checkPath(FileSystem.java:)

at org.apache.hadoop.fs.RawLocalFileSystem.pathToFile(RawLocalFileSystem.java:)

at org.apache.hadoop.fs.RawLocalFileSystem.getFileStatus(RawLocalFileSystem.java:)

at org.apache.hadoop.fs.FilterFileSystem.getFileStatus(FilterFileSystem.java:)

at org.apache.hadoop.fs.ChecksumFileSystem$ChecksumFSInputChecker.<init>(ChecksumFileSystem.java:)

at org.apache.hadoop.fs.ChecksumFileSystem.open(ChecksumFileSystem.java:)

at org.apache.hadoop.fs.FileSystem.open(FileSystem.java:)

at com.netease.hadoop.HDFSCatWithAPI.main(HDFSCatWithAPI.java:)

ç¬¬åä¸ªå¼å¸¸ï¼

Javaä»£ç

Exception in thread "main" java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO$Windows.access0(Ljava/lang/String;I)Z

(2)å¨ç³»ç»åéçPathéï¼è¿½å %HADOOP_HOME%/binå³å¯

Javaä»£ç

package com.qin.wordcount;

import java.io.IOException;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapred.JobConf;

import org.apache.hadoop.mapreduce.Job;

import org.apache.hadoop.mapreduce.Mapper;

import org.apache.hadoop.mapreduce.Reducer;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

import org.apache.hadoop.mapreduce.lib.input.TextInputFormat;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import org.apache.hadoop.mapreduce.lib.output.TextOutputFormat;

/***

* Hadoop2.2.0æµè¯

* æ¾WordCountçä¾å

* @author qindongliang

* hadoopææ¯äº¤æµç¾¤ï¼

* */

public class MyWordCount {

/**

* Mapper

* **/

private static class WMapper extends Mapper<LongWritable, Text, Text, IntWritable>{

private IntWritable count=new IntWritable(1);

private Text text=new Text();

@Override

protected void map(LongWritable key, Text value,Context context)

throws IOException, InterruptedException {

String values[]=value.toString().split("#");

//System.out.println(values[0]+"========"+values[1]);

count.set(Integer.parseInt(values[1]));

text.set(values[0]);

context.write(text,count);

}

/**

* Reducer

* **/

private static class WReducer extends Reducer<Text, IntWritable, Text, Text>{

private Text t=new Text();

@Override

protected void reduce(Text key, Iterable<IntWritable> value,Context context)

throws IOException, InterruptedException {

int count=0;

for(IntWritable i:value){

count+=i.get();

}

t.set(count+"");

context.write(key,t);

}

/**

* æ¹å¨ä¸

* (1)shellæºç éæ·»å checkHadoopHomeçè·¯å¾

* (2)è¡ï¼FileUtilséé¢

* **/

public static void main(String[] args) throws Exception{

// String path1=System.getenv("HADOOP_HOME");

// System.out.println(path1);

// System.exit(0);

JobConf conf=new JobConf(MyWordCount.class);

//Configuration conf=new Configuration();

//conf.set("mapred.job.tracker","...:");

//è¯»åpersonä¸çæ°æ®åæ®µ

// conf.setJar("tt.jar");

//æ³¨æè¿è¡ä»£ç æ¾å¨æåé¢ï¼è¿è¡åå§åï¼å¦åä¼æ¥

/**Jobä»»å¡**/

Job job=new Job(conf, "testwordcount");

job.setJarByClass(MyWordCount.class);

System.out.println("æ¨¡å¼ï¼ "+conf.get("mapred.job.tracker"));;

// job.setCombinerClass(PCombine.class);

// job.setNumReduceTasks(3);//è®¾ç½®ä¸º3

job.setMapperClass(WMapper.class);

job.setReducerClass(WReducer.class);

job.setInputFormatClass(TextInputFormat.class);

job.setOutputFormatClass(TextOutputFormat.class);

job.setMapOutputKeyClass(Text.class);

job.setMapOutputValueClass(IntWritable.class);

job.setOutputKeyClass(Text.class);

job.setOutputValueClass(Text.class);

String path="hdfs://...:/qin/output";

FileSystem fs=FileSystem.get(conf);

Path p=new Path(path);

if(fs.exists(p)){

fs.delete(p, true);

System.out.println("è¾åºè·¯å¾åå¨ï¼å·²å é¤ï¼");

}

FileInputFormat.setInputPaths(job, "hdfs://...:/qin/input");

FileOutputFormat.setOutputPath(job,p );

System.exit(job.waitForCompletion(true) ? 0 : 1);

}

æ§å¶å°ï¼æå°æ¥å¿å¦ä¸ï¼

Javaä»£ç

INFO - Configuration.warnOnceIfDeprecated() | mapred.job.tracker is deprecated. Instead, use mapreduce.jobtracker.address

æ¨¡å¼ï¼ local

è¾åºè·¯å¾åå¨ï¼å·²å é¤ï¼

INFO - Configuration.warnOnceIfDeprecated() | session.id is deprecated. Instead, use dfs.metrics.session-id

INFO - JvmMetrics.init() | Initializing JVM Metrics with processName=JobTracker, sessionId=

WARN - JobSubmitter.copyAndConfigureFiles() | Hadoop command-line option parsing not performed. Implement the Tool interface and execute your application with ToolRunner to remedy this.

WARN - JobSubmitter.copyAndConfigureFiles() | No job jar file set. User classes may not be found. See Job or Job#setJar(String).

INFO - FileInputFormat.listStatus() | Total input paths to process : 1

INFO - JobSubmitter.submitJobInternal() | number of splits:1

INFO - Configuration.warnOnceIfDeprecated() | user.name is deprecated. Instead, use mapreduce.job.user.name

INFO - Configuration.warnOnceIfDeprecated() | mapred.output.value.class is deprecated. Instead, use mapreduce.job.output.value.class

INFO - Configuration.warnOnceIfDeprecated() | mapred.mapoutput.value.class is deprecated. Instead, use mapreduce.map.output.value.class

INFO - Configuration.warnOnceIfDeprecated() | mapreduce.map.class is deprecated. Instead, use mapreduce.job.map.class

INFO - C

hiveåå¨parquetè¡¨

è¿éä½¿ç¨oracleçempè¡¨

å è½½æ¬å°æ°æ®å°hiveè¡¨

æ§è¡æ¥è¯¢

åç°æ¥é

empä½¿ç¨parquetæ ¼å¼åå¨ï¼å¶ä¸imputFormatåoutputFormaté½æ¯parquetçç¸å³çï¼ä¹å°±æ¯æçimputFormatæ¯parquentçï¼ä½æ¯ä½ ä¼ è¿æ¥çæ¯textï¼æä¸è®¤è¯

æ¥çemp_tmpçè¡¨çä¿¡æ¯,è¿éå¯ä»¥çå°ï¼é»è®¤çæ¯TextImputFormatåTextOutputFormatçã

ç¶åå è½½æ°æ®å°emp_tmp,æ¥çæ°æ®ï¼æ¯æ£å¸¸æ¾ç¤ºç

ç¶åç°å¨æä¹åçempéé¢çæ°æ®ç»å é¤

ç¶åæemp_tmpè¡¨éé¢çæ°æ®å è½½å°emp

åå»ºemp2è¡¨,æ¯parquetçåå¨æ ¼å¼ç

ä¿®æ¹inputformat åserde,è¿éinputFormatæ¯TextInputFormatï¼SEDEä½¿ç¨çæ¯LazySimpleSerDeï¼Outputformatä»»ç¶æ¯Parquetçï¼è¿ééè¦å¸¦ä¸ã

æ¥çemp2è¡¨çä¿¡æ¯,å¦ä¸å¾è¡¨ç¤ºä¿®æ¹æå

å è½½æ°æ®å°emp2

æ¥è¯¢æ°æ®ï¼æ§è¡æå

è¯å®æäººæ³ä½¿ç¨è¿ä¸ªæ¹æ³

è¿ä¸ªæ¹æ³æä¹å°è¯äºï¼ä½æ¯è¿åçå¼å¨é½æ¯null

【本文网址：http://5o.net.cn/news/5d252997465.html 欢迎转载】

【新闻门户源码】【菜鸟电子面单自定义源码】【外包源码问题解决方案】TextOutputFormat源码

时尚