Java BasicTableOutputFormat.setSortInfo示例

编程语言: Java

命名空间/包名称: org.apache.hadoop.zebra.mapred

方法/功能: setSortInfo

hotexamples.com的示例: 1

Java BasicTableOutputFormat.setSortInfo - 已找到1个示例。这些是从开源项目中提取的最受好评的org.apache.hadoop.zebra.mapred.BasicTableOutputFormat.setSortInfo现实Java示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

close(1)

getSchema(1)

getSortKey(1)

getSortKeyGenerator(1)

setMultipleOutputs(1)

setSchema(1)

setSortInfo(1)

setStorageHint(1)

示例#1

显示文件

文件： TestMultipleOutputs4.java 项目： kidaak/Hadoop-MapReduce-1

  public void runMR(String myMultiLocs, String sortKey)
      throws ParseException, IOException, Exception, org.apache.hadoop.zebra.parser.ParseException {

    JobConf jobConf = new JobConf(conf);
    jobConf.setJobName("TestMultipleOutputs4");
    jobConf.setJarByClass(TestMultipleOutputs4.class);
    jobConf.set("table.output.tfile.compression", "gz");
    jobConf.set("sortKey", sortKey);
    // input settings
    jobConf.setInputFormat(TextInputFormat.class);
    jobConf.setMapperClass(TestMultipleOutputs4.MapClass.class);
    jobConf.setMapOutputKeyClass(BytesWritable.class);
    jobConf.setMapOutputValueClass(ZebraTuple.class);
    FileInputFormat.setInputPaths(jobConf, inputPath);

    jobConf.setNumMapTasks(1);

    // output settings

    jobConf.setOutputFormat(BasicTableOutputFormat.class);
    BasicTableOutputFormat.setMultipleOutputs(
        jobConf, myMultiLocs, TestMultipleOutputs4.OutputPartitionerClass.class);

    // set the logical schema with 2 columns
    BasicTableOutputFormat.setSchema(jobConf, "word:string, count:int");
    // for demo purposes, create 2 physical column groups
    BasicTableOutputFormat.setStorageHint(jobConf, "[word];[count]");
    BasicTableOutputFormat.setSortInfo(jobConf, sortKey);
    System.out.println("in runMR, sortkey: " + sortKey);
    // set map-only job.
    jobConf.setNumReduceTasks(1);
    JobClient.runJob(jobConf);
    BasicTableOutputFormat.close(jobConf);
  }