Java TextInputFormat.getSplitsの例

プログラミング言語: Java

名前空間/パッケージ名: org.apache.hadoop.mapreduce.lib.input

クラス/型: TextInputFormat

メソッド/関数: getSplits

hotexamples.comのコード掲載数: 2

Java TextInputFormat.getSplits - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたJavaのorg.apache.hadoop.mapreduce.lib.input.TextInputFormat.getSplitsの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

setInputPaths(8)

addInputPath(2)

getSplits(2)

createRecordReader(1)

コード例 #1

ファイルを表示

ファイル: PartialBuilder.java プロジェクト: hmcl/mahout

  @Override
  protected void configureJob(Job job) throws IOException {
    Configuration conf = job.getConfiguration();

    job.setJarByClass(PartialBuilder.class);

    FileInputFormat.setInputPaths(job, getDataPath());
    FileOutputFormat.setOutputPath(job, getOutputPath(conf));

    job.setOutputKeyClass(TreeID.class);
    job.setOutputValueClass(MapredOutput.class);

    job.setMapperClass(Step1Mapper.class);
    job.setNumReduceTasks(0); // no reducers

    job.setInputFormatClass(TextInputFormat.class);
    job.setOutputFormatClass(SequenceFileOutputFormat.class);

    // For this implementation to work, mapred.map.tasks needs to be set to the actual
    // number of mappers Hadoop will use:
    TextInputFormat inputFormat = new TextInputFormat();
    List<?> splits = inputFormat.getSplits(job);
    if (splits == null || splits.isEmpty()) {
      log.warn("Unable to compute number of splits?");
    } else {
      int numSplits = splits.size();
      log.info("Setting mapred.map.tasks = {}", numSplits);
      conf.setInt("mapred.map.tasks", numSplits);
    }
  }

コード例 #2

ファイルを表示

ファイル: MyInputFormat.java プロジェクト: radi9/mycrawler

  @Override
  public List<InputSplit> getSplits(JobContext context) throws IOException, InterruptedException {

    return textIF.getSplits(context);
  }