Java JavaSparkContext.hadoopConfiguration 예제들

프로그래밍 언어: Java

네임스페이스/패키지 이름: org.apache.spark.api.java

클래스/타입: JavaSparkContext

메소드/함수: hadoopConfiguration

hotexamples.com에서의 예제들: 2

Java JavaSparkContext.hadoopConfiguration - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Java의 org.apache.spark.api.java.JavaSparkContext.hadoopConfiguration에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

textFile(30)

parallelize(30)

stop(25)

close(17)

broadcast(9)

accumulator(7)

sc(7)

addJar(4)

appName(2)

toSparkContext(2)

hadoopConfiguration(2)

jarOfClass(2)

parallelizePairs(2)

sequenceFile(2)

setLogLevel(2)

version(1)

newAPIHadoopFile(1)

addFile(1)

getConf(1)

fromSparkContext(1)

wholeTextFiles(1)

예제 #1

파일 보기

파일: TestSwift.java 프로젝트: FanKurt/spark-example

  public static void main(String[] args) {

    JavaSparkContext sc = new JavaSparkContext();
    Configuration conf = sc.hadoopConfiguration();
    conf.set("fs.swift.impl", "org.apache.hadoop.fs.swift.snative.SwiftNativeFileSystem");
    conf.set("fs.swift.service.test.auth.url", "http://163.17.136.246:5000/v2.0/tokens");
    conf.set("fs.swift.service.test.auth.endpoint.prefix", "endpoints");
    conf.set("fs.swift.service.test.http.port", "8080");
    conf.set("fs.swift.service.test.region", "RegionOne");
    conf.set("fs.swift.service.test.public", "true");
    conf.set("fs.swift.service.test.tenant", "big-data");
    conf.set("fs.swift.service.test.username", "k753357");
    conf.set("fs.swift.service.test.password", "k753357");
    JavaRDD<String> rawRDD = sc.textFile(args[0]);
    rawRDD.saveAsTextFile("swift://testfile.test/file/");
  }

예제 #2

파일 보기

파일: MainRunner.java 프로젝트: donpir/JMATRW

  public static void main(String[] args) {
    SparkConf sparkconf =
        new SparkConf()
            .setAppName("Simple Application")
            .setMaster("spark://1.245.77.10:7077")
            .set(
                "spark.driver.extraClassPath",
                "E:/installprogram/spark-1.5.2-bin-hadoop2.4/libthirdparty/*")
            .set(
                "spark.executor.extraClassPath",
                "E:/installprogram/spark-1.5.2-bin-hadoop2.4/libthirdparty/*")
            .set("fs.default.name", "file:///");
    JavaSparkContext sc = new JavaSparkContext(sparkconf);
    Configuration hadoopConfig = sc.hadoopConfiguration();
    hadoopConfig.set("fs.hdfs.impl", org.apache.hadoop.hdfs.DistributedFileSystem.class.getName());
    hadoopConfig.set("fs.file.impl", org.apache.hadoop.fs.LocalFileSystem.class.getName());
    // sc.addJar("e:/installprogram/spark-1.5.2-bin-hadoop2.4/libthirdparty/jmatrw-0.2.jar");
    // sc.addJar("e:/installprogram/spark-1.5.2-bin-hadoop2.4/libthirdparty/jmatrw4spark-0.2.jar");

    /*JavaRDD<Double> matrdd2 = sc.parallelize(Arrays.asList(1.0, 3.0, 2.0));
    System.out.println("Start counting parallelize...");
    long values = matrdd2.count();
    System.out.println("Value count of parallelize is " + values);*/

    JavaPairRDD<Long, Double> matrdd =
        sc.newAPIHadoopFile(
            "e:/tmp/vecRow03_x256.mat",
            JMATFileInputFormat.class,
            Long.class,
            Double.class,
            hadoopConfig);
    System.out.println("Start job...");
    long values = matrdd.count();
    System.out.println("Value count of hadoop is " + values);

    sc.stop();
    sc.close();
  }