Ejemplos de Dataset.write en Java

Lenguaje de programación: Java

Namespace/Package Name: org.apache.spark.sql

Clase / Tipo: Dataset

Método / Función: write

Ejemplos en hotexamples.com: 2

Java Dataset.write - 2 ejemplos encontrados. Estos son los ejemplos en Java del mundo real mejor valorados de org.apache.spark.sql.Dataset.write extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

collectAsList(8)

show(4)

groupBy(3)

select(3)

write(2)

printSchema(2)

createOrReplaceTempView(2)

map(2)

flatMap(2)

intersect(1)

joinWith(1)

foreach(1)

mapPartitions(1)

reduce(1)

first(1)

filter(1)

subtract(1)

takeAsList(1)

union(1)

distinct(1)

writeStream(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: JavaSQLDataSourceExample.java Proyecto: ChrisYohann/spark

  private static void runBasicParquetExample(SparkSession spark) {
    // $example on:basic_parquet_example$
    Dataset<Row> peopleDF = spark.read().json("examples/src/main/resources/people.json");

    // DataFrames can be saved as Parquet files, maintaining the schema information
    peopleDF.write().parquet("people.parquet");

    // Read in the Parquet file created above.
    // Parquet files are self-describing so the schema is preserved
    // The result of loading a parquet file is also a DataFrame
    Dataset<Row> parquetFileDF = spark.read().parquet("people.parquet");

    // Parquet files can also be used to create a temporary view and then used in SQL statements
    parquetFileDF.createOrReplaceTempView("parquetFile");
    Dataset<Row> namesDF = spark.sql("SELECT name FROM parquetFile WHERE age BETWEEN 13 AND 19");
    Dataset<String> namesDS =
        namesDF.map(
            new MapFunction<Row, String>() {
              public String call(Row row) {
                return "Name: " + row.getString(0);
              }
            },
            Encoders.STRING());
    namesDS.show();
    // +------------+
    // |       value|
    // +------------+
    // |Name: Justin|
    // +------------+
    // $example off:basic_parquet_example$
  }

Ejemplo n.º 2

Mostrar archivo

Archivo: JavaSQLDataSourceExample.java Proyecto: ChrisYohann/spark

  private static void runParquetSchemaMergingExample(SparkSession spark) {
    // $example on:schema_merging$
    List<Square> squares = new ArrayList<>();
    for (int value = 1; value <= 5; value++) {
      Square square = new Square();
      square.setValue(value);
      square.setSquare(value * value);
      squares.add(square);
    }

    // Create a simple DataFrame, store into a partition directory
    Dataset<Row> squaresDF = spark.createDataFrame(squares, Square.class);
    squaresDF.write().parquet("data/test_table/key=1");

    List<Cube> cubes = new ArrayList<>();
    for (int value = 6; value <= 10; value++) {
      Cube cube = new Cube();
      cube.setValue(value);
      cube.setCube(value * value * value);
      cubes.add(cube);
    }

    // Create another DataFrame in a new partition directory,
    // adding a new column and dropping an existing column
    Dataset<Row> cubesDF = spark.createDataFrame(cubes, Cube.class);
    cubesDF.write().parquet("data/test_table/key=2");

    // Read the partitioned table
    Dataset<Row> mergedDF = spark.read().option("mergeSchema", true).parquet("data/test_table");
    mergedDF.printSchema();

    // The final schema consists of all 3 columns in the Parquet files together
    // with the partitioning column appeared in the partition directory paths
    // root
    //  |-- value: int (nullable = true)
    //  |-- square: int (nullable = true)
    //  |-- cube: int (nullable = true)
    //  |-- key: int (nullable = true)
    // $example off:schema_merging$
  }