Ejemplos de SampleCleanHiveTableOps en Java

Lenguaje de programación: Java

Clase / Tipo: SampleCleanHiveTableOps

Ejemplos en hotexamples.com: 5

Java SampleCleanHiveTableOps - 5 ejemplos encontrados. Estos son los ejemplos en Java del mundo real mejor valorados de SampleCleanHiveTableOps extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

wherePredicate(2)

groupBy(2)

accessAttr(1)

attrDifference(1)

copyTableTo(1)

createTableAs(1)

createTypedTableWithCSV(1)

materializeUDTFView(1)

rightOuterEquiJoin(1)

withSampling(1)

Ejemplo n.º 1

0

Mostrar archivo

Archivo: SampleCleanQueryBuilder.java Proyecto: sjyk/hive_blinkdb

 public String normalizedSCQuery(
     String sampleName,
     String aggFunc,
     String attribute,
     String predicate,
     String groupBy,
     ArrayList<String> schema,
     long sampleSize,
     long datasetSize) {
   if (aggFunc.equalsIgnoreCase("COUNT") || aggFunc.equalsIgnoreCase("SUM"))
     return "SELECT approx_sum_clean("
         + tableOperator.attrDifference(sampleName + "_dirty ", sampleName + "_clean ", attribute)
         + " , "
         + tableOperator.accessAttr(sampleName + "_clean", "dup")
         + " , "
         + sampleSize
         + " , "
         + datasetSize
         + ") "
         + tableOperator.rightOuterEquiJoin(sampleName + "_dirty", sampleName + "_clean", "hash")
         + tableOperator.wherePredicate(predicate, sampleName + "_clean", schema)
         + tableOperator.groupBy(groupBy, sampleName + "_clean", schema);
   else
     return "SELECT approx_"
         + aggFunc
         + "_clean("
         + tableOperator.attrDifference(sampleName + "_dirty ", sampleName + "_clean ", attribute)
         + " , "
         + tableOperator.accessAttr(sampleName + "_clean", "dup")
         + ") "
         + tableOperator.rightOuterEquiJoin(sampleName + "_dirty", sampleName + "_clean", "hash")
         + tableOperator.wherePredicate(predicate, sampleName + "_clean", schema)
         + tableOperator.groupBy(groupBy, sampleName + "_clean", schema);
 }

Ejemplo n.º 2

0

Mostrar archivo

Archivo: SampleCleanQueryBuilder.java Proyecto: sjyk/hive_blinkdb

 public String rawSCQuery(
     String sampleName,
     String aggFunc,
     String attribute,
     String predicate,
     String groupBy,
     ArrayList<String> schema,
     long sampleSize,
     long datasetSize) {
   if (aggFunc.equalsIgnoreCase("COUNT") || aggFunc.equalsIgnoreCase("SUM"))
     return "SELECT approx_"
         + aggFunc
         + "_clean("
         + attribute
         + " , dup ,"
         + sampleSize
         + " , "
         + datasetSize
         + " ) FROM "
         + sampleName
         + "_clean "
         + tableOperator.wherePredicate(predicate)
         + tableOperator.groupBy(groupBy);
   else
     return "SELECT approx_"
         + aggFunc
         + "_clean("
         + attribute
         + " , dup) FROM "
         + sampleName
         + "_clean "
         + tableOperator.wherePredicate(predicate)
         + tableOperator.groupBy(groupBy);
 }

Ejemplo n.º 3

0

Mostrar archivo

Archivo: SampleCleanQueryBuilder.java Proyecto: sjyk/hive_blinkdb

  public String createSample(
      String sampleName, String baseTable, ArrayList<String> schema, double samplingProb) {
    ArrayList<String> sampleCleanExtraSchema = new ArrayList<String>();
    sampleCleanExtraSchema.add("hash");
    sampleCleanExtraSchema.add("dup");

    return tableOperator.createTableAs(
            sampleName + "_dirty",
            tableOperator.materializeUDTFView(
                "clean_export", baseTable, schema, sampleCleanExtraSchema))
        + tableOperator.withSampling(samplingProb);
  }

Ejemplo n.º 4

0

Mostrar archivo

Archivo: SampleCleanQueryBuilder.java Proyecto: sjyk/hive_blinkdb

  public String createEmptyCleanTable(
      String sampleName, String baseTable, ArrayList<String> schema) {
    ArrayList<String> sampleCleanExtraSchema = new ArrayList<String>();
    sampleCleanExtraSchema.add("hash");
    sampleCleanExtraSchema.add("dup");
    sampleCleanExtraSchema.addAll(schema);

    ArrayList<String> types = new ArrayList<String>();
    types.add("string");
    types.add("int");

    for (int i = 0; i < schema.size(); i++) types.add("string");

    return tableOperator.createTypedTableWithCSV(
        sampleName + "_clean", sampleCleanExtraSchema, types);
  }

Ejemplo n.º 5

0

Mostrar archivo

Archivo: SampleCleanQueryBuilder.java Proyecto: sjyk/hive_blinkdb

 public String copyDirtyToClean(String sampleName) {
   return tableOperator.copyTableTo(sampleName + "_dirty", sampleName + "_clean");
 }