Java LuceneAnalyzer.setPrefixTokensWithInputCol 예제들

프로그래밍 언어: Java

클래스/타입: LuceneAnalyzer

메소드/함수: setPrefixTokensWithInputCol

hotexamples.com에서의 예제들: 1

Java LuceneAnalyzer.setPrefixTokensWithInputCol - 1개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Java의 LuceneAnalyzer.setPrefixTokensWithInputCol에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

setAnalysisSchema(2)

setInputCols(2)

setPrefixTokensWithInputCol(1)

transform(1)

예제 #1

파일 보기

파일: JavaLuceneAnalyzerTest.java 프로젝트: epheatt/spark-solr

  @Test
  public void testPrefixTokensWithInputCol() {
    String[] rawText1 = new String[] {"Harold's NOT around.", "Anymore, I mean."};
    String[] tokens1 = new String[] {"harold's", "not", "around", "anymore", "i", "mean"};

    String[] rawText2 = new String[] {"The dog's nose KNOWS!", "Good, fine, great..."};
    String[] tokens2 = new String[] {"the", "dog's", "nose", "knows", "good", "fine", "great"};

    List<String> tokenList = new ArrayList<>();
    List<String> prefixedTokenList = new ArrayList<>();
    for (String token : tokens1) {
      tokenList.add(token);
      prefixedTokenList.add("rawText1=" + token);
    }
    for (String token : tokens2) {
      tokenList.add(token);
      prefixedTokenList.add("rawText2=" + token);
    }
    String[] tokens = tokenList.toArray(new String[tokenList.size()]);
    String[] prefixedTokens = prefixedTokenList.toArray(new String[prefixedTokenList.size()]);

    // First transform without token prefixes
    LuceneAnalyzer analyzer =
        new LuceneAnalyzer()
            .setInputCols(new String[] {"rawText1", "rawText2"})
            .setOutputCol("tokens");
    assertExpectedTokens(
        analyzer,
        Collections.singletonList(new MV_MV_TokenizerTestData(rawText1, rawText2, tokens)));

    // Then transform with token prefixes
    analyzer.setPrefixTokensWithInputCol(true);
    assertExpectedTokens(
        analyzer,
        Collections.singletonList(new MV_MV_TokenizerTestData(rawText1, rawText2, prefixedTokens)));
  }