Java RegexRule 예제들

프로그래밍 언어: Java

네임스페이스/패키지 이름: net.sf.okapi.steps.tokenization.common

클래스/타입: RegexRule

hotexamples.com에서의 예제들: 2

Java RegexRule - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Java의 net.sf.okapi.steps.tokenization.common.RegexRule에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

getInTokenIDs(1)

getKeepInput(1)

getLexemId(1)

getPattern(1)

getRegexGroup(1)

getRegexOptions(1)

예제 #1

파일 보기

파일: TokenScanner.java 프로젝트: asgeirf/okapi

  public Lexems process(String text, LocaleId language, Tokens tokens) {

    Lexems lexems = new Lexems();

    for (LexerRule item : rules) {

      RegexRule rule = (RegexRule) item;

      if (!checkRule(rule, language)) continue;

      List<Integer> inTokenIDs = rule.getInTokenIDs();

      Pattern pattern = patterns.get(rule);
      if (pattern == null) continue;

      for (Token token : tokens) {

        // if (token.isDeleted()) continue;

        if (inTokenIDs.contains(token.getTokenId())) {

          Range r = token.getRange();
          Matcher matcher = pattern.matcher(token.getValue());
          int groupIndex = rule.getRegexGroup();

          while (matcher.find()) {

            int start = matcher.start(groupIndex);
            int end = matcher.end(groupIndex);

            if (start > -1 && end > -1) {

              Lexem lexem =
                  new Lexem(
                      rule.getLexemId(), matcher.group(groupIndex), r.start + start, r.start + end);
              lexem.setAnnotation(new InputTokenAnnotation(token));
              lexem.setImmutable(true);
              lexems.add(lexem);

              if (!rule.getKeepInput())
                token
                    .delete(); // Delete the original token, other rules are still able to extract
                               // parts of it
            }
          }
        }
      }
    }

    return lexems;
  }

예제 #2

파일 보기

파일: TokenScanner.java 프로젝트: asgeirf/okapi

  @Override
  protected void lexer_init() {

    patterns = new LinkedHashMap<LexerRule, Pattern>();
    rules = getRules();

    for (LexerRule item : rules) {

      RegexRule rule = (RegexRule) item;

      Pattern pattern = null;
      if (rule.getPattern() != null)
        pattern = Pattern.compile(rule.getPattern(), rule.getRegexOptions());

      patterns.put(rule, pattern);
    }
  }