Java SentenceIterator示例

编程语言: Java

命名空间/包名称: org.deeplearning4j.word2vec.sentenceiterator

类/类型: SentenceIterator

hotexamples.com的示例: 1

Java SentenceIterator - 已找到1个示例。这些是从开源项目中提取的最受好评的org.deeplearning4j.word2vec.sentenceiterator.SentenceIterator现实Java示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

finish(1)

hasNext(1)

nextSentence(1)

示例#1

显示文件

文件： VocabCreator.java 项目： ksuleman/java-deeplearning

  protected void addForDoc(File doc) {
    Set<String> encountered = new HashSet<String>();
    SentenceIterator iter = new LineSentenceIterator(doc);
    while (iter.hasNext()) {
      String line = iter.nextSentence();
      if (line == null) continue;
      Tokenizer tokenizer = tokenizerFactory.create(new InputHomogenization(line).transform());
      while (tokenizer.hasMoreTokens()) {
        String token = tokenizer.nextToken();
        java.util.regex.Matcher m = punct.matcher(token);
        if (validWord(token)) {
          documentWordFrequencies.incrementCount(token, doc.getAbsolutePath(), 1.0);
          tf.incrementCount(token, 1.0);
          if (!encountered.contains(token)) {
            idf.incrementCount(token, 1.0);
            encountered.add(token);
          }
        }
      }

      iter.finish();
    }
  }