Java VocabularyHolder.updateHuffmanCodes Beispiele

Programmiersprache: Java

Namespace / Paketname: org.deeplearning4j.models.word2vec.wordstore

Klasse / Typ: VocabularyHolder

Methode / Funktion: updateHuffmanCodes

Beispiele auf hotexamples.com: 1

Java VocabularyHolder.updateHuffmanCodes - 1 Beispiele gefunden. Dies sind die am besten bewerteten Java Beispiele für die org.deeplearning4j.models.word2vec.wordstore.VocabularyHolder.updateHuffmanCodes, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

transferBackToVocabCache(2)

activateScavenger(1)

getVocabulary(1)

hugeModelExpected(1)

incrementWordCounter(1)

minWordFrequency(1)

retentionDelay(1)

scavengerThreshold(1)

truncateVocabulary(1)

updateHuffmanCodes(1)

Beispiel #1

Datei anzeigen

Datei: VocabularyHolder.java Projekt: aca-singtel/deeplearning4j

  /**
   * Builds VocabularyHolder from VocabCache.
   *
   * <p>Basically we just ignore tokens, and transfer VocabularyWords, supposing that it's already
   * truncated by minWordFrequency.
   *
   * <p>Huffman tree data is ignored and recalculated, due to suspectable flaw in dl4j huffman impl,
   * and it's exsessive memory usage.
   *
   * <p>This code is required for compatibility between dl4j w2v implementation, and standalone w2v
   *
   * @param cache
   */
  protected VocabularyHolder(@NonNull VocabCache cache, boolean markAsSpecial) {
    this.vocabCache = cache;
    for (VocabWord word : cache.tokens()) {
      VocabularyWord vw = new VocabularyWord(word.getWord());
      vw.setCount((int) word.getWordFrequency());

      // since we're importing this word from external VocabCache, we'll assume that this word is
      // SPECIAL, and should NOT be affected by minWordFrequency
      vw.setSpecial(markAsSpecial);

      // please note: we don't transfer huffman data, since proper way is  to recalculate it after
      // new words being added
      if (word.getPoints() != null && !word.getPoints().isEmpty()) {
        vw.setHuffmanNode(
            buildNode(word.getCodes(), word.getPoints(), word.getCodeLength(), word.getIndex()));
      }

      vocabulary.put(vw.getWord(), vw);
    }

    // there's no sense building huffman tree just for UNK word
    if (numWords() > 1) updateHuffmanCodes();
    logger.info("Init from VocabCache is complete. " + numWords() + " word(s) were transferred.");
  }