Exemplos de IndexReader.getTermVectors em Java

Linguagem de programação: Java

Espaço para nome / nome do pacote: org.apache.lucene.index

Classe / Tipo: IndexReader

Método / Função: getTermVectors

Exemplos em hotexamples.com: 3

IndexReader.getTermVectors em Java - 3 exemplos encontrados. Esses são os exemplos do mundo real mais bem avaliados de org.apache.lucene.index.IndexReader.getTermVectors em Java extraídos de projetos de código aberto. Você pode avaliar os exemplos para nos ajudar a melhorar a qualidade deles.

Métodos Frequentes

Exibir Ocultar

close(30)

open(30)

numDocs(30)

maxDoc(30)

document(30)

terms(28)

leaves(23)

termDocs(22)

docFreq(21)

isDeleted(14)

hasDeletions(13)

indexExists(12)

getTermFreqVector(8)

norms(8)

getSequentialSubReaders(7)

getContext(7)

getTermVector(7)

termPositions(6)

deleteDocument(6)

getFieldNames(6)

getVersion(5)

deleteDocuments(5)

isCurrent(4)

ensureOpen(4)

isOptimized(4)

flush(4)

directory(4)

lastModified(3)

getFieldCacheKey(3)

getTermVectors(3)

getSumTotalTermFreq(3)

getDocCount(3)

decRef(3)

undeleteAll(3)

openIfChanged(2)

reportCloseToParentReaders(2)

termDocsEnum(2)

termPositionsEnum(2)

totalTermFreq(2)

unlock(2)

hasNorms(2)

isLocked(2)

getDeletedDocs(2)

hashCode(2)

equals(2)

getCoreCacheKey(2)

getTermFreqVectors(2)

getCurrentVersion(2)

closedByChild(1)

doClose(1)

Métodos Frequentes

close (30)

open (30)

numDocs (30)

maxDoc (30)

document (30)

terms (28)

leaves (23)

termDocs (22)

docFreq (21)

isDeleted (14)

Métodos Frequentes

hasDeletions (13)

indexExists (12)

getTermFreqVector (8)

norms (8)

getSequentialSubReaders (7)

getContext (7)

getTermVector (7)

termPositions (6)

deleteDocument (6)

getFieldNames (6)

getVersion (5)

deleteDocuments (5)

isCurrent (4)

ensureOpen (4)

isOptimized (4)

flush (4)

directory (4)

lastModified (3)

getFieldCacheKey (3)

getTermVectors (3)

Métodos Frequentes

getVersion (5)

deleteDocuments (5)

isCurrent (4)

ensureOpen (4)

isOptimized (4)

flush (4)

directory (4)

lastModified (3)

getFieldCacheKey (3)

getTermVectors (3)

getSumTotalTermFreq (3)

getDocCount (3)

decRef (3)

undeleteAll (3)

openIfChanged (2)

reportCloseToParentReaders (2)

termDocsEnum (2)

termPositionsEnum (2)

totalTermFreq (2)

unlock (2)

hasNorms (2)

isLocked (2)

getDeletedDocs (2)

hashCode (2)

equals (2)

getCoreCacheKey (2)

getTermFreqVectors (2)

getCurrentVersion (2)

closedByChild (1)

doClose (1)

Related in langs

reason_require_once (PHP)

lassospkit_userid (PHP)

PlayersViewModel (C#)

IWebFormsCodeGroupNodeFactory (C#)

doupdate (C++)

extents (C++)

NewConfigFactory (Go)

DeviceIDFromBytes (Go)

set_reboot_trigger (Python)

TransmissionRPCValue (Python)

Métodos Frequentes

getSumTotalTermFreq (3)

getDocCount (3)

decRef (3)

undeleteAll (3)

openIfChanged (2)

reportCloseToParentReaders (2)

termDocsEnum (2)

termPositionsEnum (2)

totalTermFreq (2)

unlock (2)

hasNorms (2)

isLocked (2)

getDeletedDocs (2)

hashCode (2)

equals (2)

getCoreCacheKey (2)

getTermFreqVectors (2)

getCurrentVersion (2)

closedByChild (1)

doClose (1)

getCommitUserData (1)

termFreq (1)

setNorm (1)

setTermInfosIndexDivisor (1)

notifyReaderClosedListeners (1)

reopen (1)

removeReaderClosedListener (1)

readerFinishedListeners (1)

getTermInfosIndexDivisor (1)

clone (1)

numDeletedDocs (1)

addReaderClosedListener (1)

Relacionados

ModuleChunk

OutgoingPacketHandler

ILuposToken

HttpRequester

FailedRerouteAllocation

TypedOption

MetricTransformationJsonMarshaller

UITreeNode

StringMaker

PsiTreeUtil

Exemplo n.º 1

0

Exibir arquivo

Arquivo: MoreLikeThis.java Projeto: RainingWang/lucene-solr

/** * Find words for a more-like-this query former. * * @param docNum the id of the lucene document from which to find terms */ private PriorityQueue<ScoreTerm> retrieveTerms(int docNum) throws IOException { Map<String, Map<String, Int>> field2termFreqMap = new HashMap<>(); for (String fieldName : fieldNames) { final Fields vectors = ir.getTermVectors(docNum); final Terms vector; if (vectors != null) { vector = vectors.terms(fieldName); } else { vector = null; } // field does not store term vector info if (vector == null) { Document d = ir.document(docNum); IndexableField[] fields = d.getFields(fieldName); for (IndexableField field : fields) { final String stringValue = field.stringValue(); if (stringValue != null) { addTermFrequencies(new StringReader(stringValue), field2termFreqMap, fieldName); } } } else { addTermFrequencies(field2termFreqMap, vector, fieldName); } } return createQueue(field2termFreqMap); }

Exemplo n.º 2

0

Exibir arquivo

Arquivo: InspectIndex.java Projeto: laosiaudi/CMU-11642-Project

/* * listTermVectors displays the term vectors for all of the fields * in a document in an index (specified by reader). */ static void listTermVectors(IndexReader reader, String docidString) throws IOException { System.out.println("\nTermVector: docid " + docidString); int docid = Integer.parseInt(docidString); if ((docid < 0) || (docid >= reader.numDocs())) { System.out.println("ERROR: " + docidString + " is a bad document id."); return; } ; /* * Iterate over the fields in this document. */ Fields fields = reader.getTermVectors(docid); Iterator<String> fieldIterator = fields.iterator(); while (fieldIterator.hasNext()) { String fieldName = fieldIterator.next(); System.out.println(" Field: " + fieldName); Terms terms = fields.terms(fieldName); termVectorDisplay(terms); } ; }

Exemplo n.º 3

0

Exibir arquivo

Arquivo: TermVectorComponent.java Projeto: netboynb/search-core

@Override public void process(ResponseBuilder rb) throws IOException { SolrParams params = rb.req.getParams(); if (!params.getBool(COMPONENT_NAME, false)) { return; } NamedList<Object> termVectors = new NamedList<Object>(); rb.rsp.add(TERM_VECTORS, termVectors); IndexSchema schema = rb.req.getSchema(); SchemaField keyField = schema.getUniqueKeyField(); String uniqFieldName = null; if (keyField != null) { uniqFieldName = keyField.getName(); termVectors.add("uniqueKeyFieldName", uniqFieldName); } FieldOptions allFields = new FieldOptions(); // figure out what options we have, and try to get the appropriate vector allFields.termFreq = params.getBool(TermVectorParams.TF, false); allFields.positions = params.getBool(TermVectorParams.POSITIONS, false); allFields.offsets = params.getBool(TermVectorParams.OFFSETS, false); allFields.docFreq = params.getBool(TermVectorParams.DF, false); allFields.tfIdf = params.getBool(TermVectorParams.TF_IDF, false); // boolean cacheIdf = params.getBool(TermVectorParams.IDF, false); // short cut to all values. if (params.getBool(TermVectorParams.ALL, false)) { allFields.termFreq = true; allFields.positions = true; allFields.offsets = true; allFields.docFreq = true; allFields.tfIdf = true; } // Build up our per field mapping Map<String, FieldOptions> fieldOptions = new HashMap<String, FieldOptions>(); NamedList<List<String>> warnings = new NamedList<List<String>>(); List<String> noTV = new ArrayList<String>(); List<String> noPos = new ArrayList<String>(); List<String> noOff = new ArrayList<String>(); Set<String> fields = getFields(rb); if (null != fields) { // we have specific fields to retrieve, or no fields for (String field : fields) { // workarround SOLR-3523 if (null == field || "score".equals(field)) continue; // we don't want to issue warnings about the uniqueKey field // since it can cause lots of confusion in distributed requests // where the uniqueKey field is injected into the fl for merging final boolean fieldIsUniqueKey = field.equals(uniqFieldName); SchemaField sf = schema.getFieldOrNull(field); if (sf != null) { if (sf.storeTermVector()) { FieldOptions option = fieldOptions.get(field); if (option == null) { option = new FieldOptions(); option.fieldName = field; fieldOptions.put(field, option); } // get the per field mappings option.termFreq = params.getFieldBool(field, TermVectorParams.TF, allFields.termFreq); option.docFreq = params.getFieldBool(field, TermVectorParams.DF, allFields.docFreq); option.tfIdf = params.getFieldBool(field, TermVectorParams.TF_IDF, allFields.tfIdf); // Validate these are even an option option.positions = params.getFieldBool(field, TermVectorParams.POSITIONS, allFields.positions); if (option.positions && !sf.storeTermPositions() && !fieldIsUniqueKey) { noPos.add(field); } option.offsets = params.getFieldBool(field, TermVectorParams.OFFSETS, allFields.offsets); if (option.offsets && !sf.storeTermOffsets() && !fieldIsUniqueKey) { noOff.add(field); } } else { // field doesn't have term vectors if (!fieldIsUniqueKey) noTV.add(field); } } else { // field doesn't exist throw new SolrException(SolrException.ErrorCode.BAD_REQUEST, "undefined field: " + field); } } } // else, deal with all fields // NOTE: currently all typs of warnings are schema driven, and garunteed // to be consistent across all shards - if additional types of warnings // are added that might be differnet between shards, finishStage() needs // to be changed to account for that. boolean hasWarnings = false; if (!noTV.isEmpty()) { warnings.add("noTermVectors", noTV); hasWarnings = true; } if (!noPos.isEmpty()) { warnings.add("noPositions", noPos); hasWarnings = true; } if (!noOff.isEmpty()) { warnings.add("noOffsets", noOff); hasWarnings = true; } if (hasWarnings) { termVectors.add("warnings", warnings); } DocListAndSet listAndSet = rb.getResults(); List<Integer> docIds = getInts(params.getParams(TermVectorParams.DOC_IDS)); Iterator<Integer> iter; if (docIds != null && !docIds.isEmpty()) { iter = docIds.iterator(); } else { DocList list = listAndSet.docList; iter = list.iterator(); } SolrIndexSearcher searcher = rb.req.getSearcher(); IndexReader reader = searcher.getIndexReader(); // the TVMapper is a TermVectorMapper which can be used to optimize loading of Term Vectors // Only load the id field to get the uniqueKey of that // field final String finalUniqFieldName = uniqFieldName; final List<String> uniqValues = new ArrayList<String>(); // TODO: is this required to be single-valued? if so, we should STOP // once we find it... final StoredFieldVisitor getUniqValue = new StoredFieldVisitor() { @Override public void stringField(FieldInfo fieldInfo, String value) { uniqValues.add(value); } @Override public void intField(FieldInfo fieldInfo, int value) { uniqValues.add(Integer.toString(value)); } @Override public void longField(FieldInfo fieldInfo, long value) { uniqValues.add(Long.toString(value)); } @Override public Status needsField(FieldInfo fieldInfo) { return (fieldInfo.name.equals(finalUniqFieldName)) ? Status.YES : Status.NO; } }; TermsEnum termsEnum = null; while (iter.hasNext()) { Integer docId = iter.next(); NamedList<Object> docNL = new NamedList<Object>(); if (keyField != null) { reader.document(docId, getUniqValue); String uniqVal = null; if (uniqValues.size() != 0) { uniqVal = uniqValues.get(0); uniqValues.clear(); docNL.add("uniqueKey", uniqVal); termVectors.add(uniqVal, docNL); } } else { // support for schemas w/o a unique key, termVectors.add("doc-" + docId, docNL); } if (null != fields) { for (Map.Entry<String, FieldOptions> entry : fieldOptions.entrySet()) { final String field = entry.getKey(); final Terms vector = reader.getTermVector(docId, field); if (vector != null) { termsEnum = vector.iterator(termsEnum); mapOneVector(docNL, entry.getValue(), reader, docId, vector.iterator(termsEnum), field); } } } else { // extract all fields final Fields vectors = reader.getTermVectors(docId); for (String field : vectors) { Terms terms = vectors.terms(field); if (terms != null) { termsEnum = terms.iterator(termsEnum); mapOneVector(docNL, allFields, reader, docId, termsEnum, field); } } } } }