Java Search.getTermDocPosIndex 예제들

프로그래밍 언어: Java

클래스/타입: Search

메소드/함수: getTermDocPosIndex

hotexamples.com에서의 예제들: 3

Java Search.getTermDocPosIndex - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Java의 Search.getTermDocPosIndex에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

binarySearch(5)

sort(4)

makeIndexArray(4)

getCurrentSearch(4)

nthElement(3)

getTermDocPosIndex(3)

getSearchClass(3)

makePhrase(3)

set(3)

find(2)

distance(2)

fetchDoc(2)

getTotal(2)

findID(2)

occurences(2)

getState(2)

createEmptySearch(2)

rotatedSearch(2)

setMatcher(2)

addAll(2)

setResultMode(2)

squareRoot(1)

naiveSearch2(1)

naiveSearch(1)

minTriplet(1)

maxmin(1)

maxLessThan(1)

matching(1)

setVisible(1)

kmpSearch(1)

steepestAscent(1)

isUpdate(1)

isChosen(1)

isBackward(1)

intialiseIndexing(1)

insertionPoint(1)

trySearch(1)

initialiseSearching(1)

naiveSearch3(1)

setActive(1)

setBio(1)

setExitListener(1)

setConsistencyListener(1)

searchSortedMatrix(1)

setCurrentSearch(1)

searchClasses(1)

searchArtist(1)

setEmail(1)

setExitChildListener(1)

searchAlbum(1)

예제 #1

파일 보기

파일: Search.java 프로젝트: krahman/JSearch

  public List<Integer> getResultWithAND(String query) throws Exception {
    String[] terms = query.split(" ");
    List<Integer> results = new LinkedList<Integer>();
    for (String term : terms) {
      String searchTerm = getStemmedQuery(term);
      int termid = getTermId(searchTerm);
      List<Integer> docs = new LinkedList<Integer>();
      if (termid > 0) {
        TreeMap<Integer, List<Integer>> docpos = null;
        if (!termdocposindex.containsKey(termid)) {
          getTermDocPosIndex(termid);
          docpos = termdocposindex.get(termid);
        } else {
          docpos = termdocposindex.get(termid);
        }
        Iterator docIter = docpos.keySet().iterator();
        Object doc = null;
        while (docIter.hasNext()) {
          doc = docIter.next();
          List<Integer> lpos1 = docpos.get(doc);
          // list of docs
          docs.add((Integer) doc);
        }
      }

      if (results.isEmpty()) results.addAll(docs);
      else results.retainAll(docs);
    }
    return results;
  }

예제 #2

파일 보기

파일: Search.java 프로젝트: krahman/JSearch

  public TreeMap<Double, Integer> calculateTopTenQuery() throws IOException {
    // calculating relevance and irrelevance docs
    ZipInputStream zis;
    FileInputStream fis = null;
    ZipFile zipFile = null;
    ZipEntry ze;
    fis = new FileInputStream(indexFile);
    zipFile = new ZipFile(indexFile);
    zis = new ZipInputStream(fis);

    TreeMap<Double, Integer> results = new TreeMap<Double, Integer>();
    TreeMap<Integer, List<Integer>> docTermIndex = new TreeMap<Integer, List<Integer>>();
    List<Integer> termids = new LinkedList<Integer>();
    if (relFlag) {
      String[] reldocs = relevance.split(",");
      for (String reldoc : reldocs) {
        int docid = getDocId(reldoc);
        // Editing starts here

        while ((ze = zis.getNextEntry()) != null) {
          String indexData = "";
          String[] splittedString = null;
          InputStream is = zipFile.getInputStream(ze);
          InputStreamReader r = new InputStreamReader(is);
          BufferedReader br = new BufferedReader(r);
          indexData = br.readLine();
          splittedString = indexData.split(";");

          for (int i = 0; i < splittedString.length; i++) {
            if (splittedString[i].contains(":" + docid + ":")) {
              String[] subToken = splittedString[i].toString().split(":");
              int termid = Integer.parseInt(subToken[0]);
              int sDocId = Integer.parseInt(subToken[1]);
              if (!termids.contains(termid)) {
                termids.add(termid);
                // docTermIndex.put(sDocId, termids);
                // calculating the terms' vector scores here
              }
            }
          }
        }
        for (int termid : termids) {
          System.out.println(termid);
          getTermDocPosIndex(termid);
        }
        // Editing ends here
        // Last editing here!!

        Iterator iterator = termdocposindex.keySet().iterator();
        Object obj;
        List<Integer> lterms = new LinkedList<Integer>();
        TreeMap<Integer, List<Integer>> tdocs = new TreeMap<Integer, List<Integer>>();
        while (iterator.hasNext()) {
          obj = iterator.next();
          tdocs = termdocposindex.get(obj);
          Iterator iterator2 = tdocs.keySet().iterator();
          Object obj2;
          while (iterator2.hasNext()) {
            obj2 = iterator2.next();
            if ((Integer) obj2 == docid) {
              lterms.add((Integer) obj2);
              System.out.println(obj.toString());
            }
          }
        }
        // System.out.println(docid);
      }
    } else if (irrelFlag) {
      String[] irreldocs = irrelevance.split(",");
      for (String irreldoc : irreldocs) {
        int docid = getDocId(irreldoc);
        // System.out.println(docid);
      }
    }
    return results;
  }

예제 #3

파일 보기

파일: Search.java 프로젝트: krahman/JSearch

  public TreeMap<Double, List<Integer>> getCosineScore(String query) throws IOException {
    TreeMap<Double, List<Integer>> rankedResults = new TreeMap<Double, List<Integer>>();
    String[] terms = null;
    if (query.contains("-")) {
      terms = query.split(" ");
      String refinedQuery = "";
      for (String term : terms) {
        if (term.contains("-")) {
          String[] splittedTerms = term.split("-");
          term = "";
          for (String splittedTerm : splittedTerms) {
            term += splittedTerm + " ";
          }
        }
        refinedQuery += term + " ";
      }

      query = refinedQuery;
      terms = query.split(" ");
    } else {
      terms = query.split(" ");
    }
    double start = System.currentTimeMillis();
    List<Integer> results = new LinkedList<Integer>();
    HashMap<Integer, Double> docScores = new HashMap<Integer, Double>();
    TreeMap<Integer, List<Integer>> docpos = null;
    TreeMap<Integer, Double> listOfDocScores = new TreeMap<Integer, Double>();
    double tfCorpus = 0;
    for (String term : terms) {
      String searchTerm = getStemmedQuery(term.trim());
      int termid = getTermId(searchTerm);
      List<Integer> docs = new LinkedList<Integer>();
      if (termid > 0) {
        if (!termdocposindex.containsKey(termid)) {
          getTermDocPosIndex(termid);
          docpos = termdocposindex.get(termid);
        } else {
          docpos = termdocposindex.get(termid);
        }
        Iterator docIter = docpos.keySet().iterator();
        Object doc = null;
        while (docIter.hasNext()) {
          doc = docIter.next();
          docs.add((Integer) doc);
        }

        // select only documents contain the query
        if (results.isEmpty()) results.addAll(docs);
        else {
          results.retainAll(docs);
        }
      }

      // calculating tf in document
      for (int result : results) {
        double tfDocument = 0;
        List<Integer> lPositions = docpos.get(result);
        tfDocument = lPositions.size();
        tfCorpus += tfDocument;
        listOfDocScores.put(result, tfDocument);
      }
    }

    // calculating tf in corpus
    Iterator iteratorKey = listOfDocScores.keySet().iterator();
    Object docKey;
    double tfDocument = 0;
    while (iteratorKey.hasNext()) {
      docKey = iteratorKey.next();
      tfDocument = listOfDocScores.get(docKey);
      if (!docScores.containsKey(docKey)) {
        docScores.put((Integer) docKey, tfDocument / tfCorpus);
      }
    }

    // rank the results ascending
    for (Integer docid : docScores.keySet()) {
      if (rankedResults.containsKey(docScores.get(docid))) {
        List<Integer> l = rankedResults.get(docScores.get(docid));
        if (l.contains(docid)) {
          rankedResults.put(docScores.get(docid), l);
        }
      } else {
        List<Integer> l = new LinkedList<Integer>();
        l.add(docid);
        rankedResults.put(docScores.get(docid), l);
      }
    }
    double end = (System.currentTimeMillis() - start) / 1000;
    System.out.println("Match documents found in " + end + " seconds.");
    return rankedResults;
  }