示例#1
0
  public static void istatistikCikar(String dosya) {
    System.out.println("Okunan dosya: " + dosya);
    TurkceMetinOkuyucu tmo = new TurkceMetinOkuyucu();
    tmo.setStatistics(istatistikler);
    HeceIstatistikleri heceIst = istatistikler.getHeceIstatistikleri();
    String[] yazi = tmo.MetinOku(dosya);

    int kelimesayisi = 0;
    int eksayisi = 0;

    for (String s : yazi) {
      Kelime[] kelimeler = zemberek.kelimeCozumle(s);

      if (kelimeler == null || kelimeler.length == 0) continue;

      final Kelime ilk = kelimeler[0];
      istatistikler.kokIstatistikGuncelle(ilk.kok(), ilk);
      istatistikler.kelimeIstatistikGuncelle(ilk);
      istatistikler.ekIstatistikleriGuncelle(ilk);
      istatistikler.ikiliIstatistikGuncelle(ilk);
      istatistikler.getIkiliHarfIstatistikleri();
      String[] heceler = zemberek.hecele(s);
      for (String hece : heceler) {
        heceIst.guncelle(hece);
      }
      kelimesayisi++;
      eksayisi += ilk.ekler().size();
    }
    System.out.println("Kelime sayisi:" + kelimesayisi);
    System.out.println("Ekler+Kok sayisi:" + eksayisi);
    System.out.format("%nOran:%.4f%n", (double) eksayisi / (double) kelimesayisi);
    System.out.println(TimeTracker.getElapsedTimeString("ist"));
  }
示例#2
0
  @Override
  public String stem(String str) {

    final Kelime[] cozumler = zemberek.kelimeCozumle(str, CozumlemeSeviyesi.TUM_KOKLER);
    if (cozumler.length == 0) return str;

    // System.out.println(cozumler[0].kok().icerik());

    return cozumler[0].kok().icerik();
  }
示例#3
0
 public static void main(String[] args) {
   zemberek = new Zemberek(new TurkiyeTurkcesi());
   istatistikler = new Istatistikler(zemberek.dilBilgisi());
   TimeTracker.startClock("ist");
   // istatistikCikar("text/yazili_havuz.txt");
   istatistikCikar("kaynaklar/tr/metinler/buzyeli_vadisi_2.txt");
   // istatistikCikar("kitap/tolstoy_cocukluk_ve_genclik_yillari.txt");
   // istatistikCikar("kitap/Tolstoy_Dirilis.txt");
   raporla();
   TimeTracker.stopClock("ist");
 }