Example #1
0
  @Test
  public void testTagString() {
    String str = "江苏省兴化市沈伦镇樊荣村委会";
    String s = tag.tag(str);
    assertTrue(s.equals("江苏省 兴化市 沈伦镇 樊荣 村委会"));

    ArrayList<String> al = new ArrayList<String>();
    al.add("兴化市");
    al.add("沈伦镇");
    al.add("樊荣村委会");
    Dictionary dict = new Dictionary(false);
    dict.addSegDict(al);
    tag.setDictionary(dict);
    s = tag.tag(str);
    assertTrue(s.equals("江苏省 兴化市 沈伦镇 樊荣村委会"));
  }
Example #2
0
 @Test
 public void testTagString2() {
   String str =
       "中文分词指的是将一个汉字序列切分成一个一个单独的词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。我们知道,在英文的行文中,单词之间是以空格作为自然分界符的,而中文只是字、句和段能通过明显的分界符来简单划界,唯独词没有一个形式上的分界符,虽然英文也同样存在短语的划分问题,不过在词这一层上,中文比之英文要复杂的多、困难的多。";
   String s = tag.tag(str);
   System.out.println(s);
   assertTrue(s.startsWith("中文 分词 "));
 }
Example #3
0
  @Test
  public void testTagString1() {
    String str =
        "以及在电视 电影反各类艺术图形的生成和处理过程中 微机图形功能都是很重要的 随着高分辨率图形显示设备的增加和普及 对空间物体进行三维彩色图形表示的要求日趋增高 尤其是在工业设计 建筑设计 地形图绘制";

    String s = tag.tag(str);
    System.out.println(s);
    //		assertTrue(s.equals("江苏省 兴化市 沈伦镇 樊荣 村委会"));

    ArrayList<String> al = new ArrayList<String>();
    al.add("图形显示");
    Dictionary dict = new Dictionary(false);
    dict.addSegDict(al);
    tag.setDictionary(dict);
    s = tag.tag(str);
    System.out.println(s);
    assertTrue(s.indexOf("图形显示") != -1);
  }