Java StripAfterTransformer.transformDocument示例

编程语言: Java

命名空间/包名称: com.norconex.importer.handler.transformer.impl

方法/功能: transformDocument

hotexamples.com的示例: 1

Java StripAfterTransformer.transformDocument - 已找到1个示例。这些是从开源项目中提取的最受好评的com.norconex.importer.handler.transformer.impl.StripAfterTransformer.transformDocument现实Java示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

setStripAfterRegex(2)

setInclusive(2)

setCaseSensitive(1)

transformDocument(1)

示例#1

显示文件

文件： StripAfterTransformerTest.java 项目： herimedia/importer

  @Test
  public void testTransformTextDocument() throws IOException, ImporterHandlerException {
    StripAfterTransformer t = new StripAfterTransformer();
    t.setStripAfterRegex("<p>");
    t.setCaseSensitive(false);
    t.setInclusive(true);
    File htmlFile = TestUtil.getAliceHtmlFile();
    FileInputStream is = new FileInputStream(htmlFile);

    ByteArrayOutputStream os = new ByteArrayOutputStream();
    ImporterMetadata metadata = new ImporterMetadata();

    metadata.setString(ImporterMetadata.DOC_CONTENT_TYPE, "text/html");
    t.transformDocument(htmlFile.getAbsolutePath(), is, os, metadata, false);
    System.out.println(os.toString());

    Assert.assertEquals(
        "Length of doc content after transformation is incorrect.", 552, os.toString().length());

    is.close();
    os.close();
  }