Java FeatureExtraction.answerContentの例

プログラミング言語: Java

名前空間/パッケージ名: java.sql

クラス/型: FeatureExtraction

メソッド/関数: answerContent

hotexamples.comのコード掲載数: 1

Java FeatureExtraction.answerContent - 1件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたJavaのjava.sql.FeatureExtraction.answerContentの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

countRealAnswerNumber(2)

answerContent(1)

questionContent(1)

questionExpandInfo(1)

コード例 #1

ファイルを表示

ファイル: InformationExtraction2Mysql.java プロジェクト: xjtuzll/infoCrawlerAndCleaning

  /** 解析问题网页，将其保存到数据库，填写fragment表（过滤前的） */
  public void fragment(String keyword, int pagelength) throws Exception {
    try {
      // 解析数据，数据加到数据库里面
      String catalog = KeywordCatalogDesign.GetKeywordCatalog(keyword);

      // 得到问题网页的链接
      String[] QuestionUrls = DataCollection.getQuestionURLs(keyword);
      // System.out.println("链接数目为：" + pagelength);

      // 解析每个问题网页的问题和回答
      for (int j = 0; j < pagelength; j++) {
        String path = catalog + keyword + j + ".html";
        File file = new File(path);
        if (!file.exists()) {
          System.out.println(path + "  不存在，请重新爬取数据...");
        } else {
          System.out.println("\n开始解析： " + path);
          Document doc = JsoupParse.parsePathText(path);

          // 得到问题的各字段信息，没有作者ID，爬取时间为当前解析数据的时间
          String keywordstore = keyword.replaceAll("\\+", "\\_");
          // System.out.println("转义以后：" + keywordstore);
          String QuestionId = keywordstore + j + ""; // 得到问题ID
          String SourceType = "Quora"; // 得到问题来源
          String URL = QuestionUrls[j]; // 得到碎片链接URL
          // System.out.println("url为：" + URL);
          String QuestionContent =
              FeatureExtraction.questionContent(doc)
                  + "\n"
                  + "Expanded information："
                  + FeatureExtraction.questionExpandInfo(doc); // 得到碎片内容
          SimpleDateFormat df = new SimpleDateFormat("yyyy/MM/dd HH:mm:ss"); // 设置日期格式
          String CrawlerTime = df.format(new Date()); // new
          // Date()为获取当前系统时间
          System.out.println("CrawlerTime1 is ：" + CrawlerTime);
          String AuthorID = "0";
          String media_type = "text"; // 数据是文本类型的text
          String evaluation = "1"; // 数据是否可用，默认都是1

          // 创建sql语句
          sql = "replace into fragment values (?, ?, ?, ?, ?, ?, ?, ?)";
          // 创建object数组
          Object[] questionobject =
              new Object[] {
                QuestionId,
                SourceType,
                URL,
                QuestionContent,
                CrawlerTime,
                AuthorID,
                media_type,
                evaluation
              };
          // 执行sql语句
          mysqlCon.doSql(sql, questionobject);
          // 获取影响行数
          //					i = mysqlCon.getUpdateCount();
          //					// 判断是否插入成功
          //					if (i != -1) {
          //						System.out.println("数据插入成功！");
          //					} else {
          //						System.out.println("数据插入失败！");
          //					}
          // 关闭链接
          mysqlCon.getClose();

          // 得到答案数据
          int realanswernumber = FeatureExtraction.countRealAnswerNumber(doc);
          for (int m = 0; m < realanswernumber; m++) {

            // 得到答案的各字段信息，没有作者ID，爬取时间为当前解析数据的时间
            String AnswerId = QuestionId + "_" + m; // 得到答案ID
            String AnswerContent = FeatureExtraction.answerContent(doc, m);
            ; // 得到碎片内容

            // 创建object数组
            Object[] answerobject =
                new Object[] {
                  AnswerId,
                  SourceType,
                  URL,
                  AnswerContent,
                  CrawlerTime,
                  AuthorID,
                  media_type,
                  evaluation
                };
            mysqlCon.doSql(sql, answerobject);
            //						i = mysqlCon.getUpdateCount();
            //						if (i != -1) {
            //							System.out.println("数据插入成功！");
            //						} else {
            //							System.out.println("数据插入失败！");
            //						}
            // 关闭链接
            mysqlCon.getClose();
          }
        }
      }
    } catch (Exception ex) {
      System.out.println("Error : " + ex.toString());
    }
  }