Java ParseState.clearRules Exemples

Langage de programmation: Java

Class/Type: ParseState

Méthode/Fonction: clearRules

Exemples au hotexamples.com: 2

Java ParseState.clearRules - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de ParseState.clearRules extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

getMedia(8)

pos(5)

getParsedArguments(4)

getParsedOptions(4)

setFinishedAgentFields(4)

getUrl(4)

withCommand(3)

getCommand(3)

skipWhitespace(3)

inRow(3)

state(3)

getGroup(3)

isAddingRules(2)

peek(2)

isEndOfString(2)

isMaster(2)

read(2)

nextHeader(2)

parseState(2)

clearRules(2)

argBuf(2)

getCompatibilityVersion(2)

docFieldName(2)

data(2)

stringBuilder(2)

side(1)

usedTrees(1)

prepare(1)

queryParamPos(1)

t_star_l(1)

readAndSkipWhiteSpace(1)

reset(1)

separator(1)

setAddingRules(1)

setExtended(1)

setCompatibilityVersion(1)

setCrawlDelay(1)

skip(1)

substPointer(1)

setIsIframesOnly(1)

star(1)

setMatchedRealName(1)

setMatchedWildcard(1)

spaceIsSep(1)

skipWhite(1)

setMedia(1)

addRule(1)

pointer(1)

getTargetName(1)

as(1)

Méthodes fréquemment utilisées

getMedia (8)

pos (5)

getParsedArguments (4)

getParsedOptions (4)

setFinishedAgentFields (4)

getUrl (4)

withCommand (3)

getCommand (3)

skipWhitespace (3)

inRow (3)

Méthodes fréquemment utilisées

state (3)

getGroup (3)

isAddingRules (2)

peek (2)

isEndOfString (2)

isMaster (2)

read (2)

nextHeader (2)

parseState (2)

clearRules (2)

argBuf (2)

getCompatibilityVersion (2)

docFieldName (2)

data (2)

stringBuilder (2)

side (1)

usedTrees (1)

prepare (1)

queryParamPos (1)

t_star_l (1)

Méthodes fréquemment utilisées

argBuf (2)

getCompatibilityVersion (2)

docFieldName (2)

data (2)

stringBuilder (2)

side (1)

usedTrees (1)

prepare (1)

queryParamPos (1)

t_star_l (1)

readAndSkipWhiteSpace (1)

reset (1)

separator (1)

setAddingRules (1)

setExtended (1)

setCompatibilityVersion (1)

setCrawlDelay (1)

skip (1)

substPointer (1)

setIsIframesOnly (1)

star (1)

setMatchedRealName (1)

setMatchedWildcard (1)

spaceIsSep (1)

skipWhite (1)

setMedia (1)

addRule (1)

pointer (1)

getTargetName (1)

as (1)

Méthodes fréquemment utilisées

readAndSkipWhiteSpace (1)

reset (1)

separator (1)

setAddingRules (1)

setExtended (1)

setCompatibilityVersion (1)

setCrawlDelay (1)

skip (1)

substPointer (1)

setIsIframesOnly (1)

star (1)

setMatchedRealName (1)

setMatchedWildcard (1)

spaceIsSep (1)

skipWhite (1)

setMedia (1)

addRule (1)

pointer (1)

getTargetName (1)

as (1)

b_star_l (1)

createNewPointer (1)

current (1)

drop (1)

f_l (1)

f_r (1)

fieldIsNull (1)

getCurrentOption (1)

getLocation (1)

getMaster (1)

getRobotRules (1)

getUnparsedInput (1)

msgBufStore (1)

i (1)

isComplete (1)

isExtended (1)

isFinishedAgentFields (1)

isMatchedRealName (1)

isMatchedWildcard (1)

isRCState (1)

Exemple #1

0

Afficher le fichier

Fichier : SimpleRobotRulesParser.java Projet : alei76/crawler-commons

/** * Handle the user-agent: directive * * @param state current parsing state * @param token data for directive * @return true to keep going, false if we're done */ private boolean handleUserAgent(ParseState state, RobotToken token) { if (state.isMatchedRealName()) { if (state.isFinishedAgentFields()) { // We're all done. return false; } else { // Skip any more of these, once we have a real name match. We're waiting for some // allow/disallow/crawl delay fields. return true; } } if (state.isFinishedAgentFields()) { // We've got a user agent field, so we haven't yet seen anything that tells us // we're done with this set of agent names. state.setFinishedAgentFields(false); state.setAddingRules(false); } // Handle the case when there are multiple target names are passed String[] targetNames = state.getTargetName().split(","); for (int count = 0; count < targetNames.length; count++) { // Extract possible match names from our target agent name, since it appears // to be expected that "Mozilla botname 1.0" matches "botname" String[] targetNameSplits = targetNames[count].trim().split(" "); // TODO KKr - catch case of multiple names, log as non-standard. String[] agentNames = token.getData().split("[ \t,]"); for (String agentName : agentNames) { agentName = agentName.trim(); if (agentName.isEmpty()) { // Ignore empty names } else if (agentName.equals("*") && !state.isMatchedWildcard()) { state.setMatchedWildcard(true); state.setAddingRules(true); } else { for (String targetName : targetNameSplits) { if (targetName.startsWith(agentName)) { state.setMatchedRealName(true); state.setAddingRules(true); state.clearRules(); // In case we previously hit a wildcard rule match break; } } } } } // Keep going return true; }

Exemple #2

0

Afficher le fichier

Fichier : SimpleRobotRulesParser.java Projet : alei76/crawler-commons

/** * Handle the allow: directive * * @param state current parsing state * @param token data for directive * @return true to keep going, false if we're done */ private boolean handleAllow(ParseState state, RobotToken token) { state.setFinishedAgentFields(true); if (!state.isAddingRules()) { return true; } String path = token.getData(); try { path = URLDecoder.decode(path, "UTF-8"); } catch (Exception e) { reportWarning("Error parsing robots rules - can't decode path: " + path, state.getUrl()); } if (path.length() == 0) { // Allow: <nothing> => allow all. state.clearRules(); } else { state.addRule(path, true); } return true; }