I'm doing a webcrawler I'm having the following problem. I had to do a separate program to print out how many candidates passed each course. Except that the last line is not being executed, and that it would make the vector names go to the next course of the list. The line that is not running is the last one that is written: position = position +1 +1 The code is this
from bs4 import BeautifulSoup
import requests
import string
import re
import urllib
cursos = [
'ADMINISTRAÇÃO - GOVERNADOR VALADARES - DIURNO - SISU - GRUPO A',
'ADMINISTRAÇÃO - GOVERNADOR VALADARES - DIURNO - SISU - GRUPO B',
'ADMINISTRAÇÃO - GOVERNADOR VALADARES - DIURNO - SISU - GRUPO D',
'ADMINISTRAÇÃO - GOVERNADOR VALADARES - DIURNO - SISU - GRUPO E',
'ADMINISTRAÇÃO - JUIZ DE FORA - DIURNO - SISU - GRUPO A',
'ADMINISTRAÇÃO - JUIZ DE FORA - DIURNO - SISU - GRUPO B'
]
r = requests.get('http://www.ufjf.br/cdara/sisu-2/sisu-2017-1a-edicao/lista-de-espera-sisu-3/?id_curso=05GV&id_grupo=72')
soup = BeautifulSoup(r.text, "html.parser")
vetor = []
posicao =1
for node in soup.findAll("td"):
candidato =node.get_text("td")
vetor.append(candidato)
contador = 0
for s in vetor:
contador = contador +1
contador = int(contador/5)
contador = 5
contador2 = 0
contador2 = int(contador2)
print(contador)
while contador2<=contador:
print(cursos[posicao])
posicao = posicao +1