Dag iedereen,
Ik probeer informatie op te halen via requests van deze link:
http://stockscreener.uk.r...%22}&OriginalCurrency=GBP
Het leek mij heel eenvoudig maar toch lijk ik er maar niet in te slagen.
Het is een link die gecreeerd wordt door een webformulier.
Ik kan die link zonder problemen plakken in firefox en krijg de gewenste pagina, met python lukt mij dit niet.
Ik heb momenteel dit:
import requests
from bs4 import BeautifulSoup
page=requests.post('http://http://stockscreener.uk.reuters.com/Stock/UK/ResultsTable?returnChoice=&page=2&sortBy=RCCMultexCompanyName&sortDir=A&quickscreen=gaarp&criteria=%5B%22StockUniverse%22%2C%22PriceEarnings%22%2C%22EPSGrowthRate%22%2C%22Region%22%2C%22SectorAndIndustry%22%2C%22PEGRatio%22%5D&Currency=GBP&PEGRatio={%22view%22%3A%22range%22%2C%22button_inputs%22%3A%5B%5D%2C%22range_inputs%22%3A%22%22}&SectorAndIndustry={%22industries%22%3A%5B%5D}&Region={%22countries%22%3A%5B%5D}&EPSGrowthRate={%22view%22%3A%22range%22%2C%22button_inputs%22%3A%5B%5D%2C%22range_inputs%22%3A%22%22}&PriceEarnings={%22view%22%3A%22range%22%2C%22button_inputs%22%3A%5B%5D%2C%22range_inputs%22%3A%22%22}&StockUniverse={%22button_inputs%22%3A%5B%22LIKE|United%2BKingdom%22%2C%22NOTLIKE|United%2BKingdom%22%5D}&criteriaSession={%22StockUniverse%22%3A{%22button_inputs%22%3A%5B%22LIKE|United%2BKingdom%22%2C%22NOTLIKE|United%2BKingdom%22%5D}%2C%22PriceEarnings%22%3A{%22view%22%3A%22range%22%2C%22button_inputs%22%3A%5B%5D%2C%22range_inputs%22%3A%22%22}%2C%22EPSGrowthRate%22%3A{%22view%22%3A%22range%22%2C%22button_inputs%22%3A%5B%5D%2C%22range_inputs%22%3A%22%22}%2C%22Region%22%3A{%22countries%22%3A%5B%5D}%2C%22SectorAndIndustry%22%3A{%22industries%22%3A%5B%5D}%2C%22PEGRatio%22%3A{%22view%22%3A%22range%22%2C%22button_inputs%22%3A%5B%5D%2C%22range_inputs%22%3A%22%22}%2C%22Currency%22%3A%22GBP%22}&OriginalCurrency=GBP')
soup=BeautifulSoup(page.text)
print(soup)
Mijn programma doet alles correct (geen foutmeldingen) maar ik kom op een verkeerde pagina terecht (website die zegt dat de pagina niet kon gevonden worden).
Ik heb gemerkt dat er een verschil is tussen de link die ik zie in firefox en de link die ik uiteindelijk plak in python. Blijkbaar worden een aantal karakters vervangen (zoals bv: [ ] " ).
Ik heb deze ook al proberen te vervangen en zo de html door te sturen maar dat lijkt ook niet te helpen.
import requests
from bs4 import BeautifulSoup
page=requests.post('http://stockscreener.uk.reuters.com/Stock/UK/ResultsTable?returnChoice=&page=100&sortBy=RCCMultexCompanyName&sortDir=A&quickscreen=gaarp&criteria=["StockUniverse"%2C"PriceEarnings"%2C"EPSGrowthRate"%2C"Region"%2C"SectorAndIndustry"%2C"PEGRatio"]&Currency=GBP&PEGRatio={"view"%3A"range"%2C"button_inputs"%3A[]%2C"range_inputs"%3A""}&SectorAndIndustry={"industries"%3A[]}&Region={"countries"%3A[]}&EPSGrowthRate={"view"%3A"range"%2C"button_inputs"%3A[]%2C"range_inputs"%3A""}&PriceEarnings={"view"%3A"range"%2C"button_inputs"%3A[]%2C"range_inputs"%3A""}&StockUniverse={"button_inputs"%3A["LIKE|United%2BKingdom"%2C"NOTLIKE|United%2BKingdom"]}&criteriaSession={"StockUniverse"%3A{"button_inputs"%3A["LIKE|United%2BKingdom"%2C"NOTLIKE|United%2BKingdom"]}%2C"PriceEarnings"%3A{"view"%3A"range"%2C"button_inputs"%3A[]%2C"range_inputs"%3A""}%2C"EPSGrowthRate"%3A{"view"%3A"range"%2C"button_inputs"%3A[]%2C"range_inputs"%3A""}%2C"Region"%3A{"countries"%3A[]}%2C"SectorAndIndustry"%3A{"industries"%3A[]}%2C"PEGRatio"%3A{"view"%3A"range"%2C"button_inputs"%3A[]%2C"range_inputs"%3A""}%2C"Currency"%3A"GBP"}&OriginalCurrency=GBP')
soup=BeautifulSoup(page.text)
print(soup)
Iemand een idee?
Ik probeer informatie op te halen via requests van deze link:
http://stockscreener.uk.r...%22}&OriginalCurrency=GBP
Het leek mij heel eenvoudig maar toch lijk ik er maar niet in te slagen.
Het is een link die gecreeerd wordt door een webformulier.
Ik kan die link zonder problemen plakken in firefox en krijg de gewenste pagina, met python lukt mij dit niet.
Ik heb momenteel dit:
import requests
from bs4 import BeautifulSoup
page=requests.post('http://http://stockscreener.uk.reuters.com/Stock/UK/ResultsTable?returnChoice=&page=2&sortBy=RCCMultexCompanyName&sortDir=A&quickscreen=gaarp&criteria=%5B%22StockUniverse%22%2C%22PriceEarnings%22%2C%22EPSGrowthRate%22%2C%22Region%22%2C%22SectorAndIndustry%22%2C%22PEGRatio%22%5D&Currency=GBP&PEGRatio={%22view%22%3A%22range%22%2C%22button_inputs%22%3A%5B%5D%2C%22range_inputs%22%3A%22%22}&SectorAndIndustry={%22industries%22%3A%5B%5D}&Region={%22countries%22%3A%5B%5D}&EPSGrowthRate={%22view%22%3A%22range%22%2C%22button_inputs%22%3A%5B%5D%2C%22range_inputs%22%3A%22%22}&PriceEarnings={%22view%22%3A%22range%22%2C%22button_inputs%22%3A%5B%5D%2C%22range_inputs%22%3A%22%22}&StockUniverse={%22button_inputs%22%3A%5B%22LIKE|United%2BKingdom%22%2C%22NOTLIKE|United%2BKingdom%22%5D}&criteriaSession={%22StockUniverse%22%3A{%22button_inputs%22%3A%5B%22LIKE|United%2BKingdom%22%2C%22NOTLIKE|United%2BKingdom%22%5D}%2C%22PriceEarnings%22%3A{%22view%22%3A%22range%22%2C%22button_inputs%22%3A%5B%5D%2C%22range_inputs%22%3A%22%22}%2C%22EPSGrowthRate%22%3A{%22view%22%3A%22range%22%2C%22button_inputs%22%3A%5B%5D%2C%22range_inputs%22%3A%22%22}%2C%22Region%22%3A{%22countries%22%3A%5B%5D}%2C%22SectorAndIndustry%22%3A{%22industries%22%3A%5B%5D}%2C%22PEGRatio%22%3A{%22view%22%3A%22range%22%2C%22button_inputs%22%3A%5B%5D%2C%22range_inputs%22%3A%22%22}%2C%22Currency%22%3A%22GBP%22}&OriginalCurrency=GBP')
soup=BeautifulSoup(page.text)
print(soup)
Mijn programma doet alles correct (geen foutmeldingen) maar ik kom op een verkeerde pagina terecht (website die zegt dat de pagina niet kon gevonden worden).
Ik heb gemerkt dat er een verschil is tussen de link die ik zie in firefox en de link die ik uiteindelijk plak in python. Blijkbaar worden een aantal karakters vervangen (zoals bv: [ ] " ).
Ik heb deze ook al proberen te vervangen en zo de html door te sturen maar dat lijkt ook niet te helpen.
import requests
from bs4 import BeautifulSoup
page=requests.post('http://stockscreener.uk.reuters.com/Stock/UK/ResultsTable?returnChoice=&page=100&sortBy=RCCMultexCompanyName&sortDir=A&quickscreen=gaarp&criteria=["StockUniverse"%2C"PriceEarnings"%2C"EPSGrowthRate"%2C"Region"%2C"SectorAndIndustry"%2C"PEGRatio"]&Currency=GBP&PEGRatio={"view"%3A"range"%2C"button_inputs"%3A[]%2C"range_inputs"%3A""}&SectorAndIndustry={"industries"%3A[]}&Region={"countries"%3A[]}&EPSGrowthRate={"view"%3A"range"%2C"button_inputs"%3A[]%2C"range_inputs"%3A""}&PriceEarnings={"view"%3A"range"%2C"button_inputs"%3A[]%2C"range_inputs"%3A""}&StockUniverse={"button_inputs"%3A["LIKE|United%2BKingdom"%2C"NOTLIKE|United%2BKingdom"]}&criteriaSession={"StockUniverse"%3A{"button_inputs"%3A["LIKE|United%2BKingdom"%2C"NOTLIKE|United%2BKingdom"]}%2C"PriceEarnings"%3A{"view"%3A"range"%2C"button_inputs"%3A[]%2C"range_inputs"%3A""}%2C"EPSGrowthRate"%3A{"view"%3A"range"%2C"button_inputs"%3A[]%2C"range_inputs"%3A""}%2C"Region"%3A{"countries"%3A[]}%2C"SectorAndIndustry"%3A{"industries"%3A[]}%2C"PEGRatio"%3A{"view"%3A"range"%2C"button_inputs"%3A[]%2C"range_inputs"%3A""}%2C"Currency"%3A"GBP"}&OriginalCurrency=GBP')
soup=BeautifulSoup(page.text)
print(soup)
Iemand een idee?