Canadian Legislative Scrapers

	Module	Last success	Last attempt	Exception (7 / 122)
C	ca	2024-07-26 04:43:10	2024-07-26 04:43:11
C	ca_ab	2024-07-26 04:26:14	2024-07-26 04:26:14
C	ca_ab_calgary	2024-07-26 04:43:16	2024-07-26 04:43:16
C	ca_ab_edmonton	2024-07-26 04:27:04	2024-07-26 04:27:04
C	ca_ab_grande_prairie	2024-07-26 04:16:11	2024-07-26 04:16:11
C	ca_ab_grande_prairie_county_no_1	2024-07-26 04:43:20	2024-07-26 04:43:20
C	ca_ab_lethbridge	2024-07-26 04:01:41	2024-07-26 04:01:41
C	ca_ab_strathcona_county	2024-07-26 04:23:50	2024-07-26 04:23:50
C	ca_ab_wood_buffalo	2024-07-26 04:44:34	2024-07-26 04:44:34
D>	ca_bc	2024-06-26 04:14:44	2024-07-26 04:48:15	scrapelib.HTTPError: 404 while retrieving https://www.leg.bc.ca/_api/search/query?querytext='(contentclass:sts_listitem%20OR… scrapelib.HTTPError: 404 while retrieving https://www.leg.bc.ca/_api/search/query?querytext='(contentclass:sts_listitem%20OR%20IsDocument:True)%20SPSiteUrl:/content%20ListId:8ecafcaa-2bf9-4434-a60c-3663a9afd175%20MLAActiveOWSBOOL:1%20-LastNameOWSTEXT:Vacant'&selectproperties='Picture1OWSIMGE,Title,Path'&&sortlist='LastNameSort:ascending'&rowlimit=100&QueryTemplatePropertiesUrl='spfile://webroot/queryparametertemplate.xml' Traceback (most recent call last): File "/app/reports/utils.py", line 71, in scrape_people report.report = subcommand.handle(args, other) File "/app/.heroku/src/pupa/pupa/cli/commands/update.py", line 260, in handle return self.do_handle(args, other, juris) File "/app/.heroku/src/pupa/pupa/cli/commands/update.py", line 305, in do_handle report['scrape'] = self.do_scrape(juris, args, scrapers) File "/app/.heroku/src/pupa/pupa/cli/commands/update.py", line 173, in do_scrape report[scraper_name] = scraper.do_scrape(scrape_args) File "/app/.heroku/src/pupa/pupa/scrape/base.py", line 99, in do_scrape for obj in self.scrape(kwargs) or []: File "/app/scrapers/ca_bc/people.py", line 16, in scrape page = self.lxmlize(COUNCIL_PAGE, xml=True) File "/app/scrapers/utils.py", line 204, in lxmlize response = self.get(url, cookies=cookies) File "/app/scrapers/utils.py", line 196, in get return super().get(args, verify=SSL_VERIFY, kwargs) File "/app/.heroku/python/lib/python3.9/site-packages/requests/sessions.py", line 602, in get return self.request("GET", url, *kwargs) File "/app/.heroku/python/lib/python3.9/site-packages/scrapelib/__init__.py", line 602, in request raise HTTPError(resp) scrapelib.HTTPError: 404 while retrieving https://www.leg.bc.ca/_api/search/query?querytext='(contentclass:sts_listitem%20OR%20IsDocument:True)%20SPSiteUrl:/content%20ListId:8ecafcaa-2bf9-4434-a60c-3663a9afd175%20MLAActiveOWSBOOL:1%20-LastNameOWSTEXT:Vacant'&selectproperties='Picture1OWSIMGE,Title,Path'&&sortlist='LastNameSort:ascending'&rowlimit=100&QueryTemplatePropertiesUrl='spfile://webroot/queryparametertemplate.xml'
C	ca_bc_abbotsford	2024-07-26 04:23:44	2024-07-26 04:23:44
C	ca_bc_burnaby	2024-07-26 04:24:39	2024-07-26 04:24:39
C	ca_bc_coquitlam	2024-07-26 04:47:40	2024-07-26 04:47:40
C	ca_bc_kelowna	2024-07-26 04:13:22	2024-07-26 04:13:22
C	ca_bc_langley	2024-07-26 04:26:46	2024-07-26 04:26:46
C	ca_bc_langley_city	2024-07-26 04:46:43	2024-07-26 04:46:43
C	ca_bc_new_westminster	2024-07-26 04:16:16	2024-07-26 04:16:16
C	ca_bc_richmond	2024-07-26 04:17:41	2024-07-26 04:17:41
C	ca_bc_saanich	2024-07-26 04:44:43	2024-07-26 04:44:43
C	ca_bc_surrey	2024-07-26 04:24:20	2024-07-26 04:24:20
C	ca_bc_vancouver	2024-07-26 04:00:59	2024-07-26 04:01:00
C	ca_bc_victoria	2024-07-26 04:27:54	2024-07-26 04:27:54
C	ca_mb	2024-07-26 04:19:46	2024-07-26 04:19:46
C	ca_mb_winnipeg	2024-07-26 04:23:13	2024-07-26 04:23:13
C	ca_nb	2024-07-26 04:09:19	2024-07-26 04:09:19
C	ca_nb_fredericton	2024-07-26 04:28:24	2024-07-26 04:28:24
C	ca_nb_moncton	2024-07-26 04:18:09	2024-07-26 04:18:09
C	ca_nb_saint_john	2024-07-26 04:18:39	2024-07-26 04:18:39
C	ca_nl	2024-07-26 04:27:11	2024-07-26 04:27:11
C	ca_nl_st_john_s	2024-07-26 04:12:04	2024-07-26 04:12:04
C	ca_ns	2024-07-26 04:11:11	2024-07-26 04:11:11
C	ca_ns_cape_breton	2024-07-26 04:43:37	2024-07-26 04:43:37
C	ca_ns_halifax	2024-07-26 04:43:59	2024-07-26 04:43:59
C	ca_nt	2024-07-26 04:46:10	2024-07-26 04:46:10
A	ca_nu	2024-07-26 04:23:39	2024-07-26 04:23:39
C	ca_on	2024-07-26 04:22:09	2024-07-26 04:22:09
C	ca_on_ajax	2024-07-26 04:01:08	2024-07-26 04:01:08
C	ca_on_belleville	2024-07-26 04:24:07	2024-07-26 04:24:07
C	ca_on_brampton	2024-07-26 04:13:09	2024-07-26 04:13:10
C	ca_on_brantford	2024-07-26 04:18:42	2024-07-26 04:18:42
C	ca_on_burlington	2024-07-26 04:18:22	2024-07-26 04:18:22
C	ca_on_caledon	2024-07-26 04:18:35	2024-07-26 04:18:35
C	ca_on_cambridge	2024-07-26 04:00:51	2024-07-26 04:00:52
C	ca_on_chatham_kent	2024-07-26 04:23:08	2024-07-26 04:23:08
C	ca_on_clarington	2024-07-26 04:16:21	2024-07-26 04:16:21
C	ca_on_fort_erie	2024-07-26 04:28:08	2024-07-26 04:28:08
C	ca_on_georgina	2024-07-26 04:17:21	2024-07-26 04:17:21
C	ca_on_greater_sudbury	2024-07-26 04:49:36	2024-07-26 04:49:36
C	ca_on_grimsby	2024-07-26 04:01:14	2024-07-26 04:01:14
C	ca_on_guelph	2024-07-26 04:15:20	2024-07-26 04:15:20
C	ca_on_haldimand_county	2024-07-26 04:11:49	2024-07-26 04:11:50
C	ca_on_hamilton	2024-07-26 04:26:34	2024-07-26 04:26:34
C	ca_on_huron	2024-07-26 04:44:04	2024-07-26 04:44:05
C	ca_on_kawartha_lakes	2024-07-26 04:28:27	2024-07-26 04:28:27
C	ca_on_king	2024-07-26 04:22:15	2024-07-26 04:22:15
C	ca_on_kingston	2024-07-26 04:48:19	2024-07-26 04:48:19
C	ca_on_kitchener	2024-07-26 04:44:47	2024-07-26 04:44:47
C	ca_on_lambton	2024-07-26 04:45:47	2024-07-26 04:45:47
C	ca_on_lasalle	2024-07-26 04:44:51	2024-07-26 04:44:51
C	ca_on_lincoln	2024-07-26 04:18:12	2024-07-26 04:18:12
C	ca_on_london	2024-07-26 04:44:38	2024-07-26 04:44:38
C	ca_on_markham	2024-07-26 04:47:25	2024-07-26 04:47:26
C	ca_on_milton	2024-07-26 04:01:53	2024-07-26 04:01:53
D>	ca_on_mississauga	2024-06-25 04:27:21	2024-07-26 04:17:29	IndexError: list index out of range IndexError: list index out of range Traceback (most recent call last): File "/app/reports/utils.py", line 71, in scrape_people report.report = subcommand.handle(args, other) File "/app/.heroku/src/pupa/pupa/cli/commands/update.py", line 260, in handle return self.do_handle(args, other, juris) File "/app/.heroku/src/pupa/pupa/cli/commands/update.py", line 305, in do_handle report['scrape'] = self.do_scrape(juris, args, scrapers) File "/app/.heroku/src/pupa/pupa/cli/commands/update.py", line 173, in do_scrape report[scraper_name] = scraper.do_scrape(scrape_args) File "/app/.heroku/src/pupa/pupa/scrape/base.py", line 99, in do_scrape for obj in self.scrape(kwargs) or []: File "/app/scrapers/ca_on_mississauga/people.py", line 17, in scrape yield self.councillor_data(councillor_url.attrib["href"]) File "/app/scrapers/ca_on_mississauga/people.py", line 35, in councillor_data photo = page.xpath( IndexError: list index out of range
C	ca_on_newmarket	2024-07-26 04:46:13	2024-07-26 04:46:13
C	ca_on_niagara	2024-07-26 04:16:26	2024-07-26 04:16:26
C	ca_on_niagara_on_the_lake	2024-07-26 04:24:26	2024-07-26 04:24:26
C	ca_on_north_dumfries	2024-07-26 04:44:59	2024-07-26 04:44:59
C	ca_on_oakville	2024-07-26 04:45:39	2024-07-26 04:45:39
C	ca_on_oshawa	2024-07-26 04:24:23	2024-07-26 04:24:23
C	ca_on_ottawa	2024-07-26 04:22:24	2024-07-26 04:22:24
C	ca_on_peel	2024-07-26 04:17:05	2024-07-26 04:17:05
C	ca_on_pickering	2024-07-26 04:16:58	2024-07-26 04:16:58
C	ca_on_richmond_hill	2024-07-26 04:17:53	2024-07-26 04:17:53
C	ca_on_sault_ste_marie	2024-07-26 04:16:40	2024-07-26 04:16:40
C	ca_on_st_catharines	2024-07-26 04:13:25	2024-07-26 04:13:25
C	ca_on_thunder_bay	2024-07-26 04:44:28	2024-07-26 04:44:28
D> Warnings 04:46:15 WARNING pupa: validation of CanadianPerson fdb0c834-4b09-11ef-87e0-7e2371b0f62c failed: 1 validation errors: Value 'None' for field '<obj>.image' does not match regular expression '\A(?:(?:ftp\|https?)://\|\Z)'	ca_on_toronto	2024-05-15 04:05:10	2024-07-26 04:46:15	Value 'None' for field '<obj>.image' does not match regular expression '\A(?:(?:ftp\|https?)://\|\Z)' Value 'None' for field '<obj>.image' does not match regular expression '\A(?:(?:ftp\|https?)://\|\Z)' Traceback (most recent call last): File "/app/.heroku/src/pupa/pupa/scrape/base.py", line 175, in validate validator.validate(self.as_dict(), schema) File "/app/.heroku/python/lib/python3.9/site-packages/validictory/validator.py", line 616, in validate raise MultipleValidationError(self._errors) validictory.validator.MultipleValidationError: 1 validation errors: Value 'None' for field '<obj>.image' does not match regular expression '\A(?:(?:ftp\|https?)://\|\Z)' During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/app/reports/utils.py", line 71, in scrape_people report.report = subcommand.handle(args, other) File "/app/.heroku/src/pupa/pupa/cli/commands/update.py", line 260, in handle return self.do_handle(args, other, juris) File "/app/.heroku/src/pupa/pupa/cli/commands/update.py", line 305, in do_handle report['scrape'] = self.do_scrape(juris, args, scrapers) File "/app/.heroku/src/pupa/pupa/cli/commands/update.py", line 173, in do_scrape report[scraper_name] = scraper.do_scrape(**scrape_args) File "/app/.heroku/src/pupa/pupa/scrape/base.py", line 104, in do_scrape self.save_object(obj) File "/app/.heroku/src/pupa/pupa/scrape/base.py", line 89, in save_object raise ve File "/app/.heroku/src/pupa/pupa/scrape/base.py", line 85, in save_object obj.validate() File "/app/.heroku/src/pupa/pupa/scrape/base.py", line 177, in validate raise ScrapeValueError('validation of {} {} failed: {}'.format( pupa.exceptions.ScrapeValueError: validation of CanadianPerson fdb0c834-4b09-11ef-87e0-7e2371b0f62c failed: 1 validation errors: Value 'None' for field '<obj>.image' does not match regular expression '\A(?:(?:ftp\|https?)://\|\Z)'
C	ca_on_uxbridge	2024-07-26 04:23:55	2024-07-26 04:23:55
C	ca_on_vaughan	2024-07-26 04:09:59	2024-07-26 04:09:59
C	ca_on_waterloo	2024-07-26 04:45:43	2024-07-26 04:45:43
C	ca_on_waterloo_region	2024-07-26 04:45:24	2024-07-26 04:45:24
C	ca_on_welland	2024-07-26 04:27:58	2024-07-26 04:27:58
C	ca_on_wellesley	2024-07-26 04:22:45	2024-07-26 04:22:45
C	ca_on_whitby	2024-07-26 04:19:50	2024-07-26 04:19:50
C	ca_on_whitchurch_stouffville	2024-07-26 04:18:04	2024-07-26 04:18:04
C	ca_on_wilmot	2024-07-26 04:17:13	2024-07-26 04:17:13
C	ca_on_windsor	2024-07-26 04:46:21	2024-07-26 04:46:21
C	ca_on_woolwich	2024-07-26 04:01:26	2024-07-26 04:01:26
C	ca_pe	2024-07-26 04:15:11	2024-07-26 04:15:11
C	ca_pe_charlottetown	2024-07-26 04:15:26	2024-07-26 04:15:26
C	ca_pe_stratford	2024-07-26 04:44:11	2024-07-26 04:44:11
C	ca_pe_summerside	2024-07-26 04:46:38	2024-07-26 04:46:38
C	ca_qc	2024-07-26 04:08:28	2024-07-26 04:08:28
C	ca_qc_beaconsfield	2024-07-26 04:44:56	2024-07-26 04:44:56
C	ca_qc_brossard	2024-07-26 04:00:42	2024-07-26 04:00:42
C	ca_qc_cote_saint_luc	2024-07-26 04:48:06	2024-07-26 04:48:06
D>	ca_qc_dollard_des_ormeaux	2024-07-04 04:19:40	2024-07-26 04:15:29	IndexError: list index out of range IndexError: list index out of range Traceback (most recent call last): File "/app/reports/utils.py", line 71, in scrape_people report.report = subcommand.handle(args, other) File "/app/.heroku/src/pupa/pupa/cli/commands/update.py", line 260, in handle return self.do_handle(args, other, juris) File "/app/.heroku/src/pupa/pupa/cli/commands/update.py", line 305, in do_handle report['scrape'] = self.do_scrape(juris, args, scrapers) File "/app/.heroku/src/pupa/pupa/cli/commands/update.py", line 173, in do_scrape report[scraper_name] = scraper.do_scrape(scrape_args) File "/app/.heroku/src/pupa/pupa/scrape/base.py", line 99, in do_scrape for obj in self.scrape(kwargs) or []: File "/app/scrapers/ca_qc_dollard_des_ormeaux/people.py", line 32, in scrape p.image = councillor.xpath(".//@data-src")[0] IndexError: list index out of range
C	ca_qc_dorval	2024-07-26 04:16:47	2024-07-26 04:16:47
C	ca_qc_gatineau	2024-07-26 04:27:35	2024-07-26 04:27:35
D> Warnings 04:13:28 WARNING scrapelib: sleeping for 10 seconds before retry 04:13:38 WARNING scrapelib: sleeping for 20 seconds before retry 04:13:58 WARNING scrapelib: sleeping for 40 seconds before retry 04:14:38 WARNING pupa: could not save RunPlan, no successful runs of ocd-jurisdiction/country:ca/csd:2466102/legislature yet	ca_qc_kirkland		2024-07-26 04:14:38	scrapelib.HTTPError: 403 while retrieving https://www.ville.kirkland.qc.ca/portrait-municipal/conseil-municipal/elus-municip… scrapelib.HTTPError: 403 while retrieving https://www.ville.kirkland.qc.ca/portrait-municipal/conseil-municipal/elus-municipaux Traceback (most recent call last): File "/app/reports/utils.py", line 71, in scrape_people report.report = subcommand.handle(args, other) File "/app/.heroku/src/pupa/pupa/cli/commands/update.py", line 260, in handle return self.do_handle(args, other, juris) File "/app/.heroku/src/pupa/pupa/cli/commands/update.py", line 305, in do_handle report['scrape'] = self.do_scrape(juris, args, scrapers) File "/app/.heroku/src/pupa/pupa/cli/commands/update.py", line 173, in do_scrape report[scraper_name] = scraper.do_scrape(scrape_args) File "/app/.heroku/src/pupa/pupa/scrape/base.py", line 99, in do_scrape for obj in self.scrape(kwargs) or []: File "/app/scrapers/ca_qc_kirkland/people.py", line 11, in scrape page = self.lxmlize(COUNCIL_PAGE) File "/app/scrapers/utils.py", line 204, in lxmlize response = self.get(url, cookies=cookies) File "/app/scrapers/utils.py", line 196, in get return super().get(args, verify=SSL_VERIFY, kwargs) File "/app/.heroku/python/lib/python3.9/site-packages/requests/sessions.py", line 602, in get return self.request("GET", url, *kwargs) File "/app/.heroku/python/lib/python3.9/site-packages/scrapelib/__init__.py", line 602, in request raise HTTPError(resp) scrapelib.HTTPError: 403 while retrieving https://www.ville.kirkland.qc.ca/portrait-municipal/conseil-municipal/elus-municipaux
C	ca_qc_laval	2024-07-26 04:28:04	2024-07-26 04:28:04
C	ca_qc_levis	2024-07-26 04:11:38	2024-07-26 04:11:38
C	ca_qc_longueuil	2024-07-26 04:13:05	2024-07-26 04:13:05
C	ca_qc_mercier	2024-07-26 04:22:21	2024-07-26 04:22:21
C	ca_qc_montreal	2024-07-26 04:13:18	2024-07-26 04:13:18
C	ca_qc_montreal_est	2024-07-26 04:17:09	2024-07-26 04:17:09
C	ca_qc_pointe_claire	2024-07-26 04:15:57	2024-07-26 04:15:58
C	ca_qc_quebec	2024-07-26 04:16:53	2024-07-26 04:16:53
C	ca_qc_saguenay	2024-07-26 04:45:35	2024-07-26 04:45:35
D>	ca_qc_sainte_anne_de_bellevue	2023-10-24 04:04:32	2024-07-26 04:23:47	AssertionError: No councillors found AssertionError: No councillors found Traceback (most recent call last): File "/app/reports/utils.py", line 71, in scrape_people report.report = subcommand.handle(args, other) File "/app/.heroku/src/pupa/pupa/cli/commands/update.py", line 260, in handle return self.do_handle(args, other, juris) File "/app/.heroku/src/pupa/pupa/cli/commands/update.py", line 305, in do_handle report['scrape'] = self.do_scrape(juris, args, scrapers) File "/app/.heroku/src/pupa/pupa/cli/commands/update.py", line 173, in do_scrape report[scraper_name] = scraper.do_scrape(scrape_args) File "/app/.heroku/src/pupa/pupa/scrape/base.py", line 99, in do_scrape for obj in self.scrape(kwargs) or []: File "/app/scrapers/ca_qc_sainte_anne_de_bellevue/people.py", line 14, in scrape assert len(councillors), "No councillors found" AssertionError: No councillors found
C	ca_qc_saint_jean_sur_richelieu	2024-07-26 04:22:42	2024-07-26 04:22:43
D>	ca_qc_saint_jerome	2024-06-25 04:19:49	2024-07-26 04:15:16	AssertionError: No councillors found AssertionError: No councillors found Traceback (most recent call last): File "/app/reports/utils.py", line 71, in scrape_people report.report = subcommand.handle(args, other) File "/app/.heroku/src/pupa/pupa/cli/commands/update.py", line 260, in handle return self.do_handle(args, other, juris) File "/app/.heroku/src/pupa/pupa/cli/commands/update.py", line 305, in do_handle report['scrape'] = self.do_scrape(juris, args, scrapers) File "/app/.heroku/src/pupa/pupa/cli/commands/update.py", line 173, in do_scrape report[scraper_name] = scraper.do_scrape(scrape_args) File "/app/.heroku/src/pupa/pupa/scrape/base.py", line 99, in do_scrape for obj in self.scrape(kwargs) or []: File "/app/scrapers/ca_qc_saint_jerome/people.py", line 11, in scrape assert len(councillors), "No councillors found" AssertionError: No councillors found
C	ca_qc_senneville	2024-07-26 04:01:21	2024-07-26 04:01:21
C	ca_qc_sherbrooke	2024-07-26 04:11:32	2024-07-26 04:11:32
C	ca_qc_terrebonne	2024-07-26 04:47:04	2024-07-26 04:47:04
C	ca_qc_trois_rivieres	2024-07-26 04:47:59	2024-07-26 04:48:00
C	ca_qc_westmount	2024-07-26 04:16:04	2024-07-26 04:16:04
C	ca_sk	2024-07-26 04:49:30	2024-07-26 04:49:30
C	ca_sk_regina	2024-07-26 04:27:50	2024-07-26 04:27:50
C	ca_sk_saskatoon	2024-07-26 04:24:00	2024-07-26 04:24:00
C	ca_yt	2024-07-26 04:15:53	2024-07-26 04:15:53