In the past, life was simple: you got yearly statements of many institutions like banks, mortgage/insurance companies, energy/water suppliers.
Those statements all had the same process:
- sent in an envelope
- statement were on scannable paper (A4 over here in The Netherlands)
- my Fujitsu ScanSnap ix1500 scanner (in the past a somewhat less fast Fujitsu ScanSnap ix500 scanner) scans and OCRs the statement into a portable and reasonable named PDF file in less than 30 seconds
- copy paste the required information into my administration software
Now it is a disparate mess of processes:
- some come by email, but in various formats, often getting automatically deleted or bounced because some marketing person got their KPI, put too much trackers in it or made it look too much like advertisements
- most by now are to be manually downloaded via portals
- in all sorts of forms and user experience
- having credentials that often expire within a year and need to be renewed (a lengthy process as incoming email need to go through a greylist in order to lessen SPAM)
- demonstrating slow PDF generation (often 10s of seconds)
- download them in formats needing post processing (like ZIP files containing the PDF files, filenames with names like “Download.pdf” )
- often getting bitmap PDFs that have no OCR: just a plain bitmap that you have to type all information from
Based on [Wayback] Thread by @jpluimers: Ik wordt doodmoe van al die on-line omgevingen van banken, verzekeraars en al die andere shit die je voor de belastingdienst bij elkaar moet zoeken. Je bent gewoon een dag bezig……
- [Archive.is] Jeroen Wiert Pluimers on Twitter: “Ik wordt doodmoe van al die on-line omgevingen van banken, verzekeraars en al die andere shit die je voor de belastingdienst bij elkaar moet zoeken. Je bent gewoon een dag bezig om alle credentials op te zoeken, en deels te resetten omdat je het te lang niet gebruikt hebt. 1/”
- [Archive.is] Jeroen Wiert Pluimers on Twitter: “Afgezien van password reset (wat telkens langs het grey-list filter moet omdat die toko’s sneller van email stack switchen dan financials van rente) is dit het snelste stuk. Met hysterisch 10+ gegroeide instellingen moet je voor het downloaden en controleren een dag uittrekken.… “
- [Archive.is] Jeroen Wiert Pluimers on Twitter: “Per persoon he. Ik heb hier ook nog wat curator-werk te doen. En als particulier curator is het tarief ongeveer nul.… “
- [Archive.is] Jeroen Wiert Pluimers on Twitter: “En dan die abominabele traagheid waarmee die PDF documenten gegenereerd worden, die dan met onleesbare bestandsnamen worden gedownload. Mijn scanner maakt van A4 papier sneller een PDF van met OCR tekstherkenning en geeft ook nog een redelijke naam aan. 2/”
- [Archive.is] Jeroen Wiert Pluimers on Twitter: “Dit nog afgezien van de zoektocht op al die “portals” naar wat je echt nodig hebt en wat niet. Dan denk je alles te downloaden, blijkt er wat te missen. Reken gewoon een paar euro premie per jaar meer en stuur die bende op A4, dat maakt het hier een heel stuk makkelijker. 3/3″
- [Archive.is] Jeroen Wiert Pluimers on Twitter: “Oh ja: die fijne PDFs wat eigenlijk gewoon een embedded zwart-wit bitmap is waar je niets uit kunt kopiëren. Heel irrigant, want moet ik hier dus handmatig door de OCR heen halen.… “
–jeroen