legge un file pdf e lo smembra in tanti sub files pdf suddivisi per codice fiscale. viene utilizzato in ufficio per gestire il file delle paghe e per rendere singola ogni busta. non ha altre funzioni.
fondamentale l'uso della libreria pyPDF2 che consente di accedere a un file pdf e leggerlo come un file di testo.
La procedura preveder un semplice passaggio:
prende il file, lo apre, pagina per pagina, estrapola il testo e in questo caso attraverso una Regular Expression cerca il codice fiscale. se lo trova, lo salva in un file autonomo.