Curriculum Vitae
- INFORMAZIONI PERSONALI
- Nome e Cognome
- ANNARITA DELLA ROCCA
- Qualifica
- funzi/informatico
- Sede
- inps - direzione centrale tecnol.inf.innov.
- Posizione organizzativa
- ammortizzatori sociali
- Indirizzo
- viale della civiltà del lavoro 46 roma 00144
- Telefono
- -
- -
- ESPERIENZE LAVORATIVE E FORMAZIONE
- Attività lavorativa attuale
- capo progetto informatico
- Esperienze professionali
-
- sviluppo del progetto "naspi automatizzata"
- sviluppo del progetto "reingegnerizzazione statistiche psr"
- Formazione professionale
-
tesi di laurea magistrale in natural language processing
sviluppo di un agente multimodale per l?interazione vocale in italiano:
integrazione diwhisper e minerva con langchain
sviluppo di un agente multimodale (tts - stt) in grado di trascrivere un input
vocale e di rispondere, sia in formato testuale che in formato vocale, a quesiti
di difficoltà crescente riguardante giudizi di grammaticalità, semantica e
lessico.
analisi tecnica e sperimentale del modello it5, una famiglia di transformer encoder?decoder in stile t5 pre-addestrati esclusivamente sulla lingua italiana, progettati per superare i limiti dei modelli multilingue nei task nlp in lingue ad alta disponibilità di dati.
- filtraggio e rimozione di contenuti non italiani, duplicati e testo rumoroso);
- analisi di tre varianti dimensionali del modello (small, base, large), addestrate secondo l?architettura t5 text-to-text;
- valutazione sistematica tramite il benchmark itagen, che copre sette compiti nlp in italiano: riassunto, question answering, generazione di domande, headline generation e style transfer.
- misurazione delle prestazioni mediante rouge (r1, r2, rl), bertscore, e per il qa exact match e f1-score.
- fase applicativa tramite hugging face transformers, con esempi di utilizzo dei modelli it5 per:
- news summarization,
- trasformazione di stile (formale->informale),
- generazione di titoli di giornale,
- confronto qualitativo tra le varianti small, base e large.
sviluppo di una rete neurale multi-strato feed-forward per la classificazione multiclasse (mnist, c=10) mediante framework modulare con:
- forward propagation generalizzata per reti con più hidden layer, ciascuno configurabile con funzioni di attivazione diverse (es. sigmoid, relu, identity) e softmax in output.
- backpropagation completa e compatibile con qualsiasi attivazione, e con supporto a funzioni di loss: sum of squares e cross-entropye cross-entropy + softmax con gestione dedicata della derivata (stabilità numerica e semplificazione del gradiente).
- implementazione dell?algoritmo di ottimizzazione resilient backpropagation (rprop) in modalità batch, con aggiornamento adattivo del learning rate basato sul segno dei gradienti.
studio dell?architettura tacotron, modello seq-to-seq con meccanismo di attenzione che mappa direttamente il testo in spettrogrammi mel, eliminando la necessità di pipeline tts multi-stadio tradizionali; con integrazione di un vocoder neurale (hifi-gan) per la conversione degli spettrogrammi mel in forme d?onda audio ad alta qualità, in alternativa ai metodi classici come griffin-lim.
realizzazione di una pipeline sperimentale completa che comprende:
- costruzione di un dataset vocale personalizzato (25 file audio, 3?7s), registrato, filtrato e normalizzato a 22.05 khz mono;
- conversione dei file audio in spettrogrammi mel per l?addestramento del modello;
- training di tacotron2 per 200 epoche con validazione, monitorando la convergenza della loss;
- implementazione di una procedura di inferenza end-to-end che converte testo in audio tramite tacotron2 + hifi-gan, con supporto a dizionari fonetici (arpabet).
- analisi architetturale approfondita dei componenti di tacotron:
encoder basato su cbhg (convolution bank + highway network + bi-gru) per l?estrazione di rappresentazioni linguistiche robuste;
meccanismo di attenzione per l?allineamento dinamico tra testo e parlato;
decoder autoregressivo con gru e connessioni residue, capace di generare spettrogrammi mel multi-frame e di predire il token di stop.
- Titolo di studio
- laurea magistrale in informatica indirizzo "artificial intelligence"
- Altri titoli di studio e abilitazioni professionali
- laurea triennale in informatica
- COMPETENZE LINGUISTICHE
- Madrelingua
- italiano
- Altra lingua
- INGLESE
- Capacità di lettura
- eccellente
- Capacità di scrittura
- eccellente
- Capacità di espressione orale
- eccellente
- Capacità e competenze informatiche
- - python (numpy, langchain, pandas) - machine learning - deep learning - large language models - analisi predittive - strategic reasoning - computer vision - ricerca operativa