Posizioni Organizzative

Curriculum Vitae

INFORMAZIONI PERSONALI

Nome e Cognome

ANNARITA DELLA ROCCA

Qualifica

funzi/informatico

Sede

inps - direzione centrale tecnol.inf.innov.

Posizione organizzativa

ammortizzatori sociali

Indirizzo

viale della civiltà del lavoro 46 roma 00144

Telefono

Email

ESPERIENZE LAVORATIVE E FORMAZIONE

Attività lavorativa attuale

capo progetto informatico

Esperienze professionali

- sviluppo del progetto "naspi automatizzata"

- sviluppo del progetto "reingegnerizzazione statistiche psr"

Formazione professionale

tesi di laurea magistrale in natural language processing

sviluppo di un agente multimodale per l?interazione vocale in italiano:

integrazione diwhisper e minerva con langchain

sviluppo di un agente multimodale (tts - stt) in grado di trascrivere un input

vocale e di rispondere, sia in formato testuale che in formato vocale, a quesiti

di difficoltà crescente riguardante giudizi di grammaticalità, semantica e

lessico.

analisi tecnica e sperimentale del modello it5, una famiglia di transformer encoder?decoder in stile t5 pre-addestrati esclusivamente sulla lingua italiana, progettati per superare i limiti dei modelli multilingue nei task nlp in lingue ad alta disponibilità di dati.

- filtraggio e rimozione di contenuti non italiani, duplicati e testo rumoroso);

- analisi di tre varianti dimensionali del modello (small, base, large), addestrate secondo l?architettura t5 text-to-text;

- valutazione sistematica tramite il benchmark itagen, che copre sette compiti nlp in italiano: riassunto, question answering, generazione di domande, headline generation e style transfer.

- misurazione delle prestazioni mediante rouge (r1, r2, rl), bertscore, e per il qa exact match e f1-score.

- fase applicativa tramite hugging face transformers, con esempi di utilizzo dei modelli it5 per:

- news summarization,

- trasformazione di stile (formale->informale),

- generazione di titoli di giornale,

- confronto qualitativo tra le varianti small, base e large.

sviluppo di una rete neurale multi-strato feed-forward per la classificazione multiclasse (mnist, c=10) mediante framework modulare con:

- forward propagation generalizzata per reti con più hidden layer, ciascuno configurabile con funzioni di attivazione diverse (es. sigmoid, relu, identity) e softmax in output.

- backpropagation completa e compatibile con qualsiasi attivazione, e con supporto a funzioni di loss: sum of squares e cross-entropye cross-entropy + softmax con gestione dedicata della derivata (stabilità numerica e semplificazione del gradiente).

- implementazione dell?algoritmo di ottimizzazione resilient backpropagation (rprop) in modalità batch, con aggiornamento adattivo del learning rate basato sul segno dei gradienti.

studio dell?architettura tacotron, modello seq-to-seq con meccanismo di attenzione che mappa direttamente il testo in spettrogrammi mel, eliminando la necessità di pipeline tts multi-stadio tradizionali; con integrazione di un vocoder neurale (hifi-gan) per la conversione degli spettrogrammi mel in forme d?onda audio ad alta qualità, in alternativa ai metodi classici come griffin-lim.

realizzazione di una pipeline sperimentale completa che comprende:

- costruzione di un dataset vocale personalizzato (25 file audio, 3?7s), registrato, filtrato e normalizzato a 22.05 khz mono;

- conversione dei file audio in spettrogrammi mel per l?addestramento del modello;

- training di tacotron2 per 200 epoche con validazione, monitorando la convergenza della loss;

- implementazione di una procedura di inferenza end-to-end che converte testo in audio tramite tacotron2 + hifi-gan, con supporto a dizionari fonetici (arpabet).

- analisi architetturale approfondita dei componenti di tacotron:

encoder basato su cbhg (convolution bank + highway network + bi-gru) per l?estrazione di rappresentazioni linguistiche robuste;

meccanismo di attenzione per l?allineamento dinamico tra testo e parlato;

decoder autoregressivo con gru e connessioni residue, capace di generare spettrogrammi mel multi-frame e di predire il token di stop.

Titolo di studio

laurea magistrale in informatica indirizzo "artificial intelligence"

Altri titoli di studio e abilitazioni professionali

laurea triennale in informatica

COMPETENZE LINGUISTICHE

Madrelingua

italiano

Altra lingua

INGLESE

Capacità di lettura

eccellente

Capacità di scrittura

eccellente

Capacità di espressione orale

eccellente

Capacità e competenze informatiche

- python (numpy, langchain, pandas) - machine learning - deep learning - large language models - analisi predittive - strategic reasoning - computer vision - ricerca operativa