Abstract
Early identification of emerging skills is critical to align workforce development with labor market trends. However, current forecasting and detection methods often fall short because they rely heavily on historical data or depend on predefined taxonomies.
In this paper, we propose to frame skill emergence as a combinatorial optimization problem over temporal networks. This problem, known as the Minimum Timeline Cover (MinTCover) problem, aims to identify minimal activity intervals for entities, offering interpretable summaries of when they become relevant.
We design a system that combines real-time skill extraction from job postings with temporal knowledge graph construction powered by large language models (LLMs). Additionally, we introduce a loss-enhanced version of a deep learning–based MinTCover solver to model skill emergence more effectively.
Experiments show that our loss-based MinTCover solver improves state-of-the-art approaches, achieving an average 1.17% reduction in total timeline span. Moreover, the overall pipeline demonstrates high performance in identifying emerging skills, outperforming other network-based clustering approaches, with better temporal alignment and fewer premature detections.
Our method is the first to model early skill detection as a combinatorial problem and to operate in a fully unsupervised, real-time setting, demonstrating its potential for dynamic labor market monitoring and proactive identification of emerging skills.
[ITA]
L’identificazione precoce delle competenze emergenti è fondamentale per allineare lo sviluppo della forza lavoro ai trend del mercato del lavoro. Tuttavia, i metodi attuali di previsione e rilevamento delle competenze mostrano limiti significativi, poiché si basano fortemente su dati storici o su tassonomie predefinite.
In questo articolo proponiamo, innanzitutto, di formulare il problema dell’emergere delle competenze come un problema di ottimizzazione combinatoria su reti temporali. Questo problema, noto come Minimum Timeline Cover (MinTCover), ha l’obiettivo di identificare gli intervalli minimi di attività per ciascuna entità, offrendo sintesi interpretabili del momento in cui esse diventano rilevanti.
In secondo luogo, progettiamo un sistema che combina l’estrazione in tempo reale di competenze da offerte di lavoro con la costruzione di un grafo di conoscenza temporale basato su modelli linguistici di grandi dimensioni (LLM). Introduciamo inoltre una versione potenziata da una funzione di perdita (loss-enhanced) di un risolutore MinTCover basato su deep learning, per modellare l’emergere delle competenze.
Gli esperimenti mostrano che, da un lato, il nostro risolutore MinTCover con perdita migliorata supera gli approcci allo stato dell’arte, ottenendo una riduzione media dell’1,17% nella durata complessiva delle timeline; dall’altro lato, l’intera pipeline raggiunge ottime prestazioni nell’identificazione delle competenze emergenti, superando altri metodi di clustering basati su reti, con un migliore allineamento temporale e meno rilevazioni premature.
Il nostro metodo è il primo a modellare il rilevamento precoce delle competenze come un problema combinatorio e a operare in un contesto completamente non supervisionato, raccogliendo dati in tempo reale. Ciò dimostra il suo potenziale per un monitoraggio dinamico del mercato del lavoro e per una identificazione proattiva delle competenze emergenti.