当前位置:首页 > 报告详情

使用语言模型从在线职位空缺中提取就业地区.pdf

上传人: Fl****zo 编号:718601 2025-06-22 38页 1.06MB

1、Using language models for extracting regions of employment from online job vacanciesGdask,Poland I 04 Feb 2025Adam TsakalidisCedefop Expert(Skills Intelligence&Foresight)Web Intelligence Network Conference From Web to DataAdam Tsakalidis&Antonio RanieriIntroduction2Task:Extracting regions of employm

2、ent from Online Job Advertisements(OJAs)IntroductionTask:Extracting regions of employment from Online Job Advertisements(OJAs)Why this mattersOJAs:real-time monitoring of the labour marketRegions:fine-grained resolution3IntroductionTask:Extracting regions of employment from Online Job Advertisements

3、(OJAs)Why this mattersOJAs:real-time monitoring of the labour marketRegions:fine-grained resolutionData:Skills-OVATEESTAT+CedefopHundreds of millions of OJAsMultiple languagesEU27+coverage2018-24Classifications:occupations(ISCO),skills(ESCO),4IntroductionTask:Extracting regions of employment from On

4、line Job Advertisements(OJAs)Why this mattersOJAs:real-time monitoring of the labour marketRegions:fine-grained resolutionData:Skills-OVATEESTAT+CedefopHundreds of millions of OJAsMultiple languagesEU27+coverage2018-24Classifications:occupations(ISCO),skills(ESCO),In this work:-Greek language-NUTS-2

5、 region56ChallengesPlan A:Using commercial LLMs-Data sensitivity-CostChallengesPlan A:Using commercial LLMsPlan B:Prompting in-house LLMs-Cost-Scalability78ChallengesPlan A:Using commercial LLMsPlan B:Prompting in-house LLMsPlan C:Typical ML/NLP process(a)Manual annotation of two datasets(train/test

6、)(b)Training a model on the training data(c)Evaluate model on the test data9ChallengesPlan A:Using commercial LLMsPlan B:Prompting in-house LLMsPlan C:Typical ML/NLP process(a)Manual annotation of two datasets(train/test)(b)Training a model on the training data(c)Evaluate model on the test data-Time

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要内容是关于如何利用语言模型从在线职位广告中提取就业区域的研究。关键点如下: 1. **研究任务**:从在线职位广告(OJAs)中提取NUTS-2就业区域。 2. **重要性**:OJAs提供了实时劳动力市场监控,而区域数据具有细粒度分辨率。 3. **数据集**:使用了Skills-OVATE和ESTAT+Cedefop的数据,覆盖了欧盟27国,时间跨度为2018-2024年。 4. **挑战**:面临数据敏感性、成本和可扩展性的挑战。 5. **方法**:提出了一种三步方法,包括提取位置候选词、使用LLMs作为“专家”标注NUTS-2区域,以及训练BERT模型进行分类。 6. **结果**:ChatGPT标注的模型在成本和准确性上有显著优势,成本为$0.25,准确率为82.8%;而BERT模型训练成本为$34,准确率高达93.3%。 7. **限制**:仅针对希腊语,测试集较小。 8. **未来工作**:计划将方法扩展到其他语言,并进行鲁棒性验证。 核心数据引用:ChatGPT标注模型准确率为82.8%,成本为$0.25;BERT模型准确率为93.3%,成本为$34。
"如何高效定位职位区域?" "希腊职位广告中的地区难题怎么破?" "ChatGPT如何助力就业区域分析?"
客服
商务合作
小程序
服务号
折叠