职位搜索器:AI驱动的求职助手
职位搜索器是一款为应届毕业生设计的AI工具,通过分析简历自动生成LinkedIn搜索查询,并基于技能、经验、教育、行业和资历五个维度对职位进行评分。该项目使用DeepSeek V4 Pro作为教师模型生成标签,Qwen3-8B作为学生模型进行推理,训练数据包括2500份简历和约10000个职位。所有代码、数据集和模型均已开源。
对于应届毕业生来说,求职本身就像一份全职工作:每周浏览数百个招聘信息,反复点击“快速申请”,重复撰写类似的求职信。数月后,求职者往往会申请那些本不愿考虑的职位和行业。为了缓解这一痛点,开发者构建了“职位搜索器”——一款AI驱动的求职助手,能够自动化LinkedIn搜索并智能筛选职位。
该工具的工作流程分为三个步骤:首先,模型读取用户的简历和偏好设置(如职位类型、工作模式、地点等),生成针对LinkedIn的搜索查询并附带推理过程;接着,利用JobSpy工具在LinkedIn上逐一执行这些查询;最后,对于每个返回的职位,模型会基于简历和职位描述,从技能匹配、经验相关性、教育背景、行业领域契合度和资历一致性五个维度进行评分。用户最终获得的不是一份冗长的列表,而是一个经过理性筛选的短名单,并附有详细的评分理由。
在技术实现上,项目采用了教师-学生模型架构。教师模型为DeepSeek V4 Pro,擅长结构化推理且成本较低,用于离线生成标签;学生模型为Qwen3-8B,经过4位量化后可在单个ZeroGPU上运行,负责推理阶段的评分。训练数据来自一个闭环流程:基于2500份简历(来自Kaggle-Resume数据集),教师模型首先生成查询,然后通过JobSpy抓取约10000个职位,最后教师模型对每个(简历,职位)对进行评分。
训练在Modal平台上使用单个A100 GPU进行,采用两个独立的LoRA适配器(秩16,alpha 16),分别针对查询生成和评分任务。调整策略避免了单一适配器导致的格式混淆问题。推理阶段部署在HuggingFace ZeroGPU Space上,采用llama.cpp进行流式输出,每个用户提交只调用一次GPU,显著降低了冷启动开销。
开发者的经验表明,将查询生成和评分拆分为两个适配器优于单一适配器;教师模型的提示设计比学生模型的大小更为关键。整个项目的Claude Code会话记录也已作为代理痕迹数据集公开。读者可以在huggingface.co/spaces/build-small-hackathon/job-search-assistant上上传简历进行试用。