用数据告诉你,AI 岗位到底需要什么 — 国内外全平台覆盖,跨市场 × 跨行业对比分析。
在线体验:https://agent-hunt.pages.dev
Agent Hunt 采集国内外主流招聘平台的 AI 相关岗位 JD,通过 Gemini API 进行结构化解析(含行业分类),生成技能图谱、跨市场对比、行业 AI 渗透分析和个性化学习路径。
不靠猜,靠数据。不看单一市场,看全球。不看单一行业,看全景。
AI 正在渗透每一个行业,但:
- 国内和国际市场对 AI 岗位的定义差异巨大
- 传统行业(金融、医疗、制造、汽车)的 AI 交叉岗位正在快速增长,但信息分散
- 求职者不知道该学什么,不知道哪个行业的 AI 机会最大
Agent Hunt 解决的问题:用真实 JD 数据,消除信息差。
从国内外 10+ 招聘平台采集 AI Agent 相关 JD,统一解析为标准化格式。
| 市场 | 平台 | 优先级 |
|---|---|---|
| 国内 | Boss直聘、猎聘 | Tier 1 |
| 国际 | LinkedIn、Indeed | Tier 1 |
| 国内 | 拉勾、脉脉 | Tier 2 |
| 国际 | Wellfound、Glassdoor | Tier 2 |
| 远程 | RemoteOK、We Work Remotely | Tier 3 |
- Gemini API 驱动的中英双语 JD 结构化解析
- 自动提取:技能要求、薪资范围、经验门槛、工作模式
- 多语言技能归一化(大模型 = LLM、朗链 = LangChain)
- 技能差异:国内 vs 国际,哪些技能是共通的?哪些是各自独有的?
- 薪资对标:同等级岗位在不同市场的薪资对比(含汇率换算)
- 岗位定义:国内的"全栈型" vs 国际的"专精型"
- Remote 机会:不同市场的远程工作比例
- 高频技能排行(按平台 / 按市场)
- 技能关联网络(哪些技能经常一起出现)
- 技能趋势追踪
- 输入你的现有技能
- 选择目标市场(国内 / 国际 / 全球)
- 生成技能差距分析 + 推荐学习顺序 + 资源链接
基于 1513 条国内 JD 的岗位聚类分析。数据来源:Boss直聘、猎聘、拉勾。 按 job title 关键词聚类为 14 种典型角色,覆盖率 82%。
| 角色 | 岗位数 | 薪资中位数 | P25-P75 | 经验中位数 | 主要行业 |
|---|---|---|---|---|---|
| AI/LLM 工程师 | 350 | ¥32,500 | ¥20k-50k | 3 年 | 互联网 · 制造 · 汽车 |
| AI 产品经理 | 233 | ¥32,500 | ¥22.5k-45k | 3 年 | 互联网 · 制造 · 金融 |
| 算法工程师/研究员 | 86 | ¥50,000 | ¥30k-65k | 3 年 | 金融 · 互联网 · 医疗 |
| AI 管理/战略 | 84 | ¥56,250 | ¥37.5k-85k | 5 年 | 教育 · 医疗 · 互联网 |
| AI 运营/训练师 | 83 | ¥23,000 | ¥15k-32.5k | 3 年 | 互联网 · 零售 · 金融 |
| 自动驾驶/智能座舱 | 83 | ¥26,250 | ¥18.5k-40k | 5 年 | 汽车 · 互联网 · 制造 |
| 智能制造/工业AI | 82 | ¥39,000 | ¥22.5k-60k | 5 年 | 制造 · 互联网 · 汽车 |
| AI 销售/商务 | 71 | ¥22,500 | ¥13.5k-40k | 3 年 | 互联网 · 医疗 · 制造 |
| AI 转型/咨询 | 64 | ¥35,000 | ¥12.5k-55k | 5 年 | 咨询 · 制造 · 零售 |
| AI 教育 | 30 | ¥14,750 | ¥8k-30k | 1 年 | 教育 · 互联网 · 政府 |
| 数据分析/数据科学 | 24 | ¥30,000 | ¥12.5k-65k | 1 年 | 金融 · 互联网 · 医疗 |
| AI 风控/合规 | 18 | ¥22,500 | ¥12.5k-45k | 3 年 | 金融 · 互联网 · 咨询 |
典型 title:LLM/AI Agent 开发工程师、AI Agent 平台研发工程师、AI 全栈开发工程师
| 必备技能 (Required) | 出现次数 | 加分技能 (Preferred) |
|---|---|---|
| LLM | 110 | Semantic Kernel |
| Agent Architecture | 54 | MCP |
| Python | 24 | Reinforcement Learning |
| RAG | 18 | |
| Java | 14 | |
| LangChain | 10 | |
| Go | 8 | |
| Prompt Engineering | 8 | |
| Multimodal AI | 8 | |
| SQL | 7 |
- 薪资:¥20k-50k(中位数 ¥32,500)
- 学历:本科 68% / 硕士 19% / 不限 13%
- 画像:LLM + Agent + RAG 三件套为核心,Python 是底层必备,Java/Go 用于工程化落地。这是国内 AI 岗位的"标准答案"。
典型 title:AI 推荐算法工程师、算法专家-金融大模型、机器人多模态大模型算法工程师
| 必备技能 (Required) | 出现次数 | 加分技能 (Preferred) |
|---|---|---|
| LLM | 19 | Generative AI |
| Machine Learning | 4 | |
| Data Analysis | 3 | |
| Python | 3 | |
| Deep Learning | 2 | |
| SQL | 2 |
- 薪资:¥30k-65k(中位数 ¥50,000)— 比 AI 工程师高 54%
- 学历:硕士 45% / 本科 38% / 博士 9% — 学历门槛最高
- 画像:偏研究型,需要 ML/DL 基础功底。金融和医疗是主要雇主,对数学和统计能力有隐性要求。
典型 title:AI 产品经理、AIGC 产品经理、智能客服产品经理、AI Agent 产品经理
| 必备技能 (Required) | 出现次数 | 加分技能 (Preferred) |
|---|---|---|
| LLM | 15 | RAG |
| Agent Architecture | 9 | Knowledge Graph |
| Computer Vision | 2 | |
| Function Calling | 1 |
- 薪资:¥22.5k-45k(中位数 ¥32,500)
- 学历:本科 83% / 不限 12%
- 画像:技能要求远低于工程岗,核心是理解 LLM 和 Agent 的能力边界。技术深度不是重点,产品思维和行业认知才是。
典型 title:AIGC 产品运营、智能客服训练师、AI 运营经理
- 薪资:¥15k-32.5k(中位数 ¥23,000)
- 学历:本科 77% / 不限 20%
- 画像:Prompt 编写、数据标注、效果优化。不需要编程能力,适合非技术背景入门 AI 行业。
- 薪资:¥37.5k-85k(中位数 ¥56,250)
- 经验:5 年起步
- 画像:需要行业经验 + AI 认知的复合能力,纯技术背景不够,需要管理和商业判断力。
| 角色 | 岗位数 | 薪资中位数 | 核心差异 |
|---|---|---|---|
| 自动驾驶/智能座舱 | 83 | ¥26,250 | 嵌入式 + 测试为主,AI 技能要求反而不高 |
| 智能制造/工业AI | 82 | ¥39,000 | 薪资高于预期,需要工业领域知识 |
| AI 风控/合规 | 18 | ¥22,500 | SQL + Python + 数据分析三件套,金融行业特色 |
| 医疗AI | 9 | ¥10,000 | 薪资偏低,但处于早期阶段 |
- AI 工程师和产品经理占据半壁江山(350 + 233 = 583 岗,占 39%),这两个方向是最稳妥的选择
- 算法岗薪资溢价 54%(中位数 ¥50k vs AI 工程师 ¥32.5k),但学历门槛最高(45% 要求硕士)
- 非技术岗位机会充足:产品经理(233)、运营(83)、销售(71)、转型咨询(64)加起来占 30%
- 行业决定技能方向:金融偏数据分析 + SQL,汽车偏嵌入式,制造偏工业 AI,不要只看"互联网 AI"
- 薪资分化严重:管理层中位数 ¥56k vs 运营/教育中位数 ¥14-23k,同样是 AI 行业差距 3 倍
基于 507 条海外 JD 的岗位聚类分析。数据来源:LinkedIn、Indeed。 按 job title 关键词聚类为 11 种典型角色,覆盖率 84%。
| 角色 | 岗位数 | 月薪中位数(¥) | P25-P75 | 经验中位数 | 主要行业 |
|---|---|---|---|---|---|
| ML/AI Engineer | 75 | ¥100,286 | ¥88k-125k | 4 年 | 互联网 · 金融 · 传媒 |
| Software Engineer | 63 | ¥97,702 | ¥84k-111k | 5 年 | 互联网 · 咨询 · 制造 |
| ML Scientist / Researcher | 61 | ¥117,812 | ¥91k-143k | 3 年 | 互联网 · 医疗 · 汽车 |
| Product Manager | 56 | ¥118,896 | ¥105k-125k | 5 年 | 互联网 · 医疗 · 金融 |
| Engineering Leadership | 55 | ¥135,905 | ¥112k-173k | 10 年 | 医疗 · 互联网 · 金融 |
| Autonomous Vehicles | 20 | ¥38,364 | ¥35k-44k | 3 年 | 汽车 |
| Finance / Operations | 17 | ¥85,803 | ¥86k-114k | 6 年 | 医疗 · 金融 · 互联网 |
| Solutions Architect | 14 | ¥99,681 | ¥94k-111k | 6 年 | 互联网 · 汽车 · 制造 |
| AI Sales / BD | 11 | ¥137,500 | ¥104k-146k | 7 年 | 互联网 · 医疗 |
| Intern / New Grad | 10 | ¥58,424 | ¥44k-64k | 0 年 | 制造 · 汽车 · 金融 |
| Data Scientist / Analyst | 9 | ¥113,281 | ¥82k-142k | 6 年 | 互联网 · 咨询 · 医疗 |
典型 title:AI Engineer、AI/ML Engineer、Python AI/ML Developer、Senior ML Engineer
| 必备技能 (Required) | 出现次数 | 加分技能 (Preferred) |
|---|---|---|
| Python | 44 | Multimodal AI |
| LLM | 27 | |
| Machine Learning | 19 | |
| Prompt Engineering | 17 | |
| SQL | 16 | |
| PyTorch | 15 |
- 薪资:¥88k-125k(中位数 ¥100,286)
- 学历:本科 40% / 不限 15% / 不指定 31%
- vs 国内 AI 工程师:海外要求 Python(59%) + ML(25%) + PyTorch(20%) 作为基础,国内只看 LLM + Agent。技术栈更深、更广。
典型 title:Applied Scientist、Machine Learning Researcher、Senior Applied Science Manager
| 必备技能 (Required) | 出现次数 | 加分技能 (Preferred) |
|---|---|---|
| Python | 37 | React |
| Machine Learning | 22 | TypeScript |
| SQL | 18 | Next.js |
| Deep Learning | 17 | DevOps |
| LLM | 13 | |
| C++ | 11 |
- 薪资:¥91k-143k(中位数 ¥117,812)
- 学历:硕士 34% / 本科 23% / 博士 20% — 学历要求最高
- 画像:需要扎实的 ML/DL 理论 + Python + C++ 工程能力。Amazon "Applied Scientist" 系列是典型代表。
典型 title:Full Stack Engineer、Software Development Engineer、Senior Software Engineer
| 必备技能 (Required) | 出现次数 | 加分技能 (Preferred) |
|---|---|---|
| Python | 35 | Kubernetes |
| Java | 35 | Docker |
| C# | 28 | Anthropic API |
| AWS | 25 | |
| SQL | 24 | |
| React | 23 |
- 薪资:¥84k-111k(中位数 ¥97,702)
- 画像:不是纯 AI 岗,而是需要 AI 能力的全栈工程师。多语言(Python + Java + C#)+ 云平台(AWS)+ 前端(React)全要会。
典型 title:Product Manager、Senior Product Manager、Product Operations Manager
| 必备技能 (Required) | 出现次数 | 加分技能 (Preferred) |
|---|---|---|
| Data Analysis | 22 | Python |
| Generative AI | 8 | Java |
| LLM | 7 | Microservices |
| Prompt Engineering | 4 | Kubernetes |
| RAG | 3 |
- 薪资:¥105k-125k(中位数 ¥118,896)— 比 ML Engineer 还高
- vs 国内 AI PM:海外 PM 核心要求是 Data Analysis(22 次),国内 PM 核心是理解 LLM(15 次)。海外 PM 更偏数据驱动,国内 PM 更偏技术理解。
典型 title:Solutions Architect、Customer Engineer、Principal AI/ML Architect
| 必备技能 (Required) | 出现次数 |
|---|---|
| RAG | 5 |
| JavaScript | 5 |
| AWS | 4 |
| LangGraph | 4 |
| CrewAI | 4 |
| AutoGen | 4 |
- 画像:唯一一个同时要求 LangGraph + CrewAI + AutoGen 三大 Agent 框架的角色。需要能将 AI 能力整合到企业架构中。
| 必备技能 (Required) | 加分技能 (Preferred) |
|---|---|
| Python(5)、SQL(3)、C++(2) | Git(2)、TensorFlow(2)、Azure(1) |
- 薪资:¥44k-64k(中位数 ¥58,424)— 应届即可拿到国内资深工程师的水平
- 画像:Python + SQL 是起步线,ML 基础 + 一个 DL 框架是加分项
- ML Scientist 薪资最高(中位数 ¥117k),但学历门槛也最高(54% 硕士/博士)
- Product Manager 薪资超过工程师(¥119k vs ML Engineer ¥100k),Data Analysis 是 PM 的第一技能
- Software Engineer ≠ AI Engineer:SDE 需要多语言(Python + Java + C#)+ 云 + 前端,是"会 AI 的全栈"而非"专做 AI"
- 海外应届薪资 ¥58k,约等于国内 AI 管理层中位数(¥56k)
- Solutions Architect 是 Agent 生态的集大成者:同时要求 3 个 Agent 框架 + 云平台 + 全栈能力
- AI Sales 薪资 ¥137k,仅次于 Engineering Leadership,非技术路线的天花板
| 层 | 技术 |
|---|---|
| 后端 | Python 3.11 · FastAPI · SQLAlchemy 2.0 (async) · Celery |
| 前端 | Next.js 16 · Tailwind · shadcn/ui · Recharts · Cloudflare Pages |
| AI | Gemini API (gemini-2.5-flash) · pgvector · 多语言技能归一化 |
| 数据采集 | Playwright · Chrome Extension · 策略模式 + 注册表模式 |
| 基础设施 | PostgreSQL 16 · Redis 7 · Docker Compose |
agent-hunt/
├── backend/ # FastAPI 后端(已实现)
│ ├── app/
│ │ ├── api/v1/ # REST API 路由(jobs, platforms, skills, analysis)
│ │ ├── collectors/ # 多平台数据采集器(策略模式 + 注册表)
│ │ ├── models/ # SQLAlchemy 数据模型(Job, Platform, Skill)
│ │ ├── schemas/ # Pydantic 请求/响应 schema
│ │ ├── services/ # 业务逻辑(JD解析、技能提取、跨市场分析)
│ │ ├── tasks/ # Celery 异步任务
│ │ ├── config.py # pydantic-settings 配置(AH_ 前缀)
│ │ ├── database.py # 异步数据库引擎(asyncpg)
│ │ └── main.py # FastAPI 入口(启动时自动加载种子数据)
│ ├── alembic/ # 数据库迁移
│ ├── tests/ # pytest + pytest-asyncio
│ └── pyproject.toml
├── frontend/ # Next.js 前端(已部署到 Cloudflare Pages)
│ ├── src/app/ # 页面(总览、技能图谱、薪资分析、市场差异、岗位画像)
│ ├── src/components/ # UI 组件(shadcn/ui + InsightCard)
│ ├── src/lib/ # API 客户端 + 标签映射
│ └── public/data/ # 预导出的静态 JSON 数据
├── extension/ # Chrome 浏览器插件(已实现 4 平台内容脚本)
│ ├── content_scripts/ # 各平台 JD 提取脚本
│ └── popup/ # 插件弹窗 UI
├── data/ # 种子数据 + 配置
│ ├── seed_platforms.json # 10 个平台元数据
│ ├── seed_skills.json # 68 个 AI 技能(中英双语别名)
│ ├── skill_aliases.json # 技能同义词映射表(210+ 条)
│ └── search_keywords.json # 跨行业采集关键词矩阵(50+ 关键词)
├── docs/
│ └── domestic-scraping-strategy.md # 国内平台爬虫技术方案
├── docker-compose.yml # PostgreSQL 16 (pgvector) + Redis 7
└── .env.example
三个核心表:
- platforms — 招聘平台元数据(市场、Tier、采集难度、数据质量等)
- jobs — JD 数据(原始文本 + LLM 解析后的结构化字段),通过
(platform_id, platform_job_id)联合唯一约束去重 - skills — 技能分类(含 JSONB 多语言别名、按市场统计计数)
git clone <repo-url>
cd agent-hunt
# 1. 启动基础设施
cp .env.example .env # 填入 Gemini API Key
docker compose up -d
# 2. 安装后端依赖
cd backend && uv venv --python 3.11 .venv && uv pip install -e ".[dev]"
# 3. 运行数据库迁移
.venv/bin/alembic upgrade head
# 4. 启动后端(自动加载种子平台和技能数据)
.venv/bin/uvicorn app.main:app --reload
# 5. 前端(可选,已部署到 Cloudflare Pages)
cd ../frontend && npm install && npm run dev启动后访问 http://localhost:8000/docs 查看 Swagger API 文档。
GET /health — 健康检查
# Jobs
POST /api/v1/jobs/import — 导入单条 JD
POST /api/v1/jobs/import/batch — 批量导入(最多 100 条)
POST /api/v1/jobs/collect — 触发平台采集(采集 → 导入 → 自动解析)
POST /api/v1/jobs/parse/batch — 批量 Gemini 解析
GET /api/v1/jobs — 职位列表(分页 + 筛选)
GET /api/v1/jobs/{id} — 职位详情
POST /api/v1/jobs/{id}/parse — 单条解析
# Skills
GET /api/v1/skills — 技能列表(含国内/国际计数)
POST /api/v1/skills/normalize — 触发技能归一化(采集新数据后运行)
GET /api/v1/skills/unmatched — 未匹配的原始技能(用于扩展 aliases)
# Analysis
GET /api/v1/analysis/salary/distribution — 薪资分布直方图
GET /api/v1/analysis/salary/by-skill — 各技能关联薪资
GET /api/v1/analysis/salary/by-experience — 按经验分段薪资
GET /api/v1/analysis/salary/by-platform — 按平台薪资
GET /api/v1/analysis/cross-market/overview — 国内 vs 国际总览
GET /api/v1/analysis/cross-market/skills — 各市场 Top 技能
GET /api/v1/analysis/cross-market/skill-gaps — 技能需求差异排名
GET /api/v1/analysis/cooccurrence — 技能共现分析
GET /api/v1/analysis/industry/overview — 行业 AI 渗透总览
GET /api/v1/analysis/industry/salary — 各行业 AI 岗位薪资
# Platforms
GET /api/v1/platforms — 平台列表
GET /api/v1/platforms/{id} — 平台详情
数据采集是本项目的核心硬需求。经过调研,各平台均无官方 API 直接提供 JD 批量检索,必须通过多种技术手段攻克。
国内平台是数据源的重中之重,采用多路并进、逐层升级策略:
Layer 0: 手动导入 JSON(保底)
Layer 1: Chrome 浏览器插件(浏览时自动提取)
Layer 2: Playwright 浏览器自动化(模拟真人操作)
Layer 3: API 逆向 + 请求模拟(高效批量)
Layer 4: 移动端 API 抓包(反爬可能更弱)
| 平台 | 主力方案 | 反爬难度 | 关键挑战 | 已验证的开源参考 |
|---|---|---|---|---|
| Boss直聘 | Playwright + Cookie 持久化 | 最高 | 薪资字体加密、设备指纹、登录墙 | auto-zhipin (Playwright) |
| 猎聘 | Playwright + 页面等待 | 中高 | 动态参数、搜索需手动点击 | job-hunting-tampermonkey |
| 拉勾 | Playwright / POST API 模拟 | 中 | 登录墙、Cookie 依赖 | ECommerceCrawlers |
| 平台 | 主力方案 | 备注 |
|---|---|---|
| LinkedIn / Indeed / Glassdoor | JobSpy (Python) | 同时抓取多平台,输出 CSV |
| 补充数据 | Adzuna API | 多国职位聚合 API |
- 仅采集公开可访问的职位信息
- 不存储任何个人信息(HR 姓名、联系方式等)
- 数据仅用于统计分析,不原文展示他人内容
- 自动化采集设置合理延迟(3-8 秒 / 请求)
- 单次会话限量(50-100 条)
积极开发中 — v0.6 已上线,角色聚类分析 + 分市场独立分析 + SCI 评分模型
在线体验:https://agent-hunt.pages.dev
| Phase | 内容 | 状态 |
|---|---|---|
| 1 | 数据采集管道 + 5 平台采集器(LinkedIn/Indeed/猎聘/Boss直聘/拉勾) | 已完成 ✅ |
| 2 | 跨市场分析引擎(技能归一化、薪资分析、技能共现) | 已完成 ✅ |
| 3 | 前端 7 页 + AI 洞察 + 岗位画像 + 学习路径 | 已完成 ✅ |
| 4 | 行业维度扩展(13 行业分类 + 关键词矩阵 + 行业分析页面) | 已完成 ✅ |
| 5 | AI 洞察报告 + 跨行业数据扩充(2370 条 JD) | 已完成 ✅ |
| 6 | 角色聚类分析 + 分市场独立分析 + SCI 评分模型 | 已完成 ✅ |
| 7 | 持续增强(aliases 扩展、Chrome 扩展、Celery 定时采集、用户系统) | 待开始 |
基础设施 ✅
- 项目骨架 + Docker Compose(PostgreSQL 16 + pgvector + Redis 7)
- 数据模型(Platform / Job / Skill)+ Alembic 迁移
- 种子数据(50 技能 + 100+ 别名映射 + 10 个平台元数据)
- 配置管理(pydantic-settings + .env.example)
- 手动导入服务(JSON 导入 + 去重)
- JD 解析服务(Gemini API 中英双语结构化解析)
- REST API(import / collect / list / detail / parse / batch-parse / platforms)
- BaseCollector 抽象类 + CollectorRegistry 注册表
- 采集 API 端点(
POST /api/v1/jobs/collect,采集 → 导入 → 自动解析) - 批量解析端点(
POST /api/v1/jobs/parse/batch)
国际平台 ✅
- JobSpy 集成(LinkedIn / Indeed 采集器)— 105+ 条
国内平台 ✅
- 猎聘 Playwright 采集器(无需登录,单页 42 条含 JD 详情)
- Boss直聘 Playwright 采集器(Cookie + 薪资字体解密)
- 拉勾 Playwright 采集器(Cookie + 滑块验证绕过)
- Cookie 导出工具(
scripts/export_cookies.py) - 全部 JD 已 Gemini 结构化解析(含行业分类)
技能归一化 ✅
- SkillExtractor(
skill_aliases.json180+ 条映射 → 67 个标准技能) - 归一化端点
POST /skills/normalize+ 未匹配技能查看GET /skills/unmatched
薪资分析 ✅
- 薪资分布直方图(按市场/平台筛选)
- 按技能关联薪资(哪些技能薪资最高)
- 按经验/平台分段薪资
跨市场对比 ✅
- 国内 vs 国际总览(薪资、工作模式、学历、经验分布)
- 各市场 Top N 技能排名
- 技能需求差异排名(skill gap analysis)
技能共现分析 ✅
- 技能共现矩阵 + Top pairs(含 Jaccard 系数归一化)
前端 Dashboard ✅ (Next.js 16 + Tailwind + shadcn/ui + Recharts)
- 5 个页面:总览、技能图谱、薪资分析、市场差异、岗位画像
- 中文界面 + Cloudflare Pages 静态部署
- Gemini AI 生成的市场洞察(每页顶部)
- JD 样本展示(点击技能查看真实 JD 摘要)
- 3 个岗位画像(国内/国际/远程)
- 4 条学习路径推荐(Python 转型、前端转型、应届生、出海)
- 静态数据生成脚本(
scripts/generate_insights.py)
行业维度扩展 ✅
- Job 模型新增
industry字段 + Alembic 迁移 002 - Gemini 解析自动识别 12 个行业(互联网/金融/医疗/制造/汽车/零售/教育/媒体/咨询/能源/通信/政府)
- 499 条 JD 重新解析并标注行业
- 行业分析 API 端点(
/analysis/industry/overview、/analysis/industry/salary) - 前端行业分析页面(行业岗位分布图 + 薪资对比 + 行业卡片)
- 跨行业采集关键词矩阵(
data/search_keywords.json,50+ 关键词 × 10 分类) - 批量采集脚本(
scripts/batch_collect.py)
AI 洞察报告 + 数据扩充 ✅
- 跨行业关键词矩阵采集(50+ 关键词),数据从 521 → 2370 条 JD
- AI 市场洞察报告(
/report页面,Gemini 生成 5 个章节)- 全景概览、行业深度分析、跨界求职指南、趋势判断、核心发现
- 报告生成脚本(
scripts/generate_report.py) - 前端 8 个页面全部上线
角色聚类分析 + 分市场独立分析 ✅
- 岗位角色聚类(
scripts/analyze_roles.py):按 job title 关键词聚类为典型角色- 国内 14 种角色(AI/LLM 工程师、AI 产品经理、算法工程师等)
- 海外 11 种角色(ML/AI Engineer、Software Engineer、ML Scientist 等)
- 每种角色包含:必备/加分技能、薪资分布、学历/经验要求、行业分布
- 分市场独立分析:国内/海外技能排名、行业矩阵、共现网络完全分开计算
- SCI(Skill Criticality Index)评分模型:综合频率、薪资溢价、增长趋势的技能关键度指数
- 分市场数据导出(
scripts/export_market_data.py) - README 重构为角色维度分析,从"看技能"升级为"看角色 × 技能 × 行业"
欢迎贡献!特别欢迎以下方向:
- 新平台采集器的实现
- 种子 JD 数据的补充(
data/sample_jds/) - 技能同义词映射的完善(
data/skill_aliases.json)
MIT