百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文
CognitiveKernel-Pro:腾讯 AI Lab 开源「深度研究智能体」全栈框架

CognitiveKernel-Pro:腾讯 AI Lab 开源「深度研究智能体」全栈框架

  • 网站名称:CognitiveKernel-Pro:腾讯 AI Lab 开源「深度研究智能体」全栈框架
  • 网站分类:技术文章
  • 收录时间:2025-09-08 15:57
  • 网站地址:

进入网站

“CognitiveKernel-Pro:腾讯 AI Lab 开源「深度研究智能体」全栈框架” 网站介绍

官方仓库:https://github.com/Tencent/CognitiveKernel-Pro


一句话总结

零 RL、零门槛、零闭源——用纯 SFT + 免费工具即可复现 超越 RL-SOTA 的深度研究智能体。


核心亮点


架构速览

┌──────────────┐   ┌──────────────┐   ┌──────────────┐
│  Main Agent  │   │ Web Agent    │   │ File Agent   │
│  (Planner)   ├──│ (Browser)    ├──│ (PDF/PPT/… ) │
└──────────────┘   └──────────────┘   └──────────────┘
  • o Main Agent:顶层规划 + 反思
  • o Web Agent:Playwright 驱动浏览器,自动截图、点击、填表
  • o File Agent:本地文件解析(PDF、PPT、Excel、音视频转录)

5 分钟快速体验

1 环境安装

# Python ≥ 3.12
pip install boto3 openai duckduckgo_search rich \
            biopython pandas pdfminer-six python-pptx \
            selenium helium smolagents langchain_openai

# 浏览器内核(Ubuntu 示例)
sudo apt-get install -y poppler-utils libreoffice ffmpeg

2 启动浏览器服务

# 沙盒运行(强烈建议)
sh ck_pro/ck_web/_web/run_local.sh
# 默认端口:3001

3 运行最小 Demo

export PYTHONPATH=/path/to/CognitiveKernel-Pro
export WEB_IP=localhost:3001
export LLM_URL=http://your-vllm:8080/v1/chat/completions   # 或 gpt:gpt-4.1

python -m ck_pro.ck_main.main \
  --updates "{'web_agent':{'web_env_kwargs':{'web_ip':'${WEB_IP}'}}}" \
  --input ck_main/_test/simple_test.jsonl \
  --output simple_test.out.jsonl

GAIA Benchmark 评测脚本

多跳问答权威榜单

# 1. 下载数据
unzip Evaluation/gaia2504.zip

# 2. 设置搜索(任选其一)
export SEARCH_BACKEND=DuckDuckGo
# or
export SEARCH_BACKEND=Google
export SEARCH_API_KEY=xxx
export SEARCH_CSE_ID=xxx

# 3. 启动评测
python -u -m ck_pro.ck_main.main \
  --input gaia_dev.jsonl \
  --output gaia_dev.out.jsonl \
  --updates "{...}" |& tee gaia.log

# 4. 结果分析
python -m ck_pro.ck_main.scripts.analyze -f gaia_dev.out.jsonl

数据与训练

轨迹格式(Session JSON)

{
  "id": "task-001",
  "task": "总结这篇论文的创新点",
  "session": {
    "steps": [
      {
        "step_idx": 0,
        "plan": { "thought": "...", "code": "..." },
        "action": { "observation": {...} }
      }
    ]
  }
}

一键生成 SFT 数据

python convert_sft.py \
  --input_file trajectory.jsonl \
  --output_file train.sft.jsonl \
  --filter llm_judge   # llm_judge / em

进阶功能


安全提示

  • o 沙盒运行:代码直接执行,务必禁用 sudoecho "$USER ALL=(ALL) NOPASSWD: !ALL" | sudo tee /etc/sudoers.d/$USER-rule
    sudo deluser $USER sudo
  • o 网络隔离:浏览器独立容器,避免泄露 Cookie 与本地文件。

引用

@misc{fang2025cognitivekernelpro,
  title={Cognitive Kernel-Pro: A Framework for Deep Research Agents and Agent Foundation Models Training},
  author={Fang, Tianqing and others},
  year={2025},
  eprint={2508.00414},
  archivePrefix={arXiv},
  url={https://arxiv.org/abs/2508.00414}
}

让 AI 替你读论文、搜网页、做总结,只需一条命令。
CognitiveKernel-Pro,把深度研究平民化。