Skip to content

配置

所有设置通过环境变量或 ~/.openclaw/openclaw.json 控制。

环境变量

变量默认值描述
VIDEO_VISION_API_KEY必填视觉模型 API 密钥
VIDEO_VISION_API_URLhttps://api.openai.com/v1/chat/completions任何 OpenAI 兼容的视觉端点
VIDEO_VISION_MODELgpt-4o使用的视觉模型
VIDEO_VISION_MODEauto提取模式:auto / ytdlp / browser(参见提取模式
VIDEO_VISION_PROXY默认代理 URL(HTTP/HTTPS/SOCKS5)
VIDEO_VISION_FRAME_INTERVAL5提取帧之间的间隔秒数
VIDEO_VISION_MAX_FRAMES20每个视频的最大帧数
VIDEO_VISION_COOKIES_DIRCookie 文件目录(参见 Cookie
VIDEO_VISION_LOW_RESOURCEfalse跳过资源检查,禁用转录
VIDEO_VISION_TRANSCRIPTIONauto转录模式:auto / on / off(auto = 非低资源时开启)
VIDEO_VISION_WHISPER_PATHwhisper-cliwhisper-cli 二进制文件路径
VIDEO_VISION_WHISPER_MODEL_PATH(自动检测)ggml 模型文件的完整路径
VIDEO_VISION_WHISPER_MODELmedium模型名称:tiny/base/small/medium/large-v3
VIDEO_VISION_WHISPER_THREADS0(自动)whisper 使用的 CPU 线程数(0 = 核数/2)
VIDEO_VISION_WHISPER_LANGUAGEauto音频语言提示
VIDEO_VISION_BROWSERlocal浏览器后端:local / browserless / browserbase / steel
VIDEO_VISION_BROWSERLESS_TOKENBrowserless API 令牌
VIDEO_VISION_BROWSERBASE_API_KEYBrowserbase API 密钥
VIDEO_VISION_BROWSERBASE_PROJECT_IDBrowserbase 项目 ID
VIDEO_VISION_STEEL_API_KEYSteel API 密钥

OpenClaw JSON 配置

json
{
  "skills": {
    "entries": [
      {
        "name": "video-vision",
        "env": {
          "VIDEO_VISION_API_KEY": "sk-...",
          "VIDEO_VISION_MODEL": "gpt-4o",
          "VIDEO_VISION_MODE": "ytdlp",
          "VIDEO_VISION_PROXY": "http://127.0.0.1:7890",
          "VIDEO_VISION_FRAME_INTERVAL": "5",
          "VIDEO_VISION_MAX_FRAMES": "20",
          "VIDEO_VISION_COOKIES_DIR": "~/.openclaw/cookies"
        }
      }
    ]
  }
}

代理

支持 HTTP、HTTPS 和 SOCKS5 代理。代理用于:

  • yt-dlp 视频元数据获取和下载
  • 浏览器网络流量(阶段 2)
bash
export VIDEO_VISION_PROXY="http://127.0.0.1:7890"
# 或
export VIDEO_VISION_PROXY="socks5://127.0.0.1:1080"

通过 CLI 参数设置单次请求的代理:

bash
node src/index.js https://youtube.com/watch?v=xxx --proxy=http://127.0.0.1:7890

视觉 API 端点

任何 OpenAI 兼容的 /v1/chat/completions 端点均可使用:

bash
# OpenAI(默认)
export VIDEO_VISION_API_URL="https://api.openai.com/v1/chat/completions"
export VIDEO_VISION_MODEL="gpt-4o"

# Anthropic(通过兼容代理)
export VIDEO_VISION_API_URL="https://your-proxy/v1/chat/completions"
export VIDEO_VISION_MODEL="claude-sonnet-4-20250514"

# 本地模型
export VIDEO_VISION_API_URL="http://localhost:11434/v1/chat/completions"
export VIDEO_VISION_MODEL="llava"