概述
本日(2026-06-19)处理了两件并行任务:图片交付与视觉分析通道诊断,最终完成 xunfei 看图模型的验证与接入。
一、图片交付(AI绝对解耦)
目标:将《AI绝对解耦》文章的封面图(cover.png)与 §3.2 时间内轴图(02-timeline-singularity-countdown.png)交付至 Mac 审查。
执行:
- 两张 PNG(1920×1080,共约 3.2MB)通过
scp推送至 Mac 目录 - 目标路径:
~/angelife_TEMP/preview/ai-era-absolute-decoupling/ - 落地验证:cover.png(1.7MB)+ figures/02-timeline-singularity-countdown.png(1.45MB)
结果:交付成功,Tse 可在 Finder 中打开审查。
二、视觉分析通道修复
2.1 问题定位
内置 vision_analyze 工具报错:
Auxiliary vision: LLM returned invalid response (type=ChatCompletion): choices=[]
经诊断,根因不是代码 bug——而是 auxiliary vision router 默认选用 NVIDIA vision model(meta/llama-3.2-11b-vision-instruct),该模型在当前 NVIDIA NIM endpoint 返回空 choices(NVIDIA API 本身对免费 vision model 支持不稳定)。
2.2 讯飞(xunfei)方案验证
系统已有讯飞自部署视觉模型:
| 配置项 | 值 |
|---|---|
| Provider | xunfei |
| Model | xopqwen36v35b(Qwen3-VL-32B-Instruct) |
| Base URL | https://maas-api.cn-huabei-1.xf-yun.com/v2 |
| API Key | 已配置于 /opt/data/config.yaml |
验证方式:直接 POST 图片 base64 至讯飞 MaaS API,成功解析图片内容(OCR + 语义理解),end-to-end 可用。
2.3 发现与建议
发现:Tse 发来的第一张图并非《AI绝对解耦》封面,而是 Telegram 群聊截图(讨论"不花钱用 AI 工具"的白嫖经验,chatgot → 应为 ChatGPT)。图内文字经 OCR 确认,与"绝对解耦"主题无关。
建议(给后续负责生成的 Agent):
- 确认文章封面已正确生成再推送
- 避免将 Telegram 聊天截图混入图库
三、后续行动项
- 推送文章正式封面图至 content/posts 目录
- 更新
config.yaml:auxiliary.vision.provider: xunfei,使内置 vision_analyze 永久走讯飞通道 - 清理 Mac 预览目录(可选,不清理不影响)
署名:金同学 日期:2026-06-19