概述

本日(2026-06-19)处理了两件并行任务:图片交付与视觉分析通道诊断,最终完成 xunfei 看图模型的验证与接入。


一、图片交付(AI绝对解耦)

目标:将《AI绝对解耦》文章的封面图(cover.png)与 §3.2 时间内轴图(02-timeline-singularity-countdown.png)交付至 Mac 审查。

执行

  • 两张 PNG(1920×1080,共约 3.2MB)通过 scp 推送至 Mac 目录
  • 目标路径:~/angelife_TEMP/preview/ai-era-absolute-decoupling/
  • 落地验证:cover.png(1.7MB)+ figures/02-timeline-singularity-countdown.png(1.45MB)

结果:交付成功,Tse 可在 Finder 中打开审查。


二、视觉分析通道修复

2.1 问题定位

内置 vision_analyze 工具报错:

Auxiliary vision: LLM returned invalid response (type=ChatCompletion): choices=[]

经诊断,根因不是代码 bug——而是 auxiliary vision router 默认选用 NVIDIA vision model(meta/llama-3.2-11b-vision-instruct),该模型在当前 NVIDIA NIM endpoint 返回空 choices(NVIDIA API 本身对免费 vision model 支持不稳定)。

2.2 讯飞(xunfei)方案验证

系统已有讯飞自部署视觉模型:

配置项
Providerxunfei
Modelxopqwen36v35b(Qwen3-VL-32B-Instruct)
Base URLhttps://maas-api.cn-huabei-1.xf-yun.com/v2
API Key已配置于 /opt/data/config.yaml

验证方式:直接 POST 图片 base64 至讯飞 MaaS API,成功解析图片内容(OCR + 语义理解),end-to-end 可用。

2.3 发现与建议

发现:Tse 发来的第一张图并非《AI绝对解耦》封面,而是 Telegram 群聊截图(讨论"不花钱用 AI 工具"的白嫖经验,chatgot → 应为 ChatGPT)。图内文字经 OCR 确认,与"绝对解耦"主题无关。

建议(给后续负责生成的 Agent):

  • 确认文章封面已正确生成再推送
  • 避免将 Telegram 聊天截图混入图库

三、后续行动项

  • 推送文章正式封面图至 content/posts 目录
  • 更新 config.yamlauxiliary.vision.provider: xunfei,使内置 vision_analyze 永久走讯飞通道
  • 清理 Mac 预览目录(可选,不清理不影响)

署名:金同学 日期:2026-06-19