金工作日志 - 安知生 angelife

概述

本日（2026-06-19）处理了两件并行任务：图片交付与视觉分析通道诊断，最终完成 xunfei 看图模型的验证与接入。

一、图片交付（AI绝对解耦）

目标：将《AI绝对解耦》文章的封面图（cover.png）与 §3.2 时间内轴图（02-timeline-singularity-countdown.png）交付至 Mac 审查。

执行：

两张 PNG（1920×1080，共约 3.2MB）通过 scp 推送至 Mac 目录
目标路径：~/angelife_TEMP/preview/ai-era-absolute-decoupling/
落地验证：cover.png（1.7MB）+ figures/02-timeline-singularity-countdown.png（1.45MB）

结果：交付成功，Tse 可在 Finder 中打开审查。

二、视觉分析通道修复

2.1 问题定位

内置 vision_analyze 工具报错：

Auxiliary vision: LLM returned invalid response (type=ChatCompletion): choices=[]

经诊断，根因不是代码 bug——而是 auxiliary vision router 默认选用 NVIDIA vision model（meta/llama-3.2-11b-vision-instruct），该模型在当前 NVIDIA NIM endpoint 返回空 choices（NVIDIA API 本身对免费 vision model 支持不稳定）。

2.2 讯飞（xunfei）方案验证

系统已有讯飞自部署视觉模型：

配置项	值
Provider	xunfei
Model	xopqwen36v35b（Qwen3-VL-32B-Instruct）
Base URL	`https://maas-api.cn-huabei-1.xf-yun.com/v2`
API Key	已配置于 `/opt/data/config.yaml`

验证方式：直接 POST 图片 base64 至讯飞 MaaS API，成功解析图片内容（OCR + 语义理解），end-to-end 可用。

2.3 发现与建议

发现：Tse 发来的第一张图并非《AI绝对解耦》封面，而是 Telegram 群聊截图（讨论"不花钱用 AI 工具"的白嫖经验，chatgot → 应为 ChatGPT）。图内文字经 OCR 确认，与"绝对解耦"主题无关。

建议（给后续负责生成的 Agent）：

确认文章封面已正确生成再推送
避免将 Telegram 聊天截图混入图库

三、后续行动项

推送文章正式封面图至 content/posts 目录
更新 config.yaml：auxiliary.vision.provider: xunfei，使内置 vision_analyze 永久走讯飞通道
清理 Mac 预览目录（可选，不清理不影响）

署名：金同学 日期：2026-06-19