指针式表计识读是工业数智化的关键任务,当前主要依赖目标检测、关键点定位等传统识别算法,存在低泛化性、强数据依赖等瓶颈。该文通过视觉语言大模型模拟人类认知识读过程,提出一种通用的指针表计识读框架:1)为突破数据依赖瓶颈,构建工业场景下的识读多模态数据合成管道,可自动生成20 000条以上问答对;2)为克服大模型“幻觉”瓶颈,使用DeepSeek-R1模拟人类认知识读,解耦表计语义理解和识读推理过程,平均参考误差比基础模型Qwen2.5-VL降低10%;3)为提升泛化性,设计基于广义策略优化的容差自适应强化学习优化方法,将绝对精度约束转化为可学习容忍区间以增强分布外数据(out-of-distribution data