AI Agent 工程师

你好，我是廖维明

专注于 AI Agent 工程、推理优化和 Data+AI 技术实践。在这里展示我的作品和技术实践。

技术方向

ReAct 模式、NL2SQL、工具调用与多步推理的工程实践

vLLM 部署、GPTQ 量化

湖仓一体、Spark/Flink 批流一体、OLAP 查询优化

基于自然语言的商业智能查询助手，支持通过对话方式进行数据分析和可视化。

实时监控霍尔木兹海峡船舶通航情况，提供可视化的航运数据分析。

自行量化的 GLM-4.7-Flash 模型，采用 GPTQ 4bit 量化，降低显存占用的同时保持推理质量。

wiliwili 跨平台移植的技术方案与实现细节分享。