多模态、文档智能与 LLM 管道。从实验到上线。
我是李诗千,算法 / AI 工程师,专注把多模态模型、文档解析与 LLM 管道做成可靠、能落地的系统。在临床文档智能与计算机视觉项目里,我习惯从一个能跑的原型出发,再把它打磨到生产可用。
发表 · ICCEA 2021 基于多模态信息互补的行人融合跟踪方法
普华永道赞助毕设:重新设计定位装置,体积缩小 60%、功耗降低 50%,获「最佳毕设」与「最受欢迎项目」。
基于 YOLOv8 的赛车跟踪模型,区分车队并在低能见度下保持 85% 追踪准确率,可用于直播信息叠加。
YOLOv5 迁移学习训练于 2500 张图像,较 OpenCV HSV 基准检测准确率提升 70%,配 GUI 可视化定位。
Flask + MongoDB 养老系统,云端管理用户数据、推送健康提示,并通过硬件急救按钮把应急响应时间缩短 50%。
从加密请求协议起步的并发键值存储,支持增删改、增量持久化、配额与 MRU 资源管理,并实现虚拟执行环境。
用 p5.js 构建多款交互游戏,应用随机生成、Boids 群集与 2D 物理引擎,实现碰撞、路径规划与动态场景。