人体姿态估计 (Transformers.js)¶

体验浏览器端的人体姿态估计AI技术！这个工具使用 Transformers.js 实现，能够自动检测图像中人体的关键点位置，包括头部、躯干和四肢的主要关节点。

上传一张包含人物的图片，模型将自动识别和标记人体姿态关键点。

上传图片:

状态: 请上传图片

工作原理¶

此演示利用 Transformers.js 库在浏览器中执行人体姿态估计：

加载库: 通过CDN引入Transformers.js。
模型加载: 首次点击"开始姿态检测"按钮时，会从Hugging Face Hub下载MoveNet预训练模型。这个过程只在首次使用时执行，之后模型会被浏览器缓存。
姿态估计流程:
用户上传包含人物的图片
模型分析图片并识别出人体的关键点（如眼睛、耳朵、肩膀、手肘、手腕、臀部、膝盖、脚踝等）
系统绘制关键点并通过线条连接相关部位，形成人体姿势的骨架图
结果可视化: 直接在原图上叠加显示检测到的姿态关键点和骨架线条，用不同颜色区分

人体姿态估计技术通常基于深度学习中的计算机视觉模型。本演示使用的MoveNet是Google开发的一种高效姿态检测模型，具有以下特点：

模型通过卷积神经网络分析图像，输出每个关键点的坐标以及置信度分数。置信度分数表示模型对该关键点位置预测的确信程度，通常用于过滤低置信度的预测结果。

人体姿态估计技术有广泛的实际应用：

这项技术展示了AI在理解人体动作和姿态方面的能力，为众多领域提供了创新解决方案。