多样化,有按键、语音等,也由于整个疫情的大环境下,一种更方便更卫生更符合人们的非接触式交互方式—手势识别正大步发展,极富图像化和具备行动性的手势操作将会与人们的生活息息相关。
手势识别应用场景广泛,常见应用场景包括直播互动、智能家居、智能车载和手语翻译等。
01
直播或在线课程
与主播或老师进行互动,例如比ok代表收到,比对号代表正确,比心代表感谢等。或者对着摄像头摆出特定的手势即可出现相应特效,带来不同于以往的丰富交互体验。
02
智能家居
与智能家居设备进行交互,例如使用左划或者右划的手势模拟遥控器换台,调节空调温度,手指指上表示提高温度,手指指下表示降低温度,握拳代表关闭等。
03
智能车载
与车载AI设备进行交互,通过左右挥手、空中轻点和横扫、手指画圈以及两个手指的平行或斜向拖曳的一系列动作,用户可以接听、拒听电话、控制音量,或进行翻页查询交互界面信息、缩放地图页面、转动摄像头视图等操作。
04
手语翻译
通过自然语言处理技术,将聋人打出的手语词汇调换顺序,转换成通顺的汉语句子,进行文字和手语的自动翻译,并以文字或语音的方式展现,实现聋哑人士的互动需求。
手势识别数据标注方式
手势识别基于不同的算法精度要求,通常包括检测框+手势类别标签标注和手部21关键点+手部类别标注两种标注方式。
其中检测框+手势类别标注适合手势简单且预算有限的需求。
对于复杂的手势及精度较高的识别要求,则通常选取手部21关键点+手势类别的标注方式。
手部21点包括选取手部关键的部位点及关节点,通过标注这21个点可以抽象出手部所有的动作形态,标注样例如图1所示:
手势识别任务难点
基于实际情况,手势识别任务具备以下三个难点。
手势种类多:人的手部十分灵活,可以做出很多不同的静态、动态手势,部分相似手势的识别对算法提出了较高要求。
遮挡严重:在人做不同手势时,会造成严重的手部关键点遮挡,做双手手势(如抱拳礼)时遮挡会更加严重,对算法的特征提取及不可见点预测造成较大难度。
动态模糊:部分人机交互场景需要动态手势,而动态手势会造成一定程度的动态模糊现象,对手势识别算法造成难度。
数据堂手势识别数据集
数据堂针对手势识别的任务需求和难点,从数据层面进行了针对性设计,将业内常用的手势识别需求细分成通用静态手势、通用动态手势和手语手势,并分别制作了对应的数据集,分别介绍如下:
01
314178张18种手势识别数据
该数据集采集通用静态手势数据,用于人机交互。涉及1000名以上采集人员,利用手机拍摄不同机位、不同手势、同一手势不同方向的左右手手势数据。
从手势种类来看,包含日常人机交互等18种常用单手及双手手势,具体包括数字1-6、数字8、单手比心、OK、点赞、踩、握拳、Rock、Love、双手比心、双手合十、拜年、抱拳礼。
在数据标注方面,对手势图片采用手部21关键点+手势标签标注。其中,每个关键点均包含可见不可见属性;手势标签包括手势类别、采集者性别、左右手、手势正面背面、采集背景、相机位置、手势旋转角度等。
数据具体介绍如下:
02
558870段50种动态手势识别数据
该数据集采集通用动态手势数据,涉及1000名以上采集人员,用于人机交互。利用手机、iPad及笔记本电脑从不同角度拍摄左右手手势数据。
从手势种类来看,包含日常人机交互等50种常用的动态手势,具体包括手指滑动,手掌滑动,全掌变换、拳部滑动,静止等。
在数据标注方面,标注各段视频标签,标签包括手势类别、采集者性别、左右手、采集背景、拍摄角度等。
数据具体介绍如下:
03
180718张手语手势识别数据
该数据集利用手机拍摄采集常用手语涉及到静态手势及动态手势,涉及100名以上采集人员,包含41种静态手势及95种动态手势。
从手势种类来看,包含简单的0-9、A-Z等静态手语手势,以及吃饭、再见、哥哥、工作等动态手语手势。
在数据标注方面,对手势图片采用手部21关键点+手势标签标注。其中,每个关键点均包含可见不可见属性;手势标签包括手势类别和左右手。
数据具体介绍如下:
依托自身的数据优势以及丰富的数据处理经验,数据堂推出的手势识别数据集,为手势识别技术应用的广泛落地提供助力。
版权归原作者 数据堂官方账号 所有, 如有侵权,请联系我们删除。