最新要闻
- 一个摄像头就能让虚拟人唱跳rap:抖音即可玩
- 每辆都是碰撞测试车 特斯拉全球首创真实碰撞测试系统
- 当前热点-惊蛰习俗有哪些?专家科普:吃梨、吃“懒龙”了解下
- 【世界报资讯】33万买奥迪A7L!上汽回应“内购价最高优惠16万”:正严查信息外泄
- 马斯克:曾对加密货币感兴趣 现在钟情于AI
- 2023年兔年金银币价格表(2023年03月06日)
- 199元!小米推出米家分体露营灯:Type-C接口 满电亮100小时
- 高速公路“见缝插针”超车致事故 司机:我莽撞了
- 每日动态!魅族史上最大规模!魅族20系列发布会定点上海梅赛德斯奔驰文化中心
- 全球滚动:预计上涨0.16元/升!国内油价将于17日24时起再调整
- 全球视讯!《卧龙:苍天陨落》捏人系统受盛赞 胸部拉到最大也不违和
- 关于情侣的四字成语有哪些?关于情侣个性签名大全
- 专业人才入库证书有什么作用?从专业人才走向管理心得体会
- 花羊羊是谁的妈妈?花羊羊为什么没和村长在一起?
- 海麻线是什么东西?海麻线的营养价值及功效
- 电脑怎么设置休眠模式?休眠和待机有什么区别?
手机
iphone11大小尺寸是多少?苹果iPhone11和iPhone13的区别是什么?
警方通报辅警执法直播中被撞飞:犯罪嫌疑人已投案
- iphone11大小尺寸是多少?苹果iPhone11和iPhone13的区别是什么?
- 警方通报辅警执法直播中被撞飞:犯罪嫌疑人已投案
- 男子被关545天申国赔:获赔18万多 驳回精神抚慰金
- 3天内26名本土感染者,辽宁确诊人数已超安徽
- 广西柳州一男子因纠纷杀害三人后自首
- 洱海坠机4名机组人员被批准为烈士 数千干部群众悼念
家电
一个摄像头就能让虚拟人唱跳rap:抖音即可玩
全身动作捕捉,现在无需昂贵的动捕设备,只要一个摄像头就能轻松实现。
(资料图片)
并且就在抖音上,人人都能上手体验。
上面这段虚拟数字形象跳舞的视频采用了抖音直播伴侣功能背后的全身驱动技术,主播仅需要单个普通摄像头并开始跳舞,就可以实时、精准地驱动虚拟形象。
相较于以往的轻量化动作捕捉,这项来自字节跳动智能创作团队的全身驱动技术具有高真实性,可以体现空间的距离感和地面感。
并且具有更高的鲁棒性,能够在复杂的环境、穿戴等场景下实现良好的结果。
同时,还具备更高的还原性,人物的姿态、手势和动作的姿态、速度都能更加准确地还原。
值得一提的是,普通的惯性动捕手套在一定时间后就会产生漂移损耗,无法支持长时间的直播,而全身驱动技术则可以有效规避这一问题,能够更好地适应直播场景。
据介绍,全身驱动技术的技术方案包含了数据、估计、修正以及驱动四个步骤,具体的实现方案如下:
△全身驱动技术方案全流程构建高精度3D数据供应链
技术团队使用了混合3D数据构建方式,其来源包括自建多目工装动捕系统、2D数据、伪标签3D数据,基于此,团队构建了包含800万以上高精3D标签的数据集。
为了获取接近业务场景的高精度3D人体数据,团队搭建了一套完整的基于多目摄像头的无标记物视觉动捕系统,并基于自研的人体重建算法,实现了对人体的位置,姿态和体型的准确估计。
尽管在多数情况下,自动化的重建算法能够给出精度满足要求的重建结果,但对于一些遮挡严重,运动过快导致模糊的样本,仍需要通过人工筛选修正的方式进行数据清洗。
通过搭建3D数据筛选标注系统,可以实现高效的半自动化数据生产,并通过将人工审核后的样本用于相关模型的训练,持续优化数据产线相关模型的性能,最终实现数据质量的自举式提升。
△高精度3D数据构建流程高还原性与高鲁棒性的全身估计模型
据介绍,通过上述步骤,团队积累了样本量高达近千万的大规模数据集。
在此基础上,团队训练了一个基础特征表示底座进行3D-Aware的共享特征抽取,基于共享特征构建了姿态估计分支、相机估计分支、Root点估计分支。
其中,姿态估计分支负责为表演者的关节点进行局部3D坐标估计,相机估计分支以及Root点估计分支为当前表演者的全局位置进行估计。
基于多分枝的估计模块结合积累的大量自有数据,人体估计模型可以在较少的计算量下取得高还原性与高鲁棒性的结果。
另外,针对全身场景下的手部姿态估计,团队统计了手腕关节旋转的先验分布辅助模型训练,保证模型输出符合人体结构约束;设计了手腕关节的时序模型,保证手腕姿态的稳定性;对关键点预测进行概率建模从而预测模型输出的置信度进行难样本过滤;将以上优化点与大量的自有手部数据结合,智能创作团队的手部姿态算法模型在复杂遮挡模糊场景下结果仍可有不错的表现。
以下为人体在复杂遮挡服饰场景下的优化对比。左边为原始预测结果,右边为异常遮挡优化结果。
再来看看手腕在旋转动作下的优化对比。左边为原始预测结果,右边为手部姿态还原性&鲁棒性优化结果。
时空关联建模强化鲁棒性
在身体估计模块获取了基本的3D关节点信息后,技术团队训练了时序完整性模块对原始结果进行修正。
在时序完整性模块中,引入关节点在时序上的关联关系以及同时刻关节点的空间关联关系,同时引入了关节点位置感知模块,使得具体关节点位置可以被显式编码为高维向量加入训练。
在时序建模的基础上,团队同时设计了异常检测模块对分布外的姿态结果进行过滤修正。时空关联建模的设计保证了人体估计算法可以进一步获得高鲁棒性的驱动信号。
人体在复杂遮挡服饰场景下的优化对比(左为原始预测结果,右为时空关联建模修正后结果):
自研算法,实现高真实感驱动
在通过一些算法模型计算后,团队获得了精准且可靠的人体关节点输出,但这距离驱动一个活灵活现的虚拟人仍然还有最后几个步骤,需要通过IK算法获取特定虚拟角色的旋转角以对其完成驱动。
对此,团队自研了EasyIK算法,其可以对大臂小臂、大腿小腿等容易出现自旋错误的关节提供合理姿态。
同时,为了保证驱动虚拟角色的真实感,团队研发了接地算法,对驱动虚拟角色的地面进行估计,并为单脚以及双脚姿态在地面上自然姿态以及移动的距离进行估计。
EasyIK以及接地算法的引入使得虚拟人驱动可以获得更好的真实感。
足部稳定性优化对比(左为原始预测结果,右为高真实感驱动效果):
随着虚拟数字人技术的发展和虚拟偶像的兴起,虚拟数字人在游戏、虚拟社交,在线健身、在线教育、虚拟主播等领域都将有更加广阔的应用空间。更加实时、轻量化、低成本的动作捕捉技术也将成为行业的趋势。
全身驱动技术方案能大大降低了真人驱动虚拟数字人的应用门槛,助力打造更加趣味、沉浸式的交互体验。
关于字节跳动智能创作团队:
智能创作团队通过建设领先的计算机视觉、音视频编辑、特效处理等技术,支持抖音、剪映、头条等公司内众多产品线;同时通过火山引擎为外部ToB合作伙伴提供业界前沿的智能创作能力与行业解决方案。
体验抖音直播伴侣,可访问:https://streamingtool.douyin.com/
关键词: 虚拟现实 一个摄像头就能让虚拟人唱跳rap
一个摄像头就能让虚拟人唱跳rap:抖音即可玩
有哪些值得收藏的运营思维导图?
环球速看:在工作中最容易犯的3个大忌
环球头条:1-基础入门
每日热门:网络安全(中职组)-B模块:Windows操作系统渗透测试
当前资讯!你也能成为“黑客”高手——趣谈Linux Shell编程语言
每辆都是碰撞测试车 特斯拉全球首创真实碰撞测试系统
当前热点-惊蛰习俗有哪些?专家科普:吃梨、吃“懒龙”了解下
【世界报资讯】33万买奥迪A7L!上汽回应“内购价最高优惠16万”:正严查信息外泄
马斯克:曾对加密货币感兴趣 现在钟情于AI
《数据万象带你玩转视图场景》第一期:avif图片压缩详解
每日热讯!计算两个字符串的相似度
2023年兔年金银币价格表(2023年03月06日)
199元!小米推出米家分体露营灯:Type-C接口 满电亮100小时
高速公路“见缝插针”超车致事故 司机:我莽撞了
每日动态!魅族史上最大规模!魅族20系列发布会定点上海梅赛德斯奔驰文化中心
全球滚动:预计上涨0.16元/升!国内油价将于17日24时起再调整
全球视讯!《卧龙:苍天陨落》捏人系统受盛赞 胸部拉到最大也不违和
关于情侣的四字成语有哪些?关于情侣个性签名大全
专业人才入库证书有什么作用?从专业人才走向管理心得体会
花羊羊是谁的妈妈?花羊羊为什么没和村长在一起?
海麻线是什么东西?海麻线的营养价值及功效
MySQL安装入门第一篇
【SpringBoot】AOP默认的动态代理
前端设计模式——工厂模式
电脑怎么设置休眠模式?休眠和待机有什么区别?
洗衣机不进水是哪里的问题?洗衣机不进水怎么处理?
电脑mac地址怎么更改?电脑mac地址查询方法
网件路由器怎么恢复出厂设置?网件路由器哪款性价比高?
全球头条:鼠标是无法识别的usb设备_鼠标成为无法识别的USB设备 怎么办
苹果笔记本好用吗?苹果笔记本换电池需要多少钱?
百度地图怎么看实时街景?百度地图怎么看历史导航轨迹?
全球短讯!极氪汽车被指销售欺诈 有车主坐在体验店门口集体维权
雷军大会发言:小米汽车预计明年上半年量产 一定把车造好!
极致豪华!长城魏牌蓝山内饰官图发布:35万选它还是理想L8
每日资讯:一文看懂2023年CPU如何选:AMD锐龙7000X3D游戏性能封神
阿里拍卖上线湾流G450公务机!博主:近几年最具性价比的一架
全球观天下!055期暗皇福彩3D预测奖号:组选6码参考
焦点报道:【个人杂谈】大体重程序员如何减肥?(个人总结向)
Python、C++、Swift或任何其他语言会取代Java吗?为什么?
速递!koreanDollLikeness_v10模型下载及使用
# 前端周刊:2023-2 期
环球今亮点!Java Struts2系列的XSS漏洞(S2-002)
天天视点!被雷电瞄准时身体会有预兆:如果在乌云下毛发突然竖起 赶紧躲避
世界热议:全球一半人口2035年可能超重:总量超过40亿
全球资讯:石家庄买一根火腿肠就能免费坐地铁 官方回应:鼓励绿色出行
一本院校招聘会现多家酒店招洗碗工引热议 最低工资2千多:官方回应
焦点报道:又一起!美国一小型飞机坠毁后起火 已致1死2伤
聊一聊如何用SonarQube管理.NET代码质量
语义分割评价指标(Dice coefficient, IoU)
(数据库系统概论|王珊)第十章数据库恢复技术-第一、二节:事务的基本概念和数据库恢复概述
天天通讯!Spring Boot 实现装饰器模式,真香!
观天下!密密麻麻!地震后松毛虫大规模入侵土耳其:场面惊悚 令人不适
广东一特斯拉连撞多车冲毁店门现场视频:网友看完称刹车灯亮了 油门当刹车
世界热文:75岁老人中风 好友发现运动步数为0报医:最终脱离危险
全球首个财务自由大学诞生 美国普林斯顿大学2600亿财富养活自己
大神教你在 Linux 中查看你的时区
世界今头条!“帮忙资金”助基金保壳
当前聚焦:工作人员帮游客捡手机被4只幼虎围观 网友:幸亏是“幼儿园”
全球快看点丨董明珠:中国制造业要想成为世界级 必须在创新上下功夫
摄影师把iPhone塞水下拍美景 咕噜咕噜一阵冒泡 Siri:这把憋气局
全球速读:吴青峰发文请大家别听苏打绿的歌:母带仍被非法利用 还听是助纣为虐
学弈这篇文言文是什么意思
环球快报:读Java性能权威指南(第2版)笔记08_即时编译器中
仅1/3美国人能轻松支付400美元应急费用:信用卡违约率激增
可视化调试某个js对象的属性UI插件 class HTUI
每日速递:一进群就水群?试试这个水群拦截工具
世界快讯:裁员70% 关停两个办公点:自动驾驶卡车公司Embark倒闭边缘
【世界新视野】想买法拍车捡漏?你可能得先准备10本驾照
全球速读:985高校女大学生裸辞大公司:每天活得像老鼠
【当前热闻】瞬狙和闪狙哪个更快_瞬狙
精选!台球杆什么皮头最好
世界快消息!打开MASA Blazor的正确姿势4.1:母版页布局
全球热推荐:Study for Go ! Chapter three - Function
day02-项目实现01
全球速读:【奶奶看了都会】ChatGPT3.5接入企业微信,可连续对话
将外部参数传入awk命令的方法汇总
【热闻】Asp.net core mapcontrollers 背后干了些啥
思科交换机的密码策略与端口安全设置
当前关注:Mac OS 打开pycharm立即闪退,报错initial heap size set to a larger value than the max
“一日三次”的药 到底该怎么吃?你可能一直都错了
比亚迪百万豪车!实拍仰望U8原地掉头:这圈儿真圆
环球关注:微软Edge拯救低清老视频 秒变高清!三代N卡、A卡都能用
快看:棉锦防火布
环球即时看!EF7DbContext池
天天时讯:DotNet 5.0 部署 Docker 注意
男子高烧近41度 体温计贴脸狂飙:近期谨防甲流 病死率很高
老人捡到手机不会接听错过四十多通电话 最终成功归还
反诈老陈自曝2022年收入133万:缴税近40万 捐赠84万+
国家二级保护动物有哪些
任意Exe转ShellCode?
快报:一手卖掉《古墓丽影》:SE宣布总裁松田洋介辞职
每日速看!纪念上映20周年:《指环王:王者无敌》将重映4小时加长版
理想L7本月开启交付 50万以内第二排舒适度最好的SUV
全球信息:AMD显卡驱动罕见Bug:Windows都给搞崩了
精彩看点:老牛嚼电线被击倒 网友:应该是母牛 因为公牛不漏电
环球看点!奥斯卡掌掴事件后续
【读书】《成就上瘾:把成事当成一种习惯》
json转golang结构
婚变?前亚视高层与澳门名媛太太近一年未见