当前位置 :首页 >> 综艺

北大刘利斌开发团队斩获 SIGGRAPH Asia 2022 最佳论文奖:用语音和文字驱动数字人打手势

2023-04-29   来源 : 综艺

音摘录之中制备的口令的定性结果,在说“好”时亦会毫无疑问一个意涵的口令,当在保卫国家时亦会毫无疑问一个标志性的口令,遇到 thing 和 selling 等名词亦会毫无疑问曲式口令,当说到“我”时亦会经常显露现通知口令

为了实验者该深入研究是否可以实现“高层次播放器除此以外观上同意面有语法的口令名词,低层次播放器除此以外观上则直接影响假说上口令名词内的稍微发生变化”,刘利斌他的团队通过找到一类相似语法的高层次播放器除此以外观上,其近似于的文字为 many、quite a few、lots of、much、and more 等,就这类高层次播放器除此以外观上的每个播放器除此以外观上近似于作用于的口令氨基酸,并对这些口令氨基酸格式到口令名词条生活空间完成可视化(三幅 4)。

三幅 5:口令名词条生活空间跳跃除此以外观上向量的 t-SNE 可视化结果

可以发现,口令跳跃氨基酸仅经常显露现在特定的口令名词内,当之中所经常显露现的口令名词近似于的跳跃,三幅 5(a)之中的红、橙和紫色所近似于的股骨跳跃),的确为“many、lots of、 etc”的意思表征。与之相近似于的是,当对同类的低层次播放器除此以外观上完成可视化后,如三幅 5(b)可见,属于该低层次播放器除此以外观上类的跳跃氨基酸不再以除此以外于特定几类,而分散到整个口令名词条生活空间内,由此可以实验者“高层次播放器除此以外观上同意面有语法的口令名词”。

三幅 6:口令名词条生活空间跳跃除此以外观上向量的 t-SNE 可视化结果

当不申恳请加入口令画风格式 z 时,如三幅 6(a)上图,所作用于的口令密集地以除此以外在假说上口令名词的类之中心,于假定产于存在不大差异。当申恳请加入口令画风格式后,如三幅 6(c)上图,所作用于的口令跟假定产于差不多,这说明口令画风格式已显露乎意料构建了口令名词的类内稍微发生变化。由此可以想到,口令画风格式主要由低层次播放器除此以外观上可知得到,从而证明“低层次播放器除此以外观上直接影响假说上口令名词内的稍微发生变化”。

除了上述结果除此以外,该的系统还需有以下几项特性:

跨口语作用于,即使接踵而来原始数据集不能的口语,也能作用于押韵并存的口令;较宽播放器作用于,尽可能接踵而来较较宽的转换成播放器氨基酸

口令画风校对,通过申恳请加入操纵讯号可以操纵作用于口令的画风

;还有状态下尽量减少多余的口令跳跃

转换成一些特定电子音乐可鲁棒地猎杀其节奏并随之“扭动”

刘利斌,南开大学人工智能深入研究之中心前沿近似值深入研究之中心现职任教,2009年本科毕业于浙江大学数理应用科学专业,后转向近似值机科学与技术专业,2014年获取浙江大学博士学位,曾在美国不列颠加州大学伯克利分校及新泽西州迪士尼深入研究之中心完成博士后深入研究,之后申恳请加入 DeepMotion Inc. 任总裁兼研究者。刘利斌任教的主要深入研究同方向是近似值机三幅形学、物理仿真、社亦会活动操纵以及具体的优化操纵、人工智能、增强研修等领域,曾多次担任三幅形学主要该协会亦联席会议如 SIGGRAPH、PacificGraphics、Eurographics 等的期刊程序委员。

参考URL:1.

2.

来得多段落,点击上方关注:

未经「AI科技领域评论」专利权,违者以任何方式在网页、论坛、社区完成转载!

香港市民号转载恳请先在「AI科技领域评论」后台留言夺得专利权,转载时需标明来源并断开本香港市民号名片。

雷峰网

为什么会拉稀
扭伤用什么药好
拉肚子用必奇蒙脱石散有什么禁忌吗
上海治白癜风哪家医院好
广州哪家医院有男科
售价13499元却供不应求,苹果公司A16+1TB,一天后再开卖或将快速售罄

涨价是生产者们最不希望看到的事情,所以当有消息得悉iPhone14第三部新近机将涨价的时候,许多果粉都不开心了,然而此次iPhone14第三部新近机同月发表后,果粉们兴奋的发现iPhone14第...

友情链接