音乐文件驱动舞蹈数字人
通过音乐文件,生成口型、身体动作信息。
请求地址:https://motionverseapi.deepscience.cn/api/audio2dance
请求方式:POST
请求类型:application/json
请求参数:
名称 | 类型 | 必填 | 描述 | 默认值 | 示例值 |
---|---|---|---|---|---|
audio_url | string | 与audio_b64二选一 | 语音文件链接(.wav, .mp3)或者内容为语音base64的文件链接(.json) | 无 | http://www.xxx.wav http://www.xxx.json |
audio_b64 | string | 与audio_ url二选一 | wav语音的base64编码 | 无 | |
audio_format | string | 否 | 表示语音的类型;若audio_format为”wav”或者为空,则表示语音数据为wav格式或者mp3格式;若audio_format为”base64”,则表示语音数据为base64格式; | 默认为空,表示”wav” | “base64” |
compress | bool | 否 | 表示返回的oss_url的内容是否是二进制;若为True,生成的是二进制格式;若为False,生成的是可读的json格式; | False | False |
style_tag | string | 否 | 请求动作的tag类型 | 1 | 1: 流行风格; 2:中式传统风格; 3:中式可爱风格; 4:英式街舞风格; 5:动漫风格; 6:嘻哈风格 |
filter_window | int | 否 | 表示动作平滑窗口;范围[3, 19],必须为奇数; | 15 | 15 |
filter_order | int | 否 | 表示平滑阶数,范围[3, 5]; | 3 | 3 |
speed_ratio | float | 否 | 表示动作播放速度控制;范围为[0,1]; | 0.5 | 0.5 |
返回示例:
名称 | 类型 | 描述 |
---|---|---|
audio_time | float | 上传的音频长度 |
code | int | 0表示成功,-1表示失败 |
oss_url | string | 返回动作文件url |
time_log | dict | 处理时间日志 |
请求示例:
{
"compress": false,
"audio_url": "http://ds-vhost-admin-dev.oss-cn-beijing.aliyuncs.com/permanent/68aebfe5e256449e8250390a4f953194.wav",
"audio_format": "wav",
"style_tag": "CakeGirlJQJSA"
}
返回示例:
{
"audio_time": 0.55,
"code": 0,
"oss_url": "https://ds-vhost-action-dev.oss-cn-beijing.aliyuncs.com/body/166902842125152134.json",
"time_log": {
"all_time": 0.4145646095275879,
"download_time": 0.0008797645568847656,
"featextr_time": 0.0001423358917236328,
"inference_time": 0.35712695121765137,
"upload_time": 0.05617880821228027
},
"version": 1.0.0
}