音乐文件驱动舞蹈数字人

通过音乐文件,生成口型、身体动作信息。

请求地址:https://motionverseapi.deepscience.cn/api/audio2dance

请求方式:POST

请求类型:application/json

请求参数:

名称 类型 必填 描述 默认值 示例值
audio_url string 与audio_b64二选一 语音文件链接(.wav, .mp3)或者内容为语音base64的文件链接(.json) http://www.xxx.wav
http://www.xxx.json
audio_b64 string 与audio_ url二选一 wav语音的base64编码
audio_format string 表示语音的类型;若audio_format为”wav”或者为空,则表示语音数据为wav格式或者mp3格式;若audio_format为”base64”,则表示语音数据为base64格式; 默认为空,表示”wav” “base64”
compress bool 表示返回的oss_url的内容是否是二进制;若为True,生成的是二进制格式;若为False,生成的是可读的json格式; False False
style_tag string 请求动作的tag类型 1 1: 流行风格;
2:中式传统风格;
3:中式可爱风格;
4:英式街舞风格;
5:动漫风格;
6:嘻哈风格
filter_window int 表示动作平滑窗口;范围[3, 19],必须为奇数; 15 15
filter_order int 表示平滑阶数,范围[3, 5]; 3 3
speed_ratio float 表示动作播放速度控制;范围为[0,1]; 0.5 0.5

返回示例:

名称 类型 描述
audio_time float 上传的音频长度
code int 0表示成功,-1表示失败
oss_url string 返回动作文件url
time_log dict 处理时间日志

请求示例:

{
    "compress": false,
    "audio_url": "http://ds-vhost-admin-dev.oss-cn-beijing.aliyuncs.com/permanent/68aebfe5e256449e8250390a4f953194.wav",
    "audio_format": "wav",
    "style_tag": "CakeGirlJQJSA"
}

返回示例:

{
    "audio_time": 0.55,
    "code": 0,
    "oss_url": "https://ds-vhost-action-dev.oss-cn-beijing.aliyuncs.com/body/166902842125152134.json",
    "time_log": {
        "all_time": 0.4145646095275879,
        "download_time": 0.0008797645568847656,
        "featextr_time": 0.0001423358917236328,
        "inference_time": 0.35712695121765137,
        "upload_time": 0.05617880821228027
    },
    "version": 1.0.0
}

results matching ""

    No results matching ""