声音文件驱动数字人(播报类型)
通过声音文件,生成口型、身体动作信息,身体动作可以根据实际情形选择是否生成。
请求地址:https://motionverseapi.deepscience.cn/版本号/api/voiceBroadcastMotion
请求方式:POST
请求类型:application/json
请求参数:
名称 | 类型 | 必填 | 描述 | 示例值 |
---|---|---|---|---|
audio_url | string | 是 | 语音文件链接 | http://www.xxx.aa.wav |
compress | bool | 否 | 返回的 oss_url的内容是否是二进制,若为true,生成的是二进制格式数据,若为否为json格式,参数默认的是false。 | false |
face_config ▼ | object | 否 | 表情请求参数设置 | {} |
gender | string | 否 | 性别 男性male 女性female | male |
tag | number | 否 | 面部情绪 情绪 0-综合 1-高兴 2-悲伤 3-生气 4-惊讶 5-中立 6-激动 7-沮丧 8-恐惧 9-厌恶 | 默认值为0 |
body_config ▼ | object | 否 | 动作请求参数设置 | {} |
body_motion | number | 否 | 身体动作,如果不填,不生成身体动作,如果为1,客服动作;如果为2,适用于萌宠的动作,暂时还不支持;如果为3,线上自动画使用的动作;如果为4,售货员动作 | 默认为空 |
filter_window | number | 否 | 动作平滑窗口 范围3-19,奇数 | 默认值15 |
filter_order | number | 否 | 平滑阶数,范围3-5 | 默认值3 |
hermit_order | number | 否 | 非匀速动作曲线的阶数 范围3-5,调整插入动作,更像生成动作或者插入动作 | 默认值4 |
fusion_num | number | 否 | 动作融合过程的帧数,和上面关联 | 默认值17 |
speed_ratio | number | 否 | 动作播放速度控制 | 默认值0.5 |
insert_times | array | 否 | 插入动作时间(秒),(不传就没有动作融合) | [3, 10] |
insert_motions | array | 否 | 插入动作id ,字段长度与insert_times一致,(不传就没有动作融合) | ['ZZ01A00120220914T112639', 'ZZ03A00120220914T121405'] |
style_tag | string | 否 | 请求动作的tag类型,如果body_motion参数为1,style_tag参数为"kefu"等;如果body_motion参数为2,后续会支持;如果body_motion参数为3,支持2种tag的拼接,拼接用“,”分开,默认"Happy,Speech";参数列表见附件;如果body_motion参数为4,style_tag参数为“CakeGirlJQJSA”等; | 请求动作的tag类型,如果body_motion参数为1,style_tag默认参数为"kefu";如果body_motion参数为3,支持2种tag的拼接,拼接用“,”分开,默认"Happy,Speech";参数列表在文件尾部;如果body_motion参数为4,style_tag默认参数为“CakeGirlJQJSA”;如果motion参数为5,style_tag默认参数为”speech“ |
fixed_hips | bool | 否 | 如果是True就直接获取上半身数据,False直接获取全身数据; | 默认false |
limit_degree | number | 否 | 限制头部歪的角度,最小为1 | 有默认值,默认为90 |
limit_spine | bool | 否 | 头部+身体前倾左右轴是否锁定参数,如果为true,limit_degree需要在1-3之间 | 默认false |
head_x_rot | number | 否 | 用于调整仰头低头的角度。表示头沿X轴转动的角度,范围为-180度~180度;正数表示低头,负数表示抬头 | 默认值-10 |
返回参数:
名称 | 类型 | 描述 | 示例值 |
---|---|---|---|
code | number | 响应码 | 0 |
data ▼ | object | ||
allfaceData ▼ | object | 表情动作数据 | |
oss_url | string | bs的url | http://xxx.xxx.json |
time_log | string | 流程中的时间戳日志 | - |
motionFusionedData ▼ | object | 身体动作数据 | |
oss_url | string | bs的url | http://xxx.xxx.json |
time_log | string | 流程中的时间戳日志 |
请求示例:
{
"audio_url": "http://ds-model-tts.oss-cn-beijing.aliyuncs.com/temp/166320562819877046.wav",
"body_config":{ "body_motion": 3 }
}
返回示例:
{
"code": 0,
"msg": "ok",
"data": {
"allfaceData": {
"oss_url": "http://ds-vhost-action-dev.oss-cn-beijing.aliyuncs.com/mouth/166320562819877046.json",
"time_log": {
"all_time": 0.5266532897949219,
"download_time": 0.00028705596923828125,
"featextr_time": 0.2009444236755371,
"inference_time": 0.06331300735473633,
"upload_time": 0.26190972328186035
}
},
"motionFusionedData": {
"oss_url": "http://ds-vhost-action-dev.oss-cn-beijing.aliyuncs.com/body/166320562819877046.json",
"time_log": {
"all_time": 3.4123103618621826,
"download_time": 0.00018739700317382812,
"featextr_time": 0.2062695026397705,
"inference_time": 1.4894988536834717,
"upload_time": 1.7159702777862549
}
}
}
}