NLP 文字驱动数字人(问答类型)

输入问题文本获得答案文本、语音文件,并获得表情、身体动作等信息,身体动作可以根据实际情形选择是否生成。

请求地址:https://motionverseapi.deepscience.cn/v3.0/api/AnswerCollectMotion

请求方式:POST

请求类型:application/json

请求参数:

名称 类型 必填 描述 示例值
text string 问答请求文本 您好
audio_format string 表示语音的类型;若 audio_format 为”wav”,则表示语音数据为 wav 格式。若为“mp3”则语音数据是 MP3 格式;若为”base64”,则表示语音数据为 base64 格式; 默认为”wav”
tts_config ▼ object tts 请求参数设置 {}
tts_voice_name string 声音角色,可供选择的有 声音列表 默认值 aixia
tts_speed number 声音的速度 默认值 50,范围 0-100;face_type 为 2 的时候,建议此项数值设定为 40;
tts_volume number 声音的音量 默认值 50,范围 0-100
tts_fm number 声音的音调 默认值 50,范围 0-100
face_config ▼ object 表情请求参数设置 {}
face_type number 表情类型选择,1 为语音驱动表情,此时 face_gender 和 face_tag 起作用。2 为视素驱动,此时 face_gender 和 face_tag 不起作用。3、MetaHuman 驱动。4、表情生成驱动 默认为 2
face_gender string 可以设定表情性别,性别不同表情效果不同。性别 male 男性 女性 female 有默认值、默认 male
face_tag number 面部情绪 情绪 0-综合 1-高兴 2-悲伤 3-生气 4-惊讶 5-中立 6-激动 7-沮丧 8-恐惧 9-厌恶 默认值为 0
face_stretch_scale number face_type 为 2、3 时,表示希望嘴部发‘a’的音的夸张的程度,值越大在发’a’时嘴越夸张;范围[1.0, 3.0] 1.5
face_mouth_divisor number face_type 为 2、3 时,表示整体的嘴部的幅度,值越大嘴部整体幅度越小,范围[0.5, 3] 1.6
face_smile_template number 微笑模板,范围[0, 80] 只有 face_type 为 4 时生效 40
body_config ▼ object 动作请求参数设置 {}
body_motion number 身体动作,0=不生成身体动作 1=自然闲聊 2=通用演讲 3=通用讲解 4=丰富演讲 5=金姐演讲 6=可爱女生 7=站立直播 8=标准客服 9=坐姿直播 10=主持人风格 默认为空
body_filter_window number 表示动作自然度 数值越大自然效果越明显,但细节损失也会越多。范围 3-31,必须为奇数;此项必须与 order 搭配使用。非必须请默认此项。 默认值 15
body_filter_order number 动作自然阶数,范围 2-4,数值越小阶数越高;此项必须与 window 搭配使用。非必须请默认此项。 默认值 3
body_fixed_hips bool 表示获取动作数据是半身还是全身。如果是 True 就直接获取上半身数据,False 直接获取全身数据; 默认 false
body_head_x_rot number 用于调整头部的仰俯角度。范围为-180 度~ 180 度;正数表示低头,负数表示抬头 默认值 0
body_compress bool 表示返回的 oss_url 的内容是否是二进制;若为 True,生成的是二进制格式,二进制格式传输速度更快;若为 False,生成的是可读的 json 格式; 默认为 false

返回示例:

名称 类型 描述 示例值
code number 响应码 0
msg string 提示信息 正常返回”ok”,错误返回具体错误信息。
data▼ object
answerDmeasyData ▼ object 问答返回数据
answer string 答案文本 酒店有早餐
query string 问题文本 有早餐吗
result_from string 语义匹配:1.eva_chatbot:闲聊机器人;2.tencent_sim:语义匹配 tencent_sim
simquery string 与问答库中的哪个字段语义相似
ttsSynthesizeData▼ object tts 语音合成数据
audio_url string 生成的音频地址 href="http://xxx.xxx.wav" http://xxx.xxx.wav
allfaceData▼ object 表情动作数据
oss_url string bs 的 url href="http://xxx.xxx.json" http://xxx.xxx.json
time_log string 流程中的时间戳日志
audio_time number 播报时长 "audio_time": 2.8875
motionFusionedData▼ object 身体动作数据
oss_url string bs 的 url href="http://xxx.xxx.json" http://xxx.xxx.json
time_log string 流程中的时间戳日志
audio_time number 播报时长 "audio_time": 2.8875

请求示例:

{
  "text": "今天天气怎么样",
  "body_config": { "body_motion": 1 }
}

返回示例:

{
  "code": 0,
  "msg": "ok",
  "data": {
    "answerDmeasyData": {
      "answer": "抱歉,我还没想好怎么回答您的问题",
      "code": 0,
      "query": "你好,今天天气怎么样",
      "result_from": "tencent_sim",
      "simquery": ""
    },
    "ttsSynthesizeData": {
      "audio_url": "https://ds-model-tts.tos-cn-beijing.volces.com/temp/168619376484532062.wav"
    },
    "allfaceData": {
      "oss_url": "https://ds-vhost-action-dev.oss-cn-beijing.aliyuncs.com/mouth/168619376484532062.json",
      "time_log": {
        "all_time": 0.19165873527526855,
        "download_time": 0.0008087158203125,
        "featextr_time": 0.11763906478881836,
        "inference_time": 0.01115274429321289,
        "upload_time": 0.06200051307678223
      },
      "audio_time": 2.8875
    },
    "motionFusionedData": {
      "oss_url": "https://ds-vhost-action-dev.oss-cn-beijing.aliyuncs.com/body/168619376484532062.json",
      "time_log": {
        "all_time": 0.7395775318145752,
        "postprocess_motion_time": 0.0001316070556640625,
        "query_audio_time": 0.05816936492919922,
        "synth_motion_time": 0.5564372539520264,
        "upload_time": 0.11744952201843262
      },
      "audio_time": 2.8875
    }
  }
}

results matching ""

    No results matching ""