以下是关于合成照片的相关内容:
使用 Midjourney(MJ)生成人物图片:
1. 确定人物形象:如“a little girl wearing a yellow floral skirt + 人物动作 + 风格词”,在 MJ 中生成直到得到满意的人物图像。
垫图 URL + “In the forest,a little girl wearing a yellow floral skirt is playing happily,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2”
“iw”取值范围在,不填写默认“iw = 1”,“iw”值越大越接近垫的图像,反之更接近提示词。为确保人物一致性,取“iw 2”。
合成人物和场景:
1. 使用 PS 或者 Canva 将人物和场景合成到一张图,若色调不和谐:
将合成后的图作为垫图(“iw 2”),MJ 重新生图,提示词如:“垫图 url + Little girl wearing a yellow floral skirt,and her friend brown bear,taking shelter in the cave,rainstorm,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2”
使用 Camera Motion 合成照片:
1. 上传图片:点击“AddImage”上传图片。
2. 输入提示词:在“Prompt”中输入提示词。
3. 设置运镜方向:选择想要的运镜方向,输入。
4. 设置运动幅度:运动幅度和画面主体运动幅度有关,与运镜大小无关,可设置成任意值。
5. 其它:选择好种子(seed),是否高清(HD Quality),是否去除水印(Remove Watermark)。
6. 生成视频:点击“create”,生成视频。
照片数字人工作流及语音合成(TTS)API 出门问问 Mobvoi:
1. 照片数字人工作流 使用文档:
出门问问:语音合成(TTS)API 获取地址
参数及说明:
字段名:text,必填,类型为 String,要合成的文本内容,限制为 1000 字符。支持 ssml 标记语言,使用说明见附录 3。
字段名:appkey,必填,类型为 String,开发者在 AI 开放平台上申请的 appkey。
字段名:signature,必填,类型为 String,签名,通过“appkey + secret + timestamp”进行 md5 加密,得到的 32 位 MD5 值。每次请求实时计算签名,签名有效期为 10 分钟。
字段名:timestamp,必填,类型为 Long,当前时间戳,单位为秒。
字段名:speaker,否,类型为 String,合成音频指定发音人,默认值:cissy_meet,其他发音人传值及计费价格请参考声音商店。
字段名:audio_type,否,类型为 String,合成音频的格式,默认值:mp3,可选值:pcm/mp3/speexwb10/wav,只支持这四种格式中的一种。
字段名:speed,否,类型为 Float,发音人合成的语速,支持小数点后两位,默认值:1.0,可选值:0.5 2.0。
字段名:convert,否,类型为 String,默认值:无,可选值:robot,是否转化为机器声。
Request Header 设置
2024-10-16