
序列猴子
语音合成数字人大模型
出门问问推出的一款超大规模的语言模型
正在加载预览...
出门问问推出的一款超大规模的语言模型
正在加载预览...
出门问问开放平台(https://openapi.mobvoi.com)是以生成式AI和语音交互为核心的技术服务平台,为开发者提供多模态人工智能解决方案。该平台聚焦语音合成、数字人驱动和大模型应用三大领域,通过标准化API接口降低AI技术接入门槛。
语音合成(TTS)服务 采用第五代MeetHiFiVoice引擎,支持中英混合输入及普通话、粤语、四川话等12种方言,提供500+高品质发音人库。支持自定义音频参数配置,包括语速(0.5-2.0倍)、音调(0-200Hz)和音量(0-100dB),满足短视频配音、有声阅读、智能硬件语音交互等20+应用场景需求。
照片数字人工作流 通过ComfyUI节点包实现图像驱动技术,开发者可下载标准化工作流文件(JSON格式)快速集成。该服务支持将静态照片转化为动态数字人,配套语音合成API实现音画同步输出,适用于虚拟主播、在线教育等可视化交互场景。
序列猴子大模型平台 提供语言理解、文本生成和对话管理三大能力模块,支持多轮对话、知识问答和内容创作。模型支持实时交互响应,处理速度达到毫秒级,可集成于客服系统、智能助手等需要自然语言处理的业务场景。
行业领域 | 典型应用 |
---|---|
泛娱乐 | 短视频配音、虚拟偶像直播 |
教育 | 课件自动生成、AI教师 |
智能硬件 | 车载语音导航、智能家居控制 |
企业服务 | 智能客服、会议纪要转写 |