傅莹的女儿婚礼图片IT之家 3 月 21 日消息,OpenAI 昨日(3 月 20 日)发布博文,宣布推出语音转文本(speech-to-text)和文本转语音(text-to-speech)模型,提升语音处理能力,支持开发者构建更精准、可定制的语音交互系统,进一步推动人工智能语音技术的商业化应用。
这两个模型支持超 100 种语言,主要通过强化学习和多样化高质量音频数据集训练,能捕捉细微语音特征,减少误识别,尤其在嘈杂环境、口音及不同语速下表现更稳定。
在文本转语音上,OpenAI 最新推出了 gpt-4o-mini-tts 模型,开发者通过“模拟耐心客服”或“生动故事叙述”等指令,控制语音风格,可以应用于客服(合成更具同理心的语音,提升用户体验)和创意内容(为有声书或游戏角色设计个性化声音)方面。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
滑翔遭“云吸”8000米高空,全身结冰奇迹生还!当事人还原脱险全过程,专家解读
哈利伯顿32+12+15步行者3-1尼克斯 西卡30+5布伦森31+5
32+12+15+0失误!被低估?哈利伯顿一战刷爆纪录 达成历史第1神迹
26只浮动费率基金质地如何?天弘品质价值需警惕,基金经理曾有2只基金亏40%
消息称 SK 海力士计划十月量产 12Hi HBM4,同步英伟达 GPU 节奏
《编码物候》展览开幕 北京时代美术馆以科学艺术解读数字与生物交织的宇宙节律
|