3 秒复制任何人的嗓音,微软音频版 DALL・E 细思极恐
微软推出最新 AI 成果——语音合成模型 VALL·E,它脱胎于 DALL・E,但专攻音频领域。只需 3 秒语音,就能随意复制任何人的声音。
基于 AI「没听过」的声音合成语音,即零样本学习。VALL・E 解决了此前预训练 + 微调模式下,零样本场景导致的生成语音相似度和自然度差的问题。此外,它还同时还支持语音编辑、与 GPT-3 结合的语音内容创建。
VALL・E 还能模仿说话者的多种情绪,包括愤怒、困倦、中立、愉悦和恶心等好几种类型,同时,连说话者的环境背景音也能准确还原。
有网友畅想它可以应用的方向,包括帮助残障人士和别人对话,有声书录制等。
【温馨提示】本文内容和图片为发布者所有,本站只提供信息存储空间服务,如有涉嫌抄袭/侵权/违规内容请联系QQ:727533600 删除!
消息称苹果正开发触摸屏 Mac,可能在 2025 年推出1 月 12 日消息,据国外媒体报道,知情人士透露,苹果公司正准备为 MacBook Pro 添加触摸屏。多年来,苹果公司一直拒绝将触摸屏融入笔记本电脑。苹果联合创始人史蒂夫乔布斯(Steve Jobs)曾在 2010 年的发布会上表示,触摸屏笔记本电脑「从人体工程学角度来说很糟糕」。如果该公司继续推进触摸屏计划,这将是该公司理念上的一次重大逆转。据外媒报道,搭载...
比尔盖茨:AI 颇具革命性,不太看好 Web3 和元宇宙1 月 12 日消息,在 Reddit 上的年度 AMA 活动中,比尔盖茨被问到,现在有什么重要技术也处于此前互联网的类似阶段,盖茨表示:「人工智能才是最重要的,我不认为 Web3 的规模有那么大,也不认为元宇宙这件事本身具有革命性,但人工智能确实颇具革命性。」另外,也有用户问到盖茨对生成式人工智能的看法,以及他认为这种技术会怎样影响世界。他表示:「我...