AI
很好搜
更多 +
广告合作
免责声明
我要投稿
首页
AI视频
AI创作
AI机器人
AI绘画
AI翻译
AI资讯
更多
文本转语音
DupDub AI
DupDub AI是一款一站式AI内容创作平台,专注于文本转语音(TTS)、语音克隆与视频配音等功能,旨在帮助创作者、教育者、营销人员及企业高效制作高质量的视频、音频和文本内容。
Bland TTS
Bland TTS 是先进文本转语音(TTS)工具,具备强大的声音克隆、情感表达和音效生成能力,重新定义了AI语音合成领域的标准。
ChatTTS-Forge
ChatTTS-Forge是一个围绕 TTS(文本转语音)生成模型开发的开源项目,旨在为开发者和研究者提供一个功能强大的TTS工具箱。它不仅提供了全面的 API 服务,还配备了一个基于Gradio的直观 WebUI,使用户能够方便地进行 TTS 任务。
Ciallo TTS
Ciallo TTS是一款免费的在线文本转语音(TTS)工具,支持超过300种语言和口音的声音选择,用户可以根据需要调节语速和语调,生成自然流畅的语音效果。它提供即时试听功能,用户可以在下载音频文件之前预听语音质量,确保满足需求。
Kokoro TTS
Kokoro TTS是一款先进的文本转语音(TTS)工具,专为创作者、开发者和企业设计,能够将文本高效转换为自然流畅的语音。它基于高效的8200万参数模型,支持多语言和多种语音风格,同时提供强
趣丸千音
趣丸千音(All Voice Lab)是一款全球领先的AI语音创作平台,专注于提供一站式智能语音解决方案。该平台基于趣丸科技与香港中文大学(深圳)联合研发的 MaskGCT 语音大模型 构建,在语音相似度、质量稳定性等指标上达到全球领先水平。
硅语AI
硅语AI知识创业平台是一款基于AI技术的视频创作与内容生成平台。该平台专注于创新AI技术的应用,提供一站式视频解决方案,涵盖多语言视频翻译、创意视频制作以及利用数字模特进行视频内容创作。
硅基智能
硅基智能是一家专注于人工智能商业化交互和产业落地的创新企业。核心技术包括语音识别(ASR)、文本生成语音(TTS)、语音克隆、声纹识别、意图识别和情绪识别等。其产品矩阵涵盖“硅语智能交互平台”、“协呼智能交互平台”、“硅语数
腾讯智影
腾讯智影是腾讯推出的一款云端智能视频创作工具,无需下载,通过PC浏览器即可访问。它集素材搜集、视频剪辑、后期包装、渲染导出和发布于一体,能够为用户提供从端到端的一站式视频剪辑及制作服务。
Freepik AI
Freepik AI是由全球最大的免费素材平台Freepik提供的一套强大的AI设计工具,旨在帮助用户通过简单的文字描述快速生成高质量的图像、视频和其他视觉内容。它结合了先进的 AI 技术和丰富的设计资源,适用于设计师、创意工作者、企业用户以及任
Kreado AI
Kreado AI是一款先进的人工智能驱动的数字人视频创作平台,旨在帮助用户快速生成高质量的多语言视频内容。该平台集成了多种功能,包括数字人视频创作、文本转语音、虚拟人物定制、AI 模型生成等,适用于营销、教育、娱乐等多个领域。
MyVocal.AI
MyVocal.AI是一款先进AI语音克隆工具,专注于语音克隆、文本转语音和AI音乐创作。它通过深度学习技术,能够快速克隆用户的声音,并将其应用于多种场景,如唱歌、演讲、视频配音等。
音独Ondoku
音独Ondoku是一款在线文字转语音(TTS)合成工具,利用先进的深度学习技术,将用户输入的文字内容转化为自然流畅的语音输出。它支持多种语言和语音风格,包括中文配音,并且可以调节语音的速度和音调。
音剪
音剪是喜马拉雅推出的一站式AI音频创作平台,为音频创作者和主播提供强大的在线剪辑能力、AI辅助功能和丰富的版权配乐资源。音剪集合了多项AI音频创作功能,包括AI音频剪辑、AI配乐、文章转语音、AI小说、音频转文字、AI分段、智能检测以
Seed-TTS
Seed-TTS 是一系列高质量文本到语音(TTS)模型,旨在生成高度逼真、自然流畅的语音。该模型基于深度学习和神经网络技术,通过大规模数据训练和复杂的算法设计,能够生成与人类语音几乎无法区分的语音。
ViiTor AI
ViiTor AI 是一个多功能的人工智能平台,主要提供视频翻译、语音克隆、语音合成、AI 虚拟形象视频生成等多种服务。ViiTor AI可以在音视频直播、在线视频和线上会议中实现实时转写和翻译,提供双语字幕功能。
Fish Audio
Fish Audio 是一个专注于文本转语音 (TTS) 技术的平台,致力开发文本转语音(TTS)模型。Fish Audio 发布的 Fish Speech 开源模型,基于 VQ-GAN、Llama 和 VITS 等前沿 AI 技术,能够将文本转换成逼真的语音
PlayHT
PlayHT是一个专注于AI语音生成的高效在线平台,帮助用户将文本快速转化为自然、逼真的语音。它提供超过600种AI语音,支持60多种语言和多样化的口音,适用于播客制作、教育内容、营销推广等多种场景。
MegaTTS3
MegaTTS3是由字节跳动与浙江大学联合开发的零样本语音合成系统,采用轻量级扩散模型,参数量仅为0.45亿。该系统能够高效生成高质量的语音,并支持中文、英文及中英混合语音合成。
Weights
Weights 是一款基于 AI 技术的创作平台,能够实现声音克隆、语音翻唱、文本转语音等多种功能。它通过深度学习算法模拟和复制人类的声音特征,为用户提供个性化的音频创作体验。
gpt-sovits
GPT-SoVITS 是一款开源的少样本语音克隆和文本转语音(TTS)工具,结合了深度学习和声学技术,能够实现高质量的语音合成。它支持多种语言的语音推理,包括中文、英语、日语、韩语和粤语。
Spark-TTS
Spark-TTS是SparkAudio团队开源的基于大型语言模型(LLM)的高效文本转语音(TTS)工具,无需额外的生成模型,直接从LLM预测的编码中重建音频,实现零样本文本到语音的转换。
Noiz AI
Noiz AI是一个为客户提供与真人无异、极具表现力语音合成能力的产品。依托自研的超大语音模型,在成本、效率和定制化服务方面均领先于行业,提供从瞬时生成到专业级声音克隆的多种选择,帮助客户根据需求精准匹配理想的语音体验。