仓库

Plachtaa 的仓库

speaker-disentangled speech linguistic content quantizer

最近提交 2025年3月19日

 (25 stars) (5 forks) (0 个已索引 issue) (0 个开放 good first issue)

Amphion (/æmˈfaɪən/) is a toolkit for Audio, Music, and Speech Generation. Its purpose is to support reproducible research and help junior researchers and engineers get started in the field of audio, music, and speech generation research and development.

最近提交 2024年6月25日

 (3 stars) (1 fork) (0 个已索引 issue) (0 个开放 good first issue)

Training code for FAcodec presented in NaturalSpeech3

最近提交 2024年8月26日

 (243 stars) (21 forks) (0 个已索引 issue) (0 个开放 good first issue)

最近提交 2024年9月18日

 (0 stars) (2 forks) (0 个已索引 issue) (0 个开放 good first issue)

[ICASSP'26] Real-time streaming voice anonymization & voice conversion

最近提交 2026年4月15日

 (75 stars) (9 forks) (0 个已索引 issue) (0 个开放 good first issue)

An open source implementation of Microsoft's VALL-E X zero-shot TTS model. Demo is available in https://plachtaa.github.io

最近提交 2023年11月3日

 (6,573 stars) (624 forks) (6 个已索引 issue) (6 个开放 good first issue)

This repo is a pipeline of VITS finetuning for fast speaker adaptation TTS, and many-to-many voice conversion

最近提交 2025年1月21日

 (5,017 stars) (730 forks) (0 个已索引 issue) (0 个开放 good first issue)

zero-shot voice conversion & singing voice conversion, with real-time support

最近提交 2025年4月20日

 (3,777 stars) (488 forks) (0 个已索引 issue) (0 个开放 good first issue)