仓库

w-okada 的仓库

Source code of APNet2, a vocoder

最近提交 2023年11月23日

 (1 star) (0 forks) (0 个已索引 issue) (0 个开放 good first issue)

最近提交 2019年3月18日

 (0 stars) (0 forks) (0 个已索引 issue) (0 个开放 good first issue)

Using joint training speaker encoder with consistency loss to achieve cross-lingual voice conversion and expressive voice conversion

最近提交 2023年10月16日

 (0 stars) (0 forks) (0 个已索引 issue) (0 个开放 good first issue)

最近提交 2023年6月13日

 (0 stars) (1 fork) (0 个已索引 issue) (0 个开放 good first issue)

OneShot Learning-based hotword detection.

最近提交 2024年9月12日

 (0 stars) (0 forks) (0 个已索引 issue) (0 个开放 good first issue)

A Fundamental End-to-End Speech Recognition Toolkit and Open Source SOTA Pretrained Models, Supporting Speech Recognition, Voice Activity Detection, Text Post-processing etc.

最近提交 2024年9月19日

 (0 stars) (0 forks) (0 个已索引 issue) (0 个开放 good first issue)

1 min voice data can also be used to train a good TTS model! (few shot voice cloning)

最近提交 2026年4月30日

 (3 stars) (1 fork) (0 个已索引 issue) (0 个开放 good first issue)

最近提交 2023年11月8日

 (1 star) (0 forks) (0 个已索引 issue) (0 个开放 good first issue)

Enhanced ChatGPT Clone: Features Agents, DeepSeek, Anthropic, AWS, OpenAI, Assistants API, Azure, Groq, o1, GPT-4o, Mistral, OpenRouter, Vertex AI, Gemini, Artifacts, AI model switching, message search, Code Interpreter, langchain, DALL-E-3, OpenAPI Actions, Functions, Secure Multi-User Auth, Presets, open-source for self-hosting. Active project.

最近提交 2025年5月20日

 (1 star) (1 fork) (0 个已索引 issue) (0 个开放 good first issue)

AIを使ったリアルタイムボイスチェンジャー(client)

最近提交 2023年2月10日

 (2 stars) (0 forks) (0 个已索引 issue) (0 个开放 good first issue)

AIを使ったリアルタイムボイスチェンジャー(Trainer)

最近提交 2022年12月9日

 (1 star) (0 forks) (0 个已索引 issue) (0 个开放 good first issue)

最近提交 2023年8月10日

 (0 stars) (0 forks) (0 个已索引 issue) (0 个开放 good first issue)

WinRTのGraphicsCaptureAPIでキャプチャしたウィンドウを仮想カメラとして映すサンプル

最近提交 2022年2月17日

 (0 stars) (0 forks) (0 个已索引 issue) (0 个开放 good first issue)

A repository for storing models that have been inter-converted between various frameworks. Supported frameworks are TensorFlow, PyTorch, ONNX, OpenVINO, TFJS, TFTRT, TensorFlowLite (Float32/16/INT8), EdgeTPU, CoreML.

最近提交 2022年12月20日

 (0 stars) (0 forks) (0 个已索引 issue) (0 个开放 good first issue)

最近提交 2024年8月19日

 (0 stars) (0 forks) (0 个已索引 issue) (0 个开放 good first issue)

Demo showcasing ~real-time Latent Consistency Model pipeline with Diffusers and a MJPEG stream server

最近提交 2023年11月1日

 (1 star) (0 forks) (0 个已索引 issue) (0 个开放 good first issue)

Multilingual Voice Understanding Model

最近提交 2024年9月2日

 (2 stars) (0 forks) (0 个已索引 issue) (0 个开放 good first issue)

StyleTTS 2: Towards Human-Level Text-to-Speech through Style Diffusion and Adversarial Training with Large Speech Language Models

最近提交 2024年3月7日

 (1 star) (0 forks) (0 个已索引 issue) (0 个开放 good first issue)

inverse kinematics for three.js

最近提交 2022年5月9日

 (0 stars) (0 forks) (0 个已索引 issue) (0 个开放 good first issue)