リポジトリ

w-okada のリポジトリ

Source code of APNet2, a vocoder

最終コミット 2023年11月23日

 (1 star) (0 forks) (0 件の索引済み issue) (0 件のオープンな good first issue)

最終コミット 2019年3月18日

 (0 stars) (0 forks) (0 件の索引済み issue) (0 件のオープンな good first issue)

Using joint training speaker encoder with consistency loss to achieve cross-lingual voice conversion and expressive voice conversion

最終コミット 2023年10月16日

 (0 stars) (0 forks) (0 件の索引済み issue) (0 件のオープンな good first issue)

最終コミット 2023年6月13日

 (0 stars) (1 fork) (0 件の索引済み issue) (0 件のオープンな good first issue)

OneShot Learning-based hotword detection.

最終コミット 2024年9月12日

 (0 stars) (0 forks) (0 件の索引済み issue) (0 件のオープンな good first issue)

A Fundamental End-to-End Speech Recognition Toolkit and Open Source SOTA Pretrained Models, Supporting Speech Recognition, Voice Activity Detection, Text Post-processing etc.

最終コミット 2024年9月19日

 (0 stars) (0 forks) (0 件の索引済み issue) (0 件のオープンな good first issue)

1 min voice data can also be used to train a good TTS model! (few shot voice cloning)

最終コミット 2026年4月30日

 (3 stars) (1 fork) (0 件の索引済み issue) (0 件のオープンな good first issue)

最終コミット 2023年11月8日

 (1 star) (0 forks) (0 件の索引済み issue) (0 件のオープンな good first issue)

Enhanced ChatGPT Clone: Features Agents, DeepSeek, Anthropic, AWS, OpenAI, Assistants API, Azure, Groq, o1, GPT-4o, Mistral, OpenRouter, Vertex AI, Gemini, Artifacts, AI model switching, message search, Code Interpreter, langchain, DALL-E-3, OpenAPI Actions, Functions, Secure Multi-User Auth, Presets, open-source for self-hosting. Active project.

最終コミット 2025年5月20日

 (1 star) (1 fork) (0 件の索引済み issue) (0 件のオープンな good first issue)

AIを使ったリアルタイムボイスチェンジャー(client)

最終コミット 2023年2月10日

 (2 stars) (0 forks) (0 件の索引済み issue) (0 件のオープンな good first issue)

AIを使ったリアルタイムボイスチェンジャー(Trainer)

最終コミット 2022年12月9日

 (1 star) (0 forks) (0 件の索引済み issue) (0 件のオープンな good first issue)

最終コミット 2023年8月10日

 (0 stars) (0 forks) (0 件の索引済み issue) (0 件のオープンな good first issue)

WinRTのGraphicsCaptureAPIでキャプチャしたウィンドウを仮想カメラとして映すサンプル

最終コミット 2022年2月17日

 (0 stars) (0 forks) (0 件の索引済み issue) (0 件のオープンな good first issue)

A repository for storing models that have been inter-converted between various frameworks. Supported frameworks are TensorFlow, PyTorch, ONNX, OpenVINO, TFJS, TFTRT, TensorFlowLite (Float32/16/INT8), EdgeTPU, CoreML.

最終コミット 2022年12月20日

 (0 stars) (0 forks) (0 件の索引済み issue) (0 件のオープンな good first issue)

最終コミット 2024年8月19日

 (0 stars) (0 forks) (0 件の索引済み issue) (0 件のオープンな good first issue)

Demo showcasing ~real-time Latent Consistency Model pipeline with Diffusers and a MJPEG stream server

最終コミット 2023年11月1日

 (1 star) (0 forks) (0 件の索引済み issue) (0 件のオープンな good first issue)

最終コミット 2023年8月7日

 (3 stars) (0 forks) (0 件の索引済み issue) (0 件のオープンな good first issue)

Multilingual Voice Understanding Model

最終コミット 2024年9月2日

 (2 stars) (0 forks) (0 件の索引済み issue) (0 件のオープンな good first issue)

StyleTTS 2: Towards Human-Level Text-to-Speech through Style Diffusion and Adversarial Training with Large Speech Language Models

最終コミット 2024年3月7日

 (1 star) (0 forks) (0 件の索引済み issue) (0 件のオープンな good first issue)

inverse kinematics for three.js

最終コミット 2022年5月9日

 (0 stars) (0 forks) (0 件の索引済み issue) (0 件のオープンな good first issue)