Видео недоступно для предпросмотра
Смотреть в Telegram
واقعا باورنکردنیه!
مدل Kokoro یک مدل پیشرفتهی تبدیل متن به گفتار (TTS) با تنها ۸۲ میلیون پارامتره که میتونید با استفاده از transformers .js کامل در مرورگرتون اجرا کنید! 🤯
این مدل تحت لیسانس Apache 2.0 ارائه شده و فعلا از ۱۰ صدای منحصربه فرد انگلیسی پشتیبانی میکنه—اون هم بدون نیاز به اتصال به اینترنت!
و نکته شگفتانگیز اینه که Kokoro فقط با کمتر از ۱۰۰ ساعت داده صوتی آموزش دیده ولی عملکردش واقعا فوقالعاده است!
میتونید حتا صداها را هم با هم ترکیب کنید و صدای جدید درست کنید. سرعتش هم خیلی بالاست روی CPU, و روی GPU انت که توی ۵ ثانیه حدود ۳ دقیقه صدا (speech) تولید میشه. برای تولید محتوا که بینظیره! صدا را گوش بدید تو ویدیو.
توی این لینک HuggingFace هم همه صداها هست با لهجه های مختلف.
https://huggingface.co/spaces/ysharma/Make_Custom_Voices_With_KokoroTTS
با این چند خط کد میتونید نصب کنید و شروع کنید به استفاده:
pip install --upgrade "ai-gradio[kokoro]"
import gradio as gr
import ai_gradio
gr.load(name='kokoro:kokoro-v0_19', src=ai_gradio.registry,).launch()
#هوش_مصنوعی
🆔 @Ai_Tv
مدل Kokoro یک مدل پیشرفتهی تبدیل متن به گفتار (TTS) با تنها ۸۲ میلیون پارامتره که میتونید با استفاده از transformers .js کامل در مرورگرتون اجرا کنید! 🤯
این مدل تحت لیسانس Apache 2.0 ارائه شده و فعلا از ۱۰ صدای منحصربه فرد انگلیسی پشتیبانی میکنه—اون هم بدون نیاز به اتصال به اینترنت!
و نکته شگفتانگیز اینه که Kokoro فقط با کمتر از ۱۰۰ ساعت داده صوتی آموزش دیده ولی عملکردش واقعا فوقالعاده است!
میتونید حتا صداها را هم با هم ترکیب کنید و صدای جدید درست کنید. سرعتش هم خیلی بالاست روی CPU, و روی GPU انت که توی ۵ ثانیه حدود ۳ دقیقه صدا (speech) تولید میشه. برای تولید محتوا که بینظیره! صدا را گوش بدید تو ویدیو.
توی این لینک HuggingFace هم همه صداها هست با لهجه های مختلف.
https://huggingface.co/spaces/ysharma/Make_Custom_Voices_With_KokoroTTS
با این چند خط کد میتونید نصب کنید و شروع کنید به استفاده:
pip install --upgrade "ai-gradio[kokoro]"
import gradio as gr
import ai_gradio
gr.load(name='kokoro:kokoro-v0_19', src=ai_gradio.registry,).launch()
#هوش_مصنوعی
🆔 @Ai_Tv