Video is unavailable for watching
Show in Telegram
واقعا باورنکردنیه!
مدل Kokoro یک مدل پیشرفتهی تبدیل متن به گفتار (TTS) با تنها ۸۲ میلیون پارامتره که میتونید با استفاده از transformers .js کامل در مرورگرتون اجرا کنید! 🤯
این مدل تحت لیسانس Apache 2.0 ارائه شده و فعلا از ۱۰ صدای منحصربه فرد انگلیسی پشتیبانی میکنه—اون هم بدون نیاز به اتصال به اینترنت!
و نکته شگفتانگیز اینه که Kokoro فقط با کمتر از ۱۰۰ ساعت داده صوتی آموزش دیده ولی عملکردش واقعا فوقالعاده است!
میتونید حتا صداها را هم با هم ترکیب کنید و صدای جدید درست کنید. سرعتش هم خیلی بالاست روی CPU, و روی GPU انت که توی ۵ ثانیه حدود ۳ دقیقه صدا (speech) تولید میشه. برای تولید محتوا که بینظیره! صدا را گوش بدید تو ویدیو.
توی این لینک HuggingFace هم همه صداها هست با لهجه های مختلف.
https://huggingface.co/spaces/ysharma/Make_Custom_Voices_With_KokoroTTS
با این چند خط کد میتونید نصب کنید و شروع کنید به استفاده:
pip install --upgrade "ai-gradio[kokoro]"
import gradio as gr
import ai_gradio
gr.load(name='kokoro:kokoro-v0_19', src=ai_gradio.registry,).launch()
#هوش_مصنوعی
🆔 @Ai_Tv
مدل Kokoro یک مدل پیشرفتهی تبدیل متن به گفتار (TTS) با تنها ۸۲ میلیون پارامتره که میتونید با استفاده از transformers .js کامل در مرورگرتون اجرا کنید! 🤯
این مدل تحت لیسانس Apache 2.0 ارائه شده و فعلا از ۱۰ صدای منحصربه فرد انگلیسی پشتیبانی میکنه—اون هم بدون نیاز به اتصال به اینترنت!
و نکته شگفتانگیز اینه که Kokoro فقط با کمتر از ۱۰۰ ساعت داده صوتی آموزش دیده ولی عملکردش واقعا فوقالعاده است!
میتونید حتا صداها را هم با هم ترکیب کنید و صدای جدید درست کنید. سرعتش هم خیلی بالاست روی CPU, و روی GPU انت که توی ۵ ثانیه حدود ۳ دقیقه صدا (speech) تولید میشه. برای تولید محتوا که بینظیره! صدا را گوش بدید تو ویدیو.
توی این لینک HuggingFace هم همه صداها هست با لهجه های مختلف.
https://huggingface.co/spaces/ysharma/Make_Custom_Voices_With_KokoroTTS
با این چند خط کد میتونید نصب کنید و شروع کنید به استفاده:
pip install --upgrade "ai-gradio[kokoro]"
import gradio as gr
import ai_gradio
gr.load(name='kokoro:kokoro-v0_19', src=ai_gradio.registry,).launch()
#هوش_مصنوعی
🆔 @Ai_Tv