Post #4305 — هوش مصنوعی|دیجیتال مارکتینگ| محمد زمانی (@Mohammad_zammani)

Type to search

Advanced channel search

English

Site language

Russian English Uzbek
Sign In

Catalog

Channels and groups catalog Search for channels
Add a channel/group
Ratings

Rating of channels Rating of groups Posts rating
Ratings of brands and people
Analytics
Search by posts
Telegram monitoring

هوش مصنوعی|دیجیتال مارکتینگ| محمد زمانی

5 Feb, 13:37

Open in Telegram Share Report

00:23

Video is unavailable for watching

Show in Telegram

00:20

Video is unavailable for watching

Show in Telegram

00:16

Video is unavailable for watching

Show in Telegram

00:10

Video is unavailable for watching

Show in Telegram

💬یه ویدئوی حیرت‌انگیز فقط با یه عکس از اینشتین و یه فایل صوتی ساخته شده!

شاید اولش فکر کنی این چطور ممکنه، ولی خب نکته جالب‌تر اینجاست که این کار رو یه مدل جدید به نام OmniHuman-1 از شرکت چینی ByteDance انجام می‌ده، و این مدل دقیقا می‌دونه چطور باید رفتار و حرکت‌های انسانی رو موقع حرف زدن یا اجرا کردن کلمات شبیه‌سازی کنه! این مدل می‌تونه بر اساس یه تصویر و یه فایل صوتی، یه ویدئوی فوق‌العاده واقعی بسازه که انگار اون شخص واقعاً داره حرف می‌زنه یا عمل می‌کنه! اینطور از دیدگاه تکنولوژی یه پیشرفت خیلی بزرگ به حساب میاد چون واقعاً از مرزهای معمول فراتر رفته.

مدل OmniHuman-1 با استفاده از معماری Diffusion Transformer که نوعی شبکه عصبی پیشرفته است، قادر به تولید ویدیوهای بسیار واقع‌گرایانه از انسان‌ها می‌شه. این یعنی فقط با داشتن یه عکس واضح از چهره یه فرد و صدای اون، مدل می‌تونه یک ویدئو از همون شخص بسازه که در اون به‌طور طبیعی حرف می‌زنه، می‌خونه یا حتی در حال انجام حرکات پیچیده‌ای مثل تعامل با اشیاء باشه.

این قابلیت برای ایجاد محتواهای بصری و صوتی، انقلابی تو دنیای تولید محتوا محسوب میشه. چرا؟ چون این مدل می‌تونه با درک عمیق از حرکات بدن، حالات صورت و هماهنگی‌های حرکتی، ویدئوهایی بسازه که واقعاً هیچ‌کس نمی‌تونه تشخیص بده که این مدل بوده که اون رو ساخته.

یعنی به‌طور کل میشه گفت این مدل از یادگیری عمیق و داده‌های حرکتی که در فاز آموزش استفاده کرده، برای تولید ویدئوهای طولانی، باکیفیت و واقعی از انسان‌ها استفاده می‌کنه.

🤔ویژگی‌های جالب OmniHuman-1:

🔘ورودی‌های متنوع: این مدل نه تنها از تصاویر چهره‌ نزدیک (Face Close-up)، پرتره (Portrait)، نیم‌تنه (Half Body) و تمام‌تنه (Full-Body) پشتیبانی می‌کنه، بلکه با ورودی‌های صوتی و تصویری مختلف می‌تونه ویدئوهای متنوع و جذاب تولید کنه.

🔘ساخت ویدئوهای طبیعی: توانایی ساخت ویدئوهایی که شخص در حال صحبت کردن، آواز خواندن، تعامل با اشیاء یا حتی انجام حرکات پیچیده بدنی است. این ویژگی به این مدل اجازه می‌ده که در موقعیت‌های مختلف، بسیار طبیعی و واقع‌گرایانه عمل کنه.

🔘سبک‌های تصویری مختلف: OmniHuman-1 با انواع سبک‌های تصویری سازگار هست، یعنی می‌تونه تصاویر در هر سبکی مثل کارتونی، رئال، یا حتی هنری رو با صدای مربوطه ترکیب کنه و ویدئویی بسازه که خیلی طبیعی به نظر بیاد.

🔘ورودی‌های ترکیبی: این مدل حتی می‌تونه از ورودی‌های ترکیبی مانند صدا (Audio-Driven)، ویدئو (Video-Driven) و حتی ترکیب این دو استفاده کنه. این ویژگی باعث می‌شه که در موقعیت‌هایی که اطلاعات بیشتری از منابع مختلف داریم، می‌تونه خروجی‌های به‌مراتب دقیق‌تری بسازه.

این مدل نه تنها محدود به استفاده‌های هنری و تفریحی نیست بلکه می‌تونه در زمینه‌های سینما، بازی‌های ویدیویی، آموزش و ارتباطات هم انقلابی به پا کنه. مثلا در سینما میشه از این تکنولوژی برای ساخت فیلم‌های پیچیده و دقیق‌تر استفاده کرد یا در بازی‌های ویدیویی شخصیت‌ها می‌تونن به شکلی طبیعی‌تر با بازیکن‌ها تعامل داشته باشن. حتی در زمینه‌های آموزشی هم میشه از این تکنولوژی برای ساخت محتوای آموزشی تعاملی و جذاب استفاده کرد.

برای اطلاعات بیشتر و جزئیات فنی‌تر، می‌تونید به وب‌سایت رسمیشون سر بزنید.

#هوش_مصنوعی

✈️@mohammad_zammani

467 0 29 8 11

Catalog

Channels and groups catalog Channels compilations Search for channels Add a channel/group

Ratings

Rating of Telegram channels Rating of Telegram groups Posts rating Ratings of brands and people

API

API statistics Search API of posts API Callback

Our channels

@TGStat @TGStat_Chat @telepulse @TGStatAPI

Read

Blog Telegram Research 2019 Telegram Research 2021 Telegram Research 2023

Contacts

Support Email Jobs

Miscellaneous

Terms and conditions Privacy policy Public offer

Our bots

@TGStat_Bot @SearcheeBot @TGAlertsBot @tg_analytics_bot @TGStatChatBot

ИП Кижикин | ИНН: 616803600305 | Москва, Оборонная 6-28