Data Science | علم داده


Гео и язык канала: Иран, Фарси
Категория: Технологии


📊 دانشمند داده شوید!
👔 جهت درج تبلیغات، به آیدی زیر پیام دهید:👇🏼‌
🆔 @DataScienceir_Adv

Связанные каналы  |  Похожие каналы

Гео и язык канала
Иран, Фарси
Категория
Технологии
Статистика
Фильтр публикаций


Видео недоступно для предпросмотра
Смотреть в Telegram
💥 کل کارای دیتا ساینست رو فقط با یه پرامپت انجام بده!


👩🏻‍💻 می‌دونی چی باور نکردنیه؟ این‌که اولین تجربه‌ی کاریم تو حوزه علم داده که یه پیش‌بینی روی دیتاست معروف تایتانیک بود رو، حالا می‌شه با یه دستور ساده انجامش داد!


✅ از این به بعد با ایجنت هوش مصنوعی علم داده در کولب، می‌تونین فقط با یه پرامپت ساده کل روند دیتا ساینس رو هندل کنین! این ایجنت خودش دیتا رو می‌خونه، تمیز می‌کنه، تحلیل می‌کنه، ویژگی‌ها رو می‌سازه، مدل رو آموزش می‌ده و حتی بهینه‌اش می‌کنه. بعد، یه نوت‌بوک کامل تحویلت می‌ده که آماده است!

📹 از این فرآیندم یه ویدیو هم گرفتم و گذاشتم تا ببینین خود ابزار چطور کار می‌کنه و چه خروجی‌ می‌ده.


🌀 Data Science Agent
✏️ Article
🖥 Notebook



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


آکادمی هوش تجاری ویترای برگزار می‌کند:
وبینار رایگان «مسیر شغلی تحلیل داده: از مهارت تا استخدام»

در این #وبینار با حضور سه متخصص ارشد #هوش_تجاری در شرکت های بزرگ کشور، به بررسی مسیر شغلی، چالش‌ها و مهارت‌های مورد نیاز برای ورود به حوزه شغلی #تحلیلگر_داده می‌پردازیم.

موضوعات مورد بررسی:
✳️ معرفی مسیر شغلی تحلیلگر داده و نقش.های مختلف در این حوزه
✳️ مهارت‌های ضروری برای ورود و رشد در مسیر تحلیل داده
✳️ چالش‌ها و فرصت‌های شغلی در بازار کار ایران
✳️ مقایسه مسیر شغلی در سازمانی‌‌های صنعتی، بانکی و تجارت الکترونیک
✳️ توصیه‌هایی از متخصصان برای مصاحبه‌های استخدامی

سخنرانان:
✳️ مهندس افخم نیا: توسعه دهنده ارشد هوش تجاری گروه صنعتی انتخاب
✳️ دکتر حداد: توسعه دهنده ارشد هوش تجاری شرکت داتا (وابسته به بانک تجارت)
✳️ مهندس صفیری: توسعه دهنده ارشد هوش تجاری دیجی‌کالا


🗓زمان: شنبه ۲۳ فروردین ۱۴۰۴
🕢ساعت: ۱۸:۳۰
------------------------------------------------

ثبت نام از طریق ایوند: evnd.co/fpFqw

🌐 academy.vitrayco.com

-----------------------------------------------


🌿 سال جدید یک مهارت جدید

🍎 امسال یه مهارت جدید و پولساز یادبگیر، ما هم به استخدامت کمک می‌کنیم.

🪙 تخفیف‌های نوروزی دوره‌های برنامه‌نویسی، علم داده و هوش‌مصنوعی

🐟 شروع راه یادگیری و استخدام:
https://dnkr.ir/kADVx
https://dnkr.ir/kADVx


📚 15 کتابی که هر دانشمند داده‌ باید بخونه!


👨🏻‍💻 اینا لیست کتاباییه که خودم ازشون یاد گرفتم یا به پیشنهاد دیتا ساینتیست‌های با تجربه خوندم:


تحلیل داده و برنامه‌نویسی:


1️⃣ کتاب Python for Data Analysis

2️⃣ کتاب Data Science for Beginners

3️⃣ کتاب Data Science from Scratch

4️⃣ کتاب .Fundamentals of Data Viz

5️⃣ کتاب R for Data Science

6️⃣ کتاب A Hands-on Intro to Big DA

➖ ➖ ➖ ➖ ➖

ریاضیات و آمار:


7️⃣ کتاب naked statistics

8️⃣ کتاب Essential Math for Data Science

➖ ➖ ➖ ➖ ➖

توسعه شغلی و مسیر حرفه‌ای:


9️⃣ کتاب Build a Career in Data Science

1️⃣ کتاب The Data Science Handbook

1️⃣ کتاب Winning with Data Science

1️⃣ کتاب Becoming a Data Head

➖ ➖ ➖ ➖ ➖

اخلاق در دیتا:


1️⃣ کتاب Ethical Data Science

1️⃣ کتاب Data Science in Context

1️⃣ کتاب The Art of Data Science



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


@DataScience_ir - Leetcode Python Solutions.pdf
552.0Кб
📄 جزوه «حل مسائل Leetcode با پایتون»


👨🏻‍💻 مدتیه که با پایتون دارم مسائل Leetcode رو حل می‌کنم. یه جا تصمیم گرفتم همه راه‌حل‌ها رو جمع کنم و تو یه فایل بذارم کنار هم.

✔️ اگر دنبال یاد گرفتن تکنیک‌های حل مسئله با پایتون هستین یا مثل من عاشق این مدل چالش‌هایین و روی مهارت حل مسئله‌ات کار می‌کنین، این جزوه رو از دست ندین! 💯



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


✨ آیا آماده‌ای که با آموزش پایتون، دنیای برنامه‌نویسی رو فتح کنی؟ 🐍

کانال تلگرام "هایتک" جاییه که می‌تونی یادگیری پایتون رو به صورت کاملاً رایگان و حرفه‌ای شروع کنی!

ما توی "هایتک" با آموزش‌های قدم به قدم، پروژه‌های عملی جذاب و پشتیبانی 24 ساعته، بهت کمک می‌کنیم تا از یه مبتدی به یه برنامه‌نویس حرفه‌ای پایتون تبدیل شی. 🚀

@HiTech_Codes :لینک تلگرام هایتک


Репост из: مدرسه پردازش و تحلیل داده دقیقه
Видео недоступно для предпросмотра
Смотреть в Telegram
📽️ استخراج داده از وب

#ویدئوی_معرفی_دوره

🎓 مجید پورکاشانی | هم‌بنیان‌گذار، توسعه‌دهنده نرم‌افزار و مهندس داده در شرکت پردازش و تحلیل داده دقیقه، کارشناسی مهندس برق از دانشگاه شریف و کارشناسی ارشد هوش مصنوعی از دانشگاه علم‌و‌صنعت

Web Scraping with Python and Other Tools

📆 چهارشنبه‌ها ۱۸:۳۰ تا ۲۱:۳۰
🗓 از ۱۷ اردیبهشت ۱۴۰۴
⏺️ ۱۵ ساعت (۵ هفته)
🎞 با دسترسی به ویدئوی جلسات
🏅 گواهی پایان دوره (قابل استعلام)

⏳ برای استفاده از تخفیف بیشتر زودتر ثبت‌نام کنید:

🙂 کد تخفیف 30% برای پرداخت کامل: VpfR30
🙂 کد تخفیف 20% برای پرداخت قسطی: VpFr20

🔴 اعتبار کدهای تخفیف تا ۲۲ فروردین ۱۴۰۴

🔗 لینک ثبت نام:

d-learn.ir/wbsp?utm=wsvp

تماس:
📱 t.me/dlearnsup
📞 02188349244
📲 09103209837

@dlearn_ir


⁉️چرا وقتی می‌تونی با همین دانش در ایران درآمد دلاری داشته باشی، به ریال قانع می‌شی؟

⭕️ سرفصل‌های مهم این وبینار:
- معرفی پلتفرم‌های جهانی فریلنسری
- شرایط حضور در بازارهای جهانی
- میزان مهارت و میانگین حقوق دریافتی

این وبینار مناسب چه رشته‌هایی هست؟
- برنامه‌نویسی، طراحی سایت، UI & UX دیزاین، معماری، مهندسی مکانیک، موشن گرافیک، دیتا ساینس و... .


📌 لینک ثبت‌نام مستقیم رایگان :
https://links.etekanesh.com/DataScien3


🎯 از بیزنس آنالیست به دیتا ساینتیست
بدون مدرک ارشد و گذروندن بوت‌کمپ!🙂‍↔️


👩🏻‍💻 وقتی این تغییر شغلی رو شروع کردم، نه بوتکمپی گذرونده بودم، نه مدرک فوق‌لیسانس داشتم. ولی با مجموعه‌ای از تجربه‌ها، ریسک‌ها و برنامه‌ریزی‌ها به هدفم رسیدم.

✏️ این مسیر، پله‌پله و پر از آزمون و خطاست، ولی شدنیه! اینجا می‌خوام چند تجربه از مسیرم رو باهاتون به اشتراک بذارم:👇


🔢 اتوماسیون رو از دل کارای تکراری پیدا کردم!

🥵 چند ماه بود که مشغول کار بودم که دیدم بخش زیادی از وقتم روی درخواست‌های تکراری می‌ره؛ مثلاً هی باید کوئری SQL می‌نوشتم برای کسایی که خودشون بلد نبودن دیتا بگیرن. پس یه ابزار ساختم که خودش دیتارو بگیره، بدون اینکه کسی SQL بلد باشه. حتی براش ورکشاپ گذاشتم، جلسه مشاوره گذاشتم تا جا بیوفته.

نتیجه؟ نقش من از کار تکراری دیتا کشیدن، تبدیل شد به طراحی ابزارها و ابزارسازی. این اولین قدمی بود که منو به سمت پروژه‌های مهم‌تر برد.

➖ ➖ ➖ ➖ ➖

🔢 یاد گرفتم کِی “نه” بگم!

🥵 واسه اینکه بتونم رو پروژه‌های مهم تمرکز کنم، مجبور بودم به خیلی درخواستا “نه” بگم. چند تا سؤال طراحی کرده بودم که کمک می‌کرد بفهمم کدوم درخواست واقعاً مهمه:

🔴 این دیتا چه تصمیمی رو تغییر می‌ده؟

🟡 اگه نداشته باشیش چی می‌شه؟

💙 دقیقاً کی و چرا بهش نیاز داری؟

✅ این سؤالا خیلی وقتا خودش باعث می‌شد طرف بی‌خیال بشه. 😅

➖ ➖ ➖ ➖ ➖

🔢 پروژه‌هایی گرفتم که از حد توانم بیش‌تر بودن!

🥵 یه بار قول دادم یه دیتابیس کامل بسازم، در حالی که هیچی ازش نمی‌دونستم! آخر هفته‌ها نشستم یاد گرفتم. سخته، ولی نتیجه‌ش این شد که سریع رشد کردم و تونستم یه پروژه با ارزش تحویل بدم.

➖ ➖ ➖ ➖ ➖

🔢 استراتژی محصول رو یاد گرفتم.

🥵 فهمیدم مشکل اصلیم تو مصاحبه‌های دیتاساینس، نداشتن درک از محصوله. پس رفتم سراغ مدیران محصول‌ها، باهاشون صحبت کردم و ارشون پرسیدم:

🔴 دقیقاً چه کاری می‌کنن؟
🟡 استراتژی محصول یعنی چی؟
💙 دیتا چطوری می‌تونه بهشون کمک کنه؟

✅ همین سؤالا باعث شد توی مصاحبه‌های بعدی خیلی بهتر ظاهر بشم. مخصوصاً مصاحبه‌ای که منو برد به اینستاگرام.

➖ ➖ ➖ ➖ ➖

🔢 با یه مدیرِ تیم دیتا رفیق شدم.

🥵 یه نفر تو تیم‌مون بود که کارش با دیتا بود. رفتم سراغش، ازش یاد گرفتم، فیدبک گرفتم، تو لانچ ابزارم ازش کمک گرفتم. شد منتور من. وجود اون آدم، مسیرم رو کلی تسریع بخشید.



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


لیستی از «پروژه‌های واقعی» در حوزه علوم داده


👨🏻‍💻 اینکه بدونی شرکت‌های بزرگی مثل اوبر، نتفلیکس، لینکدین و... دقیقاً چطوری از علم داده و مدل‌های پیشرفته استفاده می‌کنن، خیلی تو تجربه کاریت تاثیر داره! منظورم پروژه‌هایی که واقعاً تو شرکت‌های بزرگ اجرا شدن و بشه ازشون یاد گرفت، نه فقط پروژه‌های آموزشی ساده...!

✏️ واسه همین تصمیم گرفتم از دل مقالات، کنفرانس‌ها و منابع مختلف، مجموعه ویدیوهایی از همین پروژه‌های واقعی بسازم.

📝 اینجا یه لیست از همه اون ویدیوها رو جمع کردم که می‌تونه خیلی تو این مسیر کمکتون کنه و بهتون یه دید واقعی از علم داده بده.👇


😉 DeepSeek R1: لینک

😉 GenAI @ Uber & Yelp: لینک

😉 RAG for Private Data: لینک

😉 UberEats Debiasing: لینک

😉 Pinterest Ranking Shift: لینک

😉 Spotify GNN RecSys: لینک

😉 Fraud in E-commerce: لینک

😉 Returns Fraud: لینک

😉 LinkedIn Ad Budget: لینک

😉 Netflix Calibration: لینک

😉 Netflix Unified RecSys: لینک

😉 IG & Twitter Recsys: لینک

😉 Bandit Models: لینک

😉 Recsys Bias Fix: لینک

😉 Two-Tower Retrieval: لینک

😉 Meituan RecSys: لینک

😉 LinkedIn CTR Model: لینک

😉 Uplift @ Instagram: لینک

😉 Pinterest Ads RecSys: لینک

😉 Dynamic Pricing: لینک

😉 Product Embeddings: لینک

😉 BERT for Entities: لینک

😉 Twitter RecSys: لینک

😉 ANN Annoy: لینک

😉 ANN PQ: لینک

😉 PID for Diversity: لینک



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


@DataScience_ir - Data Modeling Guide.pdf
1006.3Кб
📄 جزوه جامع «مدل‌سازی داده»


👨🏻‍💻 وقتی پروژه‌ام به مدل‌سازی داده نیاز داشت، تازه فهمیدم این موضوع چقدر جدیه و تأثیرگذاره! یه مدل داده‌ای درست، یعنی ذخیره‌سازی بهینه، اجرای سریع‌تر کوئری‌ها و آنالیز بدون دردسر.

🎯 اگه دنبال موقعیت‌های مهندسی داده، علم داده یا BI هستی، تسلط روی مفاهیم مدل‌سازی داده یه برگ برنده توی پروژه‌ها و مصاحبه‌ها به حساب میاد!

✅ این جزوه پر از مثال‌های کاربردی، سناریوهای واقعی و سوالات مصاحبه‌ای هست که خیالتونو از هر نظر تو این حوزه راحت می‌کنه.



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


📊 11 نمودار ضروری پروژه‌های علوم داده


👨🏻‍💻 درک درست از داده‌ها و پیش‌بینی‌ها، فقط زمانی امکان‌پذیر می‌شه که بتونی از نمودارها به خوبی استفاده کنی. یه نمودار خوب می‌تونه تو چند ثانیه بینشی رو بهت بفهمونه که شاید صدها خط کد و عدد نتونن.


📌 اینجا ۱۱ تا از مهم‌ترین نمودارهایی که توی دیتا ساینس ۹۰٪ مواقع استفاده میشن رو آوردم:


1️⃣ نمودار KS: مقایسه توزیع دو مجموعه داده و تعیین شباهتشون.


2️⃣ نمودار SHAP: بررسی میزان تأثیر متغیرهای مختلف روی خروجی مدل.


3️⃣ منحنی ROC: ارزیابی عملکرد مدل‌های طبقه‌بندی در تشخیص درست و غلط.


4️⃣ منحنی Precision-Recall: بررسی تعادل بین دقت و میزان بازخوانی مدل.


5️⃣ نمودار QQ: مقایسه توزیع داده‌های واقعی با یک توزیع تئوری (مثلاً نرمال).


6️⃣ نمودار Cumulative Explained Variance: تعیین تعداد ابعاد مورد نیاز در کاهش ابعاد با روش PCA.


7️⃣ منحنی Elbow: پیدا کردن تعداد بهینه خوشه‌ها در الگوریتم k-means.


8️⃣ منحنی Silhouette: روشی بهتر برای انتخاب تعداد خوشه‌ها نسبت به منحنی Elbow.


9️⃣ نمودار Gini-Impurity & Entropy: مقایسه میزان بی‌نظمی داده‌ها در درخت تصمیم‌گیری.


1️⃣ نمودار Bias-Variance Tradeoff: بررسی تعادل بین سادگی و پیچیدگی مدل.


1️⃣ نمودار PDP: نمایش رابطه‌ی بین ویژگی‌های ورودی و متغیر هدف.



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


⚡️ پردازش سریع داده‌های حجیم با smallpond


👨🏻‍💻 تا حالا برات پیش اومده که بخوای با یه دیتاست حجیم کار کنی و ابزارای موجود یا کند باشن یا زیادی پیچیده؟ من بارها توی پروژه‌هام با این چالش روبه‌رو بودم.

✏️ اما حالا DeepSeek یه فریم‌ورک جدید و رایگان به اسم smallpond معرفی کرده که کاملاً متن‌باز و برای کارهای پردازش داده طراحی شده.


چرا این ابزار رو باید داشته باشین؟

🔢 سرعت پردازش بالا: روی DuckDB ساخته شده، پس برای کارهای سنگین با دیتای حجیم کاملاً جواب می‌ده.

🔢 مقیاس‌پذیری بالا: از دیتای کوچیک تا دیتاست‌های پتابایت رو بدون مشکل هندل می‌کنه.

🔢 سادگی در اجرا: هیچ خبری از سرویس‌های سنگین، پیچیده و طولانی‌ مدت نیست. خیلی راحت می‌تونی شروع کنی و باهاش کار کنی.


💰 smallpond
🐱 GitHub-Repos

pip install smallpond



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


@DataScience_ir - Used Car Market Trends.pdf
568.1Кб
☑️ پروژه علم داده من
2️⃣ تحلیل بازار خودروهای دست دوم


👨🏻‍💻 تو پروژه اخیرم، بازار خودروهای دست دوم رو با دیتا ساینس زیر و رو کردم! هدفم این بود که بفهمم قیمت‌ها چطوری تعیین می‌شن و چه خبره تو این بازار. همیشه برام سوال بود که چرا بعضی ماشینا یهو گرون می‌شن و بعضیا ارزون.


✏️ چالش‌های این پروژه:

🔴 پیدا کردن تعداد بهینه کلاسترها.

🟡 حذف داده‌های پرت.

✅️بررسی تاثیر سن ماشین روی قیمتش.

📣 از دیتاست و کد نویسی گرفته تا آنالیز و نتایج پروژه، همگی در لینک‌ زیر موجوده.👇


💡 Used Car Market Trends
🐱 GitHub-Repos



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


🤔 مگه دیتا ساینتیست «10 برابر بهتر از بقیه» هم وجود داره؟


👨🏻‍💻 تا حالا شده یکی رو ببینی که همزمان چند تا پروژه رو انجام می‌ده، مدل می‌سازه، دپلوی می‌کنه و هنوزم وقت داره روی ایده‌های جدید کار کنه؟


✏️ من چند نفر از این آدمارو تو گوگل و PayPal دیدم و واقعاً تاثیرشون رو تیم وحشتناک زیاد بود! اونا تو یه ماه، ۱ یا ۲ تا پروژه رو تموم می‌کنن، در حالی که بقیه ممکنه ماه‌ها وقت بذارن! ولی چی باعث میشه انقدر مؤثر باشن؟


چند تا ویژگی کلیدی توی این افراد دیدم:

⏯️ سریع اجرا می‌کنن، بدون وسواس! حوصله‌ی سر و کله زدن با پیچیده‌ترین مدلارو ندارن، همون چیزی که جواب بده رو سریع پیاده می‌کنن. اگه XGBoost جواب بده، چرا برم سراغ یه مدل پیچیده‌تر؟


2️⃣ همزمان روی چند تا کار تمرکز دارن! اینا استاد مدیریت کارهای موازی‌ان. می‌تونن همزمان یه مدل جدید تست کنن، یه لحظه تو تحقیقات عمیق غرق بشن و همزمان داکیومنتیشن پروژه قبلی رو تکمیل کنن.


3️⃣ عاشق اتوماسیونن! یه بار یه کد می‌نویسن و بعدش دیگه هیچی رو از صفر نمی‌سازن. کد هر مدلی رو که تحویل می‌دن، ذخیره می‌کنن و توی پروژه‌های بعدی ازش استفاده مجدد می‌کنن.


4️⃣ همه‌فن‌حریفن! یه سوال ازشون بپرسی، هم از تئوری پشتش میگن، هم از پیاده‌سازیش، هم از تاثیرش روی بیزینس. یه پا ویکی‌پدیای زنده‌ان!


5️⃣ فول‌استکن و دوست‌داشتنی! فقط دیتا ساینتیست نیستن، دیتا انجینیر و حتی نیمچه مهندس نرم‌افزار هم هستن. کدنویسی‌شون تمیزه و دولوپرهای تیم، عاشق کار کردن باهاشونن.



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


🔥 چه‌جوری تو سال 2025 یک دانشمند داده بشیم؟


1️⃣ اول از همه، پایه‌تو قوی کن (ریاضی و آمار).

✏️ اگه ریاضی رو بلد نباشی، هر جا بری به مشکل می‌خوری. هر مدلی که بسازی، هر تحلیلی که انجام بدی، پشتش یه دنیای ریاضیه. اینا رو باید خوب بلد باشی:

✅ جبر خطی: لینک

✅ حساب دیفرانسیل و انتگرال: لینک

✅ آمار و احتمال: لینک

➖➖➖➖➖➖

2️⃣ بعدش برنامه‌نویسی رو یاد بگیر!

✏️ بدون معطلی برو سراغ یادگیری پایتون و SQL.

✅ پایتون: لینک

✅ زبان SQL: لینک

✅ ساختمان داده و الگوریتم‌ها: لینک

➖➖➖➖➖➖

3️⃣ یاد بگیر که داده‌ها رو تمیز و تحلیل کنی!

✏️ داده‌ها همیشه بهم‌ریخته‌ان، و یه دانشمند داده باید بلد باشه چجوری اونا رو مرتب کنه و ازشون بینش بگیره.

✅ پاکسازی داده‌‌ها: لینک

✅ مصورسازی داده‌ها: لینک

➖➖➖➖➖➖

4️⃣ یادگیری ماشین رو یاد بگیر!

✏️ زمانی که مهارت‌های پایه رو یاد گرفتی، وقتشه که وارد دنیای یادگیری ماشین بشی. اینا رو باید بلد باشی:

◀️ یادگیری نظارت‌شده: رگرسیون، طبقه‌بندی

◀️ یادگیری بدون نظارت: خوشه‌بندی، کاهش ابعاد

◀️ یادگیری عمیق: شبکه‌های عصبی، CNN، RNN

دوره CS229 دانشگاه استنفورد: لینک

➖➖➖➖➖➖

5️⃣ با کلان‌ داده و پردازش ابری آشنا شو!

✏️ شرکت‌های بزرگ دنبال کسایی هستن که بتونن با حجم‌های بزرگ داده کار کنن.

◀️ ابزارهای کلان‌داده (مثل Hadoop, Spark, Dask)

◀️ سرویس‌های ابری (AWS, GCP, Azure)

➖➖➖➖➖➖

6️⃣ پروژه واقعی انجام بده و پورتفولیو بساز!

✏️ هرچی تا اینجا یاد گرفتی بدون پروژه واقعی، ارزشی نداره!

◀️ توی Kaggle شرکت کن و با داده‌های واقعی کار کن.

◀️ یه پروژه صفر تا صد انجام بده (از جمع‌آوری داده تا دیپلوی مدل)

◀️ کدت رو تو گیت‌هاب بذار.

✅ پروژه‌های اُپن‌سورس علوم داده: لینک

➖➖➖➖➖➖

7️⃣ وقتشه MLOps و دیپلوی مدل‌ها رو یاد بگیری!

✏️ خیلی‌ها فقط مدل می‌سازن ولی بلد نیستن چه‌جوری دیپلوی کنن. اما شرکت‌ها کسی رو می‌خوان که بتونه مدل رو به مرحله اجرا برسونه!

◀️ عملیات‌سازی یادگیری ماشین (مانیتورینگ، به‌روزرسانی مدل‌ها)

◀️ ابزارهای دیپلوی مدل: Flask, FastAPI, Docker

✅ دوره MLOps دانشگاه استنفورد: لینک

➖➖➖➖➖➖

8️⃣ همیشه به‌روز بمون و شبکه‌سازی کن!

✏️ مقالات پژوهشی رو توی arXiv و Google Scholar دنبال کن.

✅ وبسایت Papers with Code: لینک

✅ وبسایت AI Research at Google: لینک



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


@DataScience_ir_The_Reality_vs_Expectation_of_a_Data_Scientist's.pdf
3.8Мб
📄 «انواع نقش‌ها در دنیای داده»

🔔 تفاوت نقش دیتا ساینتیست با تحلیلگر داده، مهندس داده، مهندس ML و...


👨🏻‍💻 یکی از بزرگ‌ترین چالش‌هایی که دانشمندای داده دارن، انتظارات غیرواقعی شرکت‌هاست! خیلی وقتا فکر می‌کنن یه نفر باید هم مدل بسازه، هم زیرساختو مدیریت کنه، هم ETL بنویسه، هم MLOps بلد باشه!

✏️ این مدل کار کردن نه منطقیه، نه پایدار. دیتا ساینتیست‌ها تخصصشون روی تحلیل داده، یادگیری ماشین و پیش‌بینیه، ولی جایگزین مهندس داده یا مدیر محصول نیستن!


پس چطور یه تیم موفق بسازیم؟

✔️ کلید موفقیت اینه که بدونیم هر نقش توی تیم دیتا چه کاری باید انجام بده. به جای اینکه همه‌ی مسئولیت‌ها رو روی یه نفر بندازیم، باید یه تیم درست و حسابی تشکیل بدیم که بتونه بهینه و مقیاس‌پذیر کار کنه.

⬅️ اگه می‌خواین بدونی هر نقش دقیقاً چیه و چطور یه تیم داده‌ی قوی بسازین، این راهنما کمکتون می‌کنه.



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


Видео недоступно для предпросмотра
Смотреть в Telegram
📣 گوگل "Data Science Agent" رو در کولب منتشر کرد!


👨🏻‍💻 با Data Science Agent، دیگه نیازی به نوشتن یا اجرای یک خط کد هم نیست! من خودم این دیتاست 500 هزار ردیفی رو که تو ویدیوی بالا می‌بینید، تحلیل کردم و باورم نمی‌شد چقدر سریع و ساده این کار رو انجام داد!


چطور کار می‌کنه؟

🔢 فایل دیتاتون رو آپلود کنین،

🔢 به زبان ساده بگین چی می‌خواین. (مثلاً یه نمودار خاص یا خلاصه‌ای از داده‌ها).

🔢 خودش مرحله‌به‌مرحله کد می‌زنه، اجرا می‌کنه و نتیجه رو نشون میده.


⭕️ اینو یادتون نره که مثل هر مدل دیگه‌ای نیاز به نظارت داره!


👨‍💻 Data Science Agent
📖 Documentation



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


🏦 10 منبع فوق العاده برای آمادگی و موفقیت در مصاحبه‌های علوم داده



1️⃣ مصاحبه شبیه‌سازی‌شده علوم داده

⏪ شبیه‌سازی دقیقی از یک مصاحبه واقعی علوم داده.

📎 لینک: Mock Data Science Interview

➖➖➖➖➖➖

2️⃣ تجربه‌ی من از ۸۰ مصاحبه علوم داده

⏪ تجربه کسی که بیش از ۸۰ مصاحبه علوم داده شرکت کرده و به نکات کلیدی برای موفقیت در مصاحبه‌ها پرداخته.

📎 لینک: 80Data Science Interviews

➖➖➖➖➖➖

3️⃣ سؤالات پرتکرار مصاحبه علوم داده با پاسخ

⏪ یه راهنمای جامع برای درک سؤالات پرتکرار مصاحبه‌های علوم داده، از مباحث آماری تا یادگیری ماشین و تحلیل داده.

📎 لینک: Top DS Interview Q&A

➖➖➖➖➖➖

4️⃣ راهنمای موفقیت در مصاحبه علوم داده

⏪ این ویدیو روی استراتژی‌های موفقیت در مصاحبه‌های علوم داده و تحلیل، از جمله سؤالات SQL تمرکز داره.

📎 لینک: Acing DS & Analytics Interviews

➖➖➖➖➖➖

5️⃣ سؤالات مصاحبه نتفلیکس

⏪ بررسی چالش‌های مصاحبه در شرکت‌های بزرگ.

📎 لینک: Netflix Interview

➖➖➖➖➖➖

6️⃣ آمادگی فشرده برای مصاحبه علوم داده

⏪ اگه وقت زیادی برای آماده شدن نداری و دنبال یه مرور سریع از مفاهیم اصلی مصاحبه علوم داده هستی، این ویدیو رو ببین.

📎 لینک: Fast-Track DS Interview Prep

➖➖➖➖➖➖

7️⃣ چطوری با روش داده‌محور مصاحبه را ببریم؟

⏪ روش داده‌محور برای آماده شدن سریع و مؤثر برای مصاحبه‌های علوم داده.

📎 لینک: Crack DS Interviews

➖➖➖➖➖➖

8️⃣ سؤالات مصاحبه علوم داده در سه سطح

⏪ مرور سؤالات مصاحبه علوم داده در سطوح مبتدی، متوسط و پیشرفته.

📎 لینک: DS Interview Questions

➖➖➖➖➖➖

9️⃣ ۸ نوع سؤال کلیدی مصاحبه علوم داده

⏪ معرفی ۸ نوع سؤال پرکاربرد در مصاحبه‌های علوم داده و نحوه پاسخگویی به هر کدوم.

📎 لینک: Top DS Interview Questions

➖➖➖➖➖➖

1️⃣ ۳ پیشنهاد شغلی در یک ماه!

⏪ تجربه شخصی کسی که در یک ماه تونسته ۳ پیشنهاد شغلی در علوم داده بگیره، همراه با نقشه راهی که طی کرده.

📎 لینک: How I Got 3 DS Offers



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


@DataScience_ir - Finance Company Data Analysis.pdf
1.7Мб
☑️ سری جدید پروژه‌های علم داده من
1️⃣ تحلیل داده‌های مالی


👨🏻‍💻 چند ماه گذشته رو درگیر دو پروژه مهم در زمینه تحلیل داده‌های مالی بودم، جایی که با چالش‌های جذابی روبه‌رو شدم و تجربه فوق‌العاده‌ای کسب کردم. این دو پروژه شامل استفاده از تکنیک‌های پیشرفته علم داده برای استخراج بینش‌های کلیدی از مجموعه داده‌های پیچیده مالی بود.


🟣 پروژه (۱): تحلیل داده‌های یک شرکت مالی

✏️ هدف این پروژه، پیش‌بینی ارزش خالص آینده شرکت و شناسایی عوامل مؤثر بر سلامت مالی بود.

🔴 چالش: داده‌ها به شدت نامتوازن بودن، برای بهبود نتایج از SMOTE برای بالانس داده‌ها استفاده کردم.

🟡 تکنیک‌ها: پردازش داده، تحلیل اکتشافی (EDA)، مهندسی ویژگی، و مدل‌سازی یادگیری ماشین.

✅️نتیجه: ارائه بینش‌هایی در مورد روند سودآوری و ریسک‌های احتمالی ورشکستگی.


🟢 پروژه (۲): به‌روزرسانی و بهینه‌سازی تحلیل مالی

✏️ در این مرحله، داده‌های پروژه قبل رو با ویژگی‌های به‌روزتر و دقیق‌تر بازبینی کردم تا دقت پیش‌بینی‌ها بیشتر بشه.

✅ بهبود متریک‌ها: استفاده از روش RFE (Recursive Feature Elimination) برای انتخاب مهم‌ترین ویژگی‌ها.

✅ بصری‌سازی: تحلیل‌های تصویری با Seaborn و Matplotlib برای نمایش بهتر الگوهای مالی.

✅ خروجی: ارائه توصیه‌های کاربردی برای بهبود ثبات مالی و کاهش ریسک‌ها.


📣 از دیتاست و کد نویسی گرفته تا آنالیز و نتایج پروژه، همگی در لینک‌ زیر موجوده.👇


💸 Finance Company Data Analysis
└ 🐱 GitHub-Repos



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa

Показано 20 последних публикаций.