Data Science | علم داده


Гео и язык канала: Иран, Фарси
Категория: Технологии


📊 دانشمند داده شوید!
👔 جهت درج تبلیغات، به آیدی زیر پیام دهید:👇🏼‌
🆔 @DataScienceir_Adv

Связанные каналы  |  Похожие каналы

Гео и язык канала
Иран, Фарси
Категория
Технологии
Статистика
Фильтр публикаций


🖊 چطوری یه رزومه و پورتفولیوی حرفه‌ای برای علوم داده بسازیم؟


👨🏻‍💻 اگه دنبال اولین شغلت توی حوزه علم داده هستی، داشتن یه رزومه و پورتفولیوی حرفه‌ای خیلی اهمیت داره. این قدم‌های اولیه می‌تونه مسیر شغلیت رو تعیین کنه.

✅ به همین دلیل، یه سری مقالات نوشتم که بهت کمک می‌کنه رزومه‌ و پورتفولیو بهتری بسازی. اینا از تجربیات خودمه و مطمئنم که برات خیلی مفیده:


✏️ نوشتن رزومه‌ای که متمایزتون می‌کنه:

1️⃣ چطور رزومه‌ای بسازیم که دعوت به مصاحبه بشیم؟

◀️ لینک

2️⃣ ساخت یک رزومه بی‌نقص برای علوم داده:
10 اشتباهی که باید ازشون دوری کنی!

◀️ لینک

3️⃣ چطور با چندتا ترفند ساده، تعداد مصاحبه‌هام رو توی یک ماه 15 تا بیشتر کردم؟

◀️ لینک

💠💠💠💠💠💠💠💠💠💠💠💠

✏️ چطور یک پورتفولیوی خاص بسازیم:

1️⃣ چرا یک دانشمند داده حتماً باید پورتفولیو داشته باشه؟

◀️ لینک

2️⃣ می‌خوای توی علوم داده متمایز بشی؟
این اشتباهات در پورتفولیوت مرتکب نشو!

◀️ لینک

3️⃣ چطور پورتفولیوی علوم داده‌ای بسازیم که کار بگیریم؟

◀️ لینک

4️⃣ توصیه‌های مدیران استخدام:
برای گرفتن اولین شغل علوم داده

◀️ لینک

5️⃣ پروژه‌های راهنما:
بهترین روش برای یادگیری عملی علوم داده

◀️ لینک

6️⃣ ساخت پروژه‌های جذاب علوم داده:
10 سایت عالی + دیتاست

◀️ لینک

7️⃣ 5 ابزار رایگان برای ارتقای پورتفولیوی شما:

◀️ لینک

8️⃣ ساخت پروژه‌های علوم داده صنعتی:

◀️ لینک


🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


Репост из: Quera
📣 ثبت‌نام سری نهم بوتکمپ برنامه‌نویسی کوئرا آغاز شد. | QBC9

🚩 در مسیر "هوش‌مصنوعی"

آموزش تخصصی، کاربردی و تجربه نزدیک به صنعت!

✔️ مقدماتی تا پیشرفته
✔️ کار گروهی و شبکه‌سازی‎
✔️ تمرین و پروژه هدفمند
✔️ منتورینگ اختصاصی

❗️ظرفیت محدود
💳 اگه تا پایان اسفند ۱۴۰۳ ثبت‌نام کنی می‌تونی تو ۷ قسط پرداخت داشته باشی.

🎁 تخفیف ویژه تا پایان امسال

🌐 فرم ثبت‌نام:
🔗 https://quera.org/r/k5si0

〰️〰️〰️〰️〰️
#Quera #QBC9


Репост из: FaraDars_Course
🎯 با ۷۹ هزار تومن هر چی میخوای یاد بگیر! 🎯
 
🎉 جشنواره شگفتی فرادرس 🎉
 
♨️ ۵۵۰ آموزش منتخب، فقط ۷۹,۰۰۰ تومن ♨️
 
🔻 برای مشاهده آموزش‌ها و شروع یادگیری، همین حالا وارد لینک زیر شوید:
 
🔗 فهرست ۵۵۰ آموزش — [کلیک کنید]
 
➕ کد تخفیف ۵۰ درصدی برای سایر آموزش‌ها: TAK62
 
▫️ مشاهده سایر آموزش‌ها [+]

🔄 FaraDars - فرادرس


Репост из: تهران دیتا-دانشگاه تهران
🎆 دوره جامع هوش تجاری دانشگاه تهران 🎆
🕛 آخرین فرصت برای ثبت‌نام با قیمت امسال و تخفیف ویژه‼️

👀 از داده‌ها به بینش برسید، از بینش به تصمیم‌گیری هوشمند✔️

💥 دنیای امروز بر پایه داده‌ها می‌چرخد، اما فقط افراد باهوش می‌توانند از آن به نفع خود استفاده کنند!

❓ اگر می‌خواهید در دنیای تحلیل داده و هوش تجاری متخصص شوید، این دوره راه شما را هموار می‌کند. 

▶️ در این دوره چه چیزی یاد می‌گیرید ⁉️
✅ تسلط بر SQL Server و کوئری‌نویسی پیشرفته 
✅ طراحی و پیاده‌سازی انبار داده و مدل‌سازی OLAP 
✅ مهارت در SSIS، SSAS، و SSRS برای پردازش و تحلیل داده‌ها 
✅ ساخت داشبوردهای حرفه‌ای و جذاب در Power BI 
✅ شناخت ابزارهای قدرتمند Grafana، Looker Studio و DAX Studio 

🕓 زمان برگزاری :
روزهای یکشنبه و چهارشنبه ، ساعت ۱۸ الی ۲۲

◀️ ارائه گواهینامه دو زبانه دانشگاه تهران
◀️ پروژه‌محور | عملی | ورود به بازار کار
◀️ ۱۶۰ ساعت آموزش کاربردی + پروژه‌های واقعی + پشتیبانی تخصصی

▶️ این دوره فرصتی طلایی برای ورود به دنیای پردرآمد هوش تجاری است‼️
#️⃣اگر می‌خواهید پروژه‌های هوش تجاری را به صورت کاربردی و عملیاتی اجرا کنید، این دوره همان چیزی است که نیاز دارید➡️

🔥 فرصت محدود – همین حالا ثبت‌نام کنید و با تخفیف ویژه، آینده‌ای روشن بسازید❗️


ℹ️ برای اطلاعات بیشتر و ثبت‌نام، همین حالا پیام دهید👍
https://tehrandata.org/courses/bi/
09377516682

📨 Telegram | 📨 whatsapp | 📱 linkedin | 📱 Instagram | 📱 website | 💬 admin

#هوش_تجاری #هوشمندسازی


🟢 سال جدید دیتا آنالیز یاد بگیر و درآمد خوب داشته باش!

⚛️ بوت‌کمپ Data Analysis دانشکار رو الان با ۴۰٪ تخفیف ثبت‌نام کن و تا شهریور سال بعد تحلیل‌گر داده شو.

⭕️ ظرفیت محدود

شروع راه یادگیری و استخدام👇
🔗https://dnkr.ir/6QB95
🔗https://dnkr.ir/6QB95


@DataScience_ir - Data Analysis with NumPy.pdf
813.2Кб
🏳️‍🌈 جزوه آموزشی «کتابخانه NumPy»

👨🏻‍💻 چند روز گذشته، کامل مشغول آماده کردن این جزوه آموزشی جامع کتابخانه NumPy برای علوم داده بودم و سعی کردم تمام نکات و ترفندهای این کتابخونه رو پوشش بدم.

چرا این جزوه فرق داره؟ چون فقط بر اساس مفاهیم تئوری نوشته نشده و نتیجه تجربیات و یادگیری خودمه. مثال‌های واقعی و کاربردی داره که بهتون کمک می‌کنه بهتر مفاهیم NumPy رو درک کنین و توی پروژه‌هاتون استفاده کنین.💯


🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


@DataScience_ir - Optimization for Data Science.pdf
11.2Мб
✏️ جزوه «بهینه‌سازی برای علم داده»
🖥 دانشگاه صنعتی زوریخ


👨🏻‍💻 همیشه سرکلاس به دانشجوهام میگم «اگه دیتا ساینس یه تیم فوتبال باشه، بهینه‌سازی همون مربی حرفه‌ایه که استراتژی تیم رو طوری می‌چینه که بیشترین امتیاز رو بگیره!». / برند گارتنر - استاد علوم داده دانشگاه زوریخ


چرا بهینه‌سازی انقدر توی علم داده مهمه؟ چون تو دنیای علم داده، همیشه یه مسئله وجود داره که باید به بهترین شکل حلش کنی:

✅ پیدا کردن بهترین مدل برای پیش‌بینی
✅ کم کردن هزینه پردازش
✅ بیشینه کردن دقت مدل
✅ کم کردن خطا و کاهش ریسک و...


🔔 پس اگه می‌خوای یه مدل خوب و بهینه بسازی، باید بدونی چه روش‌های بهینه‌سازی‌ وجود داره، چقدر کارایی دارن، و چقدر می‌تونن سریع‌تر تو رو به جواب بهینه برسونن. در واقع بهینه‌سازی یه ابزار کلیدی در علم داده‌ است که کمک می‌کنه مدل‌های ما بهتر و کارآمدتر بشن.



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


🔹 تنها نقشه راهی که برای یادگیری «پایتون برای علم داده» نیاز داری! + به همراه نسخه فارسی 🐍


👩🏻‍💻 پایتون مهم‌ترین مهارتیه که یه دیتا ساینتیست باید بلد باشه! خبر خوب اینه که لازم نیست برای یادگیریش کلی پول بدی و توی بوت‌کمپ‌های مختلف یا دانشگاه ثبت‌نام کنی!


✏️ داستان من: وقتی وارد دنیای علوم داده شدم، هیچی از پایتون نمی‌دونستم.
رفتم سراغ کلی مصاحبه شغلی برای کار تو حوزه دیتا ساینس... ولی همه رو رد شدم!

💸 اون موقع بود که فهمیدم اگه واقعاً بخوام یه دیتا ساینتیست بشم، باید پایتون رو کامل یاد بگیرم. ولی مشکل این بود که نه پول بوت‌کمپ داشتم، نه وقت دانشگاه رفتن.
پس خودم دست‌به‌کار شدم و بهترین روش یادگیری رو پیدا کردم!🤓


✔️ از ترکیب این ۳ روش ساده استفاده کردم:

1️⃣ این نقشه راه یادگیری پایتون
2️⃣ یادگیری با DataCamp
3️⃣ تمرین و پروژه‌سازی توی Jupyter Notebook


🗺 نقشه راه یادگیری پایتون برای علوم داده:

🔢 مفاهیم پایه‌ی پایتون

❗️ مهم‌ترین قدمه! اگه این مرحله رو رد کنی، بعداً به مشکل می‌خوری.

✔️ متغیرها و انواع داده: ()type(), int(), float(), str(), list(), dict

✔️ ساختارهای کنترلی: ()if-elif-else, for, while, range

✔️ توابع و آرگومان‌ها: def, return, args

✔️ لیست کامپرهنشن: [expression for item in iterable if condition]

➖ ➖ ➖ ➖ ➖

🔢 پردازش و پاک‌سازی داده‌ها

❗️ اگه داده‌هات تمیز نباشه، مدل‌هات به درد نمی‌خوره!

✔️ پاک‌سازی داده‌ها: ()df.dropna(), df.fillna(), df.drop_duplicates(), df.replace

✔️ ادغام و تغییر شکل داده: ()pd.merge(), df.pivot(), df.melt

✔️ گروه‌بندی و تجمیع: ()df.groupby(), df.agg

📣 چک‌پوینت اول: یه پروژه پاک‌سازی داده انجام بده!

➖ ➖ ➖ ➖ ➖

🔢 تحلیل اکتشافی داده‌ها (EDA)

❗️ اینجاست که علم و هنر باهم ترکیب می‌شن!

✔️ آمار توصیفی: df.mean(), df.median(), df.mode(), df.std(), df.var(), df.min(), df.max(), df.quantile()

✔️ توزیع داده‌ها: ()df.hist(), stats.normaltest

✔️ تحلیل همبستگی: ()df.corr(), plt.imshow(), stats.pearsonr

📣 چک‌پوینت دوم: یه پروژه EDA انجام بده!

➖ ➖ ➖ ➖ ➖

🔢 مصورسازی داده با Matplotlib

❗️ داده‌ها وقتی دیده بشن، معنا پیدا می‌کنن!

✔️ نمودارهای پایه‌ای: ()plt.plot(), plt.scatter(), plt..bar

✔️ هیستوگرام و چگالی: ()plt.hist(), plt.kde

✔️ باکس‌پلات: ()plt.boxplot

✔️ چند نمودار در یک شکل: ()plt.subplots(), fig.add_subplot

✔️ شخصی‌سازی نمودارها: ()plt.xlabel(), plt.ylabel(), plt.title(), plt.legend

📣 چک‌پوینت سوم: یه پروژه بصری‌سازی داده انجام بده!

➖ ➖ ➖ ➖ ➖

🔢 یادگیری ماشین در پایتون

❗️ اینجا جاییه که جادو اتفاق می‌افته!

✔️ آموزش و ارزیابی مدل‌ها: ()train_test_split(), cross_val_score

✔️ مدل‌های رگرسیون: ()LinearRegression(), mean_squared_error(), r2_score

✔️ مدل‌های طبقه‌بندی: LogisticRegression(), accuracy_score(), ()confusion_matrix

✔️ خوشه‌بندی: ()KMeans

📣 چک‌پوینت چهارم: اولین مدل یادگیری ماشینت رو بساز!

➖ ➖ ➖ ➖ ➖

🔔 راستی، من کل پایتون رو با DataCamp یاد گرفتم و شدیداً پیشنهادش می‌کنم!👇


🔗 همه‌ این موارد رو یه‌جا یاد بگیر: DataCamp

🔗 نسخه فارسی «پایتون برای علم داده»: PDF



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


@DataScience_ir - Complete Statistics for Data science.pdf
1012.0Кб
✏️ جزوه خلاصه «آمار برای علم داده»


👩🏻‍💻 من همیشه یه جزوه کامل آمار برای علم داده داشتم که برای پروژه‌ها و مصاحبه‌های مختلف ازش استفاده می‌کردم، ولی هربار می‌دیدم چقدر سخته توی جزوه دنبال مفاهیم کلیدی بگردی و مطمئن بشی که برای هر سوالی آماده‌ای.


▶️ همین باعث شد یه «جزوه خلاصه 30 صفحه‌ای از مهم‌ترین مباحث آماری علوم داده رو به همراه سوالاتی که معمولا توی مصاحبه‌ها مطرح میشه» آماده کنم.

✍️ حالا این همون راهنمای مرور سریعه که توی روزهای (یا حتی ساعت‌های!) آخر قبل از مصاحبه بهش نیاز داری! فرقی نداره که برای موقعیت شغلی دانشمند داده، تحلیلگر داده یا مهندس ML آماده میشی، این جزوه کمکت می‌کنه:

✅ مفاهیم کلیدی رو سریع مرور کنی.

✅ جواب‌هات رو شفاف و با اعتمادبه‌نفس بدی.

✅ از احتمال تا آزمون‌های فرضیه، مباحث رایج توی مصاحبه‌ها رو پوشش بدی.



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


🥇 جامع ترین مخزن مسابقات Kaggle + راه حل
دسترسی به تمام پروژه‌های Kaggle
🗓 آپدیت فوریه 2025


👨🏻‍💻 فرید رشیدی دکترای علوم کامپیوتر یک مخزن فوق العاده به نام Kaggle Solutions ایجاد کرده که یه گنجینه ناب برای همه‌یِ متخصصای علوم داده، مهندسای یادگیری ماشین و پژوهشگرای این حوزه است.

🖊 این لیست تقریباً تمام راه‌حل‌ها، پروژه‌ها و ایده‌های موجود در Kaggle رو پوشش میده و به محض اتمام یک مسابقه جدید به روز میشه.🤞


✏️ این مجموعه تا الان شامل 638 رقابت + راه حل میشه که تا 5 فوریه 2025 آپدیت شده است.

برای دسترسی به این مخزن فوق العاده می‌تونید از لینک زیر استفاده کنین:👇


💸 Kaggle Solutions
💰 Website



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


@DataScience_ir - Pandas.pdf
9.9Мб
❗️ پانداس فقط یه خرس نیست؛ یه معجزه توی تحلیل داده‌ست!


👨🏻‍💻 تو این چند روز حسابی با کتابخونه Pandas کار کردم و نتیجه‌اش شد تهیه این جزوه. توی این نوت‌بوک، از Series و DataFrame شروع کردم، بعدش رفتم سراغ ایندکس کردن، فیلتر کردن و حتی بصری‌سازی داده‌ها.

▶️ اگه به حوزه‌ی دیتا ساینس یا تحلیل داده علاقه‌مندین، یادتون باشه تسلط به Pandas یه چیز اختیاری نیست؛ یه مهارت واجبه!



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


🔸 مقایسه 8 کتابخونه DataFrame روی یک میلیارد ردیف داده!


👨🏻‍💻 من ۸ تا جایگزین Pandas رو روی یک میلیارد ردیف داده تست کردم، هم روی فایل‌های CSV و هم Parquet.

✏️ نتیجه؟ FireDucks بهترین عملکرد رو داشت! یه جایگزین کاملاً بهینه‌شده برای Pandas که فقط با یه خط تغییر می‌تونی ازش استفاده کنی:


این خط رو حذف کن:

import pandas as pd

و اینو جایگزین کن:

import fireducks.pandas as pd


تمومه! همون کدهای Pandas، ولی خیلی سریع‌تر!

📣 جالب‌تر اینکه، تو بعضی موارد حتی از cuDF (کتابخونه DataFrame برای GPU) هم سریع‌تر بوده! برو تستش کن و شگفت‌زده شو!😎👇


🏳️‍🌈 FireDucks
├ ♾️ Google Colab
🐱 GitHub-Repos



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


Видео недоступно для предпросмотра
Смотреть в Telegram
🥵 ابزار جدید مایکروسافت؛ Data Formulator
🔰 بدون نیاز به کدنویسی و %100 متن باز!


👨🏻‍💻 مایکروسافت یه ابزار جدید رونمایی کرده که داده‌ها رو با هوش مصنوعی تحلیل می‌کنه!

✏️ اسمش رو گذاشته Data Formulator؛ یه ابزار جادویی که با کمک مدل‌های زبان بزرگ (همون LLMها)، داده‌های خام رو تو یه چشم به هم زدنی برات تبدیل می‌کنه و نمودارهای حرفه‌ای می‌سازه!


چه ویژگی‌هایی داره این ابزار؟

🔢 تبدیل داده‌ها با هوش مصنوعی: مثلاً یه دستور ساده بهش می‌دی؛ مثل «میانگین حقوق رو بر اساس شهرها محاسبه کن»، خودش، داده‌ها رو برات مرتب و پردازش می‌کنه.

🔢 رابط کاربری ساده: با درگ‌ اند دراپ، نمودارها رو مثل بازی پازل می‌چینی. نیازی به کد زدن هم نیست!

🔢 چت کردن با ابزار: هم می‌تونی خیلی راحت توی چت باکس بنویسی چی می‌خوای، هم از منوها استفاده کنی. ترکیب این دوتا باعث میشه کار کردن باهاش حسِ راحتی بهت بده!


🔔 مثلاً فرض کن می‌خوای یه نمودار بسازی که داده‌های اولیه‌ات براش کافی نیستن. Data Formulator خودش می‌فهمه چه محاسباتی لازمه، فیلدهای جدید رو ایجاد می‌کنه، و در نهایت نمودار تمیزی تحویلت می‌ده. انگار یه دستیار هوشمند کنارت نشسته که همزمان فکر و اجرا می‌کنه!


☑️ Data Formulator
🐱 GitHub-Repos



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


@DataScience_ir - Data Visualization.pdf
1.2Мб
📊 جزوه فارسی «مصورسازی داده‌ها»

👨🏻‍💻 مصورسازی داده‌ها یه بخش کلیدی از تحلیل داده‌هاست که کمک می‌کنه تا به جای غرق شدن توی انبوهی از اطلاعات، سریع‌تر و راحت‌تر بفهمیم داده‌هامون چی دارن بهمون میگن. وقتی داده‌ها رو به شکل گرافیکی و بصری می‌بینیم، پیدا کردن الگوها و روابطی که شاید توی اعداد و جداول پنهان مونده، خیلی ساده‌تر میشه.👌

✔️ توی این جزوه، روش‌های مختلف مصورسازی داده‌ها بر اساس اهداف مختلف معرفی شدن. این روش‌ها بهتون کمک می‌کنه تا داده‌هاتون رو با دقت بیشتری نمایش بدین و بهتر تصمیم بگیرین.


🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


🗂 10 نمونه «پورتفولیوی واقعی علوم داده» برای الهام گرفتن!


👩🏻‍💻 بارها گفتم؛ یه رزومه‌ی قوی یعنی داشتن پروژه‌های واقعی، نه فقط یه لیست از مهارت‌ها! چه دنبال کار تو حوزه علوم داده باشین، چه پروژه‌‌های فریلنسری، یه پورتفولیوی قوی و ساختاریافته بهترین تبلیغ از خودتونه!

❗️ یادتون باشه شرکت‌ها دنبال کسی‌ان که بتونه داده‌های خام رو به تحلیل‌های کاربردی تبدیل کنه، نه اینکه فقط یه سری مهارت و مباحث تئوری رو بلد باشه!

📁 من ۱۰ پورتفولیوی برتر از حرفه‌ای‌های دنیای علوم داده رو اینجا آوردم، که هر کدومشون یه مسیر خاصی رو طی کردن! این ده تا رو ببینید و ازشون الهام بگیرید تا بتونین یه پوتفولیوی قوی برای خودتون بسازین!👇



1️⃣ پورتفولیوی Ken Jee | دانشمند داده

▶️ حوزه: تحلیل داده‌های ورزشی

👤 لینک: Portfolio


2️⃣ پورتفولیوی Yassine Alouini | استاد کگل

▶️ حوزه: یادگیری ماشین و رقابت‌های کگل

👤 لینک: Portfolio


3️⃣ پورتفولیوی Tatman | دانشمند داده

▶️ حوزه: پردازش زبان طبیعی (NLP)

👤 لینک: Portfolio


4️⃣ پورتفولیوی Robinson | دانشمند داده

▶️ حوزه: تحلیل آماری و برنامه‌نویسی R

👤 لینک: Portfolio


5️⃣ پورتفولیوی Siraj Raval | مدرس AI

▶️ حوزه: یادگیری ماشین و هوش مصنوعی

👤 لینک: Portfolio


6️⃣ پورتفولیوی Julia Silge | دانشمند داده

▶️ حوزه: داده‌های مرتب و بصری‌سازی داده

👤 لینک: Portfolio


7️⃣ پورتفولیوی Mueller |دولوپر Scikit-Learn

▶️ حوزه: یادگیری ماشین و پروژه‌های متن‌باز

👤 لینک: Portfolio


8️⃣ پورتفولیوی Wickham | دیتا ساینتیست

▶️ حوزه: برنامه‌نویسی R و بصری‌سازی داده

👤 لینک: Portfolio


9️⃣ پورتفولیوی François Puget | استاد کگل

▶️ حوزه: تکنیک‌های پیشرفته یادگیری ماشین

👤 لینک: Portfolio


🔟 پورتفولیوی Emily | تحلیلگر داده در دیزنی

▶️ حوزه: بصری‌سازی و داستان‌سرایی با داده

👤 لینک: Portfolio


📂 فایل خلاصه هر پورتفولیو: PDF



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


تیم من ۱۳۷ ساعت وقت گذاشت و 1000+ کتابخونه پایتون رو بررسی کرد— اینا اون جواهرای مخفی‌ای هستن که باید بشناسی!


👨🏻‍💻 من ۱۷ ساله توی حوزه علوم داده کار می‌کنم و می‌دونم که ابزارهای درست، چقدر می‌تونن کارت رو راحت‌تر کنن. این لیست بهترین کتابخونه‌های پایتون رو آماده کردم که کمتر دیده شدن، ولی خودشون هرکدوم یه غول واقعی‌ان!👇



🏳️‍🌈 کتابخونه Science Plots

✏️ یه پوسته حرفه‌ای برای Matplotlib که خروجی گراف‌هات رو برای مقالات و تحقیقات، حسابی شیک و رسمی می‌کنه.


🏳️‍🌈 کتابخونه CleverCSV

✏️ مشکلات پردازش CSV (خطای CSV Parsing) تو Pandas اعصاب‌تو خورد کرده؟ این کتابخونه تو چند ثانیه حلش می‌کنه!


🏳️‍🌈 کتابخونه fastparquet

✏️ ورودی/خروجی فرمت Parquet تو Pandas رو تا ۵ برابر سریع‌تر کن!


🏳️‍🌈 کتابخونه Drawdata

✏️ داده‌های دو بُعدی رو مستقیم تو Jupyter با موس بکش و ایجاد کن!


🏳️‍🌈 کتابخونه nbcommands

✏️ دیگه نیاز نیست تو Jupyter Notebook اسکرول کنی تا یه سلول خاص رو پیدا کنی، مستقیم جستجو کن.


🏳️‍🌈 کتابخونه Aquarel

✏️ یه استایل حرفه‌ای و خاص برای نمودارهای Matplotlib بساز! (نمودارهاتو خوشگل‌تر کن!).


🏳️‍🌈 کتابخونه Uniplot

✏️ نمودارها رو مستقیماً تو ترمینال و با Unicode رسم کن! (خیلی سبک و سریع)


🏳️‍🌈 کتابخونه pydbgen

✏️ دیتافریم‌های تصادفی تو Pandas بساز، خیلی کاربردیه برای تست الگوریتم‌ها.


🏳️‍🌈 کتابخونه modelstore

✏️ نسخه‌های مختلف مدل‌های یادگیری ماشین رو پیگیری و ذخیره کن.


🏳️‍🌈 کتابخونه Pigeon

✏️ داده‌ها رو تو Jupyter با چند کلیک برچسب‌گذاری (Annotation) کن، بدون دردسر!


🏳️‍🌈 کتابخونه Optuna

✏️ بهینه‌سازی هایپرپارامترها رو راحت و سریع انجام بده.


🏳️‍🌈 کتابخونه Pampy

✏️ الگوهای کد رو سریع و ساده پیدا کن!


🏳️‍🌈 کتابخونه KnockKnock

✏️ وقتی آموزش مدلت تموم شد، خودش بهت نوتیفیکیشن میده، دیگه نیازی نیست دستی چک کنی!


🏳️‍🌈 کتابخونه Gradio

✏️ یه رابط کاربری شیک و ساده برای مدل‌های یادگیری ماشینت بساز.


🏳️‍🌈 کتابخونه handcalcs

✏️ فرمول‌های ریاضی رو مستقیماً تو Jupyter نمایش بده!


🏳️‍🌈 کتابخونه Osquery

✏️ با SQL، داده‌های سیستم‌عاملتو بررسی کن!


🏳️‍🌈 کتابخونه D3Blocks

✏️ نمودارهای تعاملی رو مستقیماً به صورت HTML خروجی بگیر.


🏳️‍🌈 کتابخونه Data Copilot

❗️ حوصله نداری ۱۸ تا کتابخونه رو نصب کنی؟ این یه کتابخونه، همه این قابلیت‌ها رو یکجا داره!


✅ پشتیبانی از زبان طبیعی برای نوشتن کدهای پایتون و Pandas.

✅ تولید SQL بدون کدنویسی برای پرس‌وجوهای دیتابیسی.

✅ ادغام با Data Warehouse برای یکپارچه‌سازی راحت‌تر.

✅ اصلاح خودکار ارورها.



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


@DataScience_ir - DSA Revision Guide.pdf
982.2Кб
📖 جزوه «ساختمان داده‌ و الگوریتم‌ها»
💻 برای علوم داده


👨🏻‍💻 اگه قصد دارین تو یکی از شاخه‌های دیتا ساینس، مهندسی داده یا تحلیل داده کار کنین، تسلط روی ساختارهای داده و الگوریتم‌ها (DSA) می‌تونه یه برگ برنده اساسی براتون باشه.💯


✏️ چرا DSA انقدر برای علم داده مهمه؟

پردازش بهینه داده‌ها: وقتی با حجم بالایی از دیتا سروکار داری، لازمه الگوریتم‌های بهینه رو بشناسی.

عملکرد بهتر: هر چقدر کدت بهینه‌تر باشه، زمان پردازش کمتر و مقیاس‌پذیری سیستم بیشتر می‌شه.

تقویت مهارت حل مسئله: اکثر چالش‌های واقعی دنیای داده، نیاز به تفکر الگوریتمی و ساختاری دارن.

موفقیت در مصاحبه‌های فنی: شرکت‌های بزرگ توی مصاحبه‌ها اغلب از مباحث DSA سوال می‌پرسن، به‌ویژه برای موقعیت‌های دیتا.



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


🚀 بهینه‌سازی مصرف حافظه در پایتون با slots


👩🏻‍💻 آبجکت‌های پایتون معمولاً حافظه زیادی مصرف می‌کنن چون انعطاف بالایی در ذخیره ویژگی‌ها دارن. اما یه ترفند ساده وجود داره که می‌تونه این مصرف حافظه رو کاهش بده:

✏️ استفاده از __slots__ باعث می‌شه فضای حافظه برای ویژگی‌ها از قبل رزرو بشه و بهینه‌تر عمل کنه.


🔎 توی یه تست ساده (عکس بالا)، با __slots__ مصرف حافظه رو حدود 11.1 مبی‌بایت کاهش دادیم! این یعنی بهینه‌سازی قوی برای برنامه‌هایی که با حجم بالای داده کار می‌کنن.


▶️ slots
🖥 Documents
🖥 Python slots (Fa)
🖥 Python slots (En)



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


🗂 همه‌ی دستورات ضروری NumPy
برای علم داده و یادگیری ماشین!


👩🏻‍💻 کتابخونه NumPy یکی از مهم‌ترین کتابخونه‌ها برای کار روی پروژه‌های علم داده و یادگیری ماشینه. این چیت‌شیت رو تهیه کردم تا مهم‌ترین دستورات NumPy رو براتون خلاصه کنم.


📥 دانلود نسخه با کیفیت‌تر: NumPy



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


@DataScience_ir - Introduction to Applied Linear Algebra.pdf
7.5Мб
📖 یادگیری «جبر خطی کاربردی»
با کتاب فوق‌العاده دانشگاه استنفورد!


👨🏻‍💻 اگه به علم داده، یادگیری ماشین یا هوش مصنوعی علاقه داری باید بردارها، ماتریس‌ها و حداقل مربعات (Least Squares) رو مثل آب خوردن بلد باشی!

🔔 چرا این کتاب یه انتخاب عالیه؟

1️⃣ همه‌چی رو عمیق ولی ساده توضیح داده!
2️⃣ پر از کاربردهای عملی؛ از ML تا AI
3️⃣ تسلط روی Least Squares – که ستون فقرات علم داده مدرنه!
4️⃣ هم برای مبتدی‌ها مناسبه، هم حرفه‌ای‌ها.


🚨 اگه داده‌ها رو تحلیل می‌کنی، پورتفولیو بهینه‌سازی می‌کنی یا مدل‌های هوش مصنوعی می‌سازی، این کتاب ابزارهای ریاضی مورد نیازت رو بهت می‌ده!



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa

Показано 20 последних публикаций.