Data Science | علم داده


Гео и язык канала: Иран, Фарси
Категория: Технологии


📊 دانشمند داده شوید!
👔 جهت درج تبلیغات، به آیدی زیر پیام دهید:👇🏼‌
🆔 @DataScienceir_Adv

Связанные каналы  |  Похожие каналы

Гео и язык канала
Иран, Фарси
Категория
Технологии
Статистика
Фильтр публикаций


@DataScience_ir - Introduction to Statistics.pdf
231.2Кб
🖥جزوه «آمار برای علوم داده»


👨🏻‍💻 خیلیا هنوز فکر می‌کنن اولین قدم برای یادگیری علوم داده و ML، کدنویسیه. در صورتی که اول باید توی آمار و احتمال قوی بشین!

✏️ من خیلی وقت گذاشتم تا آمار رو عمیق یاد بگیرم و تو این مسیر یادداشت‌های خیلی مفصلی نوشتم تا مفاهیم اصلی رو که برای کار با داده‌ها نیاز دارم، به‌خوبی درک کنم. الان خیلی خوشحالم که می‌تونم این یادداشت‌ها رو به اشتراک بذارم.

🖥 اولش همه مباحث رو دست‌نویس نوشته بودم، ولی حالا با LaTeX دوباره بازنویسی‌شون کردم که خیلی مرتب‌تر و خواناتر بشن.


📝 می‌تونید از طریق لینک زیر به نسخه‌های دست نویس هم دسترسی داشته باشین:👇

🖥 آمار ➖ 🖥 احتمال


💰 لینک دوره‌هایی هم که برای نوشتن این جزوات ازشون استفاده کردم اینجا گذاشتم:👇

🖥 Statistics
🖥 Discrete Probability Distributions
🖥 Continuous Probability Distributions



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


Репост из: FaraDars_Course
❇️ آخرین فرصت — ۶۰ درصد تخفیف ویژه در فرادرس، بهترین فرصت یادگیری!‎
 
🎓 از دروس دانشگاهی تا مهارت‌های کاربردی
 
🎁 کد تخفیف: YAD56
 
👇 بعضی از پر‌فروش‌ترین آموزش‌ها 👇
 
▫️ مجموعه آموزش ابزارهای علم داده – جامع و کاربردی
 
▫️ مجموعه آموزش هوش مصنوعی با پایتون
 
▫️ مجموعه آموزش پایتون برای علم داده
 
▫️ مجموعه آموزش پایتون برای یادگیری عمیق
 
▫️ مجموعه آموزش برنامه نویسی پایتون
 
📚 مشاهده سایر آموزش‌ها - [کلیک کنید]

🔄 FaraDars - فرادرس


2️⃣ ریپوی گیت‌هاب ROBIN آپدیت شد!


👨🏻‍💻 ابزار ROBIN یه محصول خفن برای شناسایی و حذف داده‌های پرت و افزایش دقت مدل‌ها بر اساس گراف‌های سازگاریه که قراره تحلیل داده‌ها و پروژه‌های ML شما رو حسابی مقاوم‌تر کنه! این ابزار توسط Jingnan Shi و Heng Yang تهیه شده و در آپدیت جدیدش کلی بهینه‌ش کردن.


✏️ چرا ابزار ROBIN یه شاهکاره؟

🔢 دقیق و مقاوم در برابر نویزه.

🔢 سبک و سریع و بدون دردسر پردازشیه.

🔢 نصبش هم با یه خط کد حل می‌شه.

🔢 قبلا امتحانش رو پس داده! پارسال توی مسابقات NSS Challenge ازش استفاده‌ کردیم و تیم اول مسابقات شدیم!

(فقط یه عدد ببینید: RMSE ما = ۰.۰۵۶ متر😎، نفر دوم؟ ۲.۴۱۴ متر🙂‍↔️!!!)


🔗 لینک ریپوی آپدیت‌شده: ROBIN



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


🏐 فقط چند روز تا شروع مسیرهای حرفه ای:
🚨 دانشمند داده و مهندسی هوش مصنوعی دایکه
🚨Dayche Data Scientist & ML/AI Engineer

👈
ثبت نام در طرح های پرداخت متنوع نقد . اقساط . دانشجویی . شهریه معوق

🌐 t.me/daycheapply

👈 برنامه نویسی پایتون . آمار و داده کاوی . تحلیل بیگ دیتا . مهارت‌های نرم‌افزاری . ریاضیات AI . یادگیری ماشین پیشرفته . یادگیری عمیق پیشرفته . MLOps . SDLC .  پردازش ابری AWS/GCP . مدل‌های مولد و زبانی LLM/VLM

✍️مشاوره کامل قبل ثبت نام: 👇👇

دایرکت:
➡️ @daycheapply

تماس مستقیم: 
📞 021-910-96122

پیامک: ارسال کد 1 به
📲 0930-0214441

اطلاعات بیشتر:
🌐 Dayche.com


@DataScience_ir_80_Python_use_case_based_interview_questions_with.pdf
410.4Кб
🏳️‍🌈 ۸۰ سوال مصاحبه‌ای Python
📄 با جواب و کد!


👨🏻‍💻 کریش نایک محقق و دانشمند داده معروف هندی، یه مجموعه عالی از ۸۰ سوال پرکاربرد در مصاحبه‌های Python رو همراه با جواب و کد منتشر کرده! 🤩

✅ این می‌تونه یه منبع فوق‌العاده برای کسایی باشه که خودشون رو برای مصاحبه‌های برنامه‌نویسی و علوم داده آماده می‌کنن.👌🏼



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


آزمون آیلتس میخوای شرکت کنی؟
میدونستی میتونی به همه سوالات آزمون آیلتس بصورت رایگان دسترسی داشته باشی؟
ما تو وبسایت تست‌هلپر دسترسی به همه آزمون های کمبریج (حتی کمبریج 19) و سوالات واقعی رو (Real Test) فراهم کردیم. اونم نه دسترسی عادی، بلکه تمام سوالات تو فضای شبیه‌سازی شده‌ی آزمون کامپیوتری آیلتس چیده شدن تا بتونی تو شرایط 100% واقعی تست بزنی.

بعلاوه، کلی امکانات آموزشی مثل دسترسی به 5 دیکشنری فقط با یه کلیک، جعبه لایتنر، فلش کارت و از همه مهمتر تصحیح با هوش مصنوعی هم برات در نظر گرفتیم. تازه اپلیکیشن موبایل هم هست که می تونی همه جا و بصورت آفلاین به همه امکانات دسترسی داشته باشی.
فقط کافیه یه سر به وبسایت تست هلپر بزنی و وارد بخش آیلتس بشی:

TestHelper.ir TestHelper.ir

راستی با استفاده از سایت تست هلپر، برای آزمون تافل هم میتونی تمرین کنی. برای تافل، انواع سوالات (شامل TPO، Neo-TOEFL، Zhenti و ...) و امکانات آموزشی متنوع رو آماده کردیم.

در ضمن هر قدم از مسیرت به مشکل خوردی (از سوال درسی گرفته تا حتی ثبت نام و اطلاعات سنترها) می‌تونی تو گروه‌های اختصاصی این دو آزمون سوال کنی:
🔸گروه تافل
🔸گروه آیلتس


👨🏻‍💻 انتشارات O'Reilly Media یکی از معتبرترین ناشران در حوزه برنامه‌نویسی، داده کاوی و AI، اومده 10 تا از کتاب‌های حوزه علوم داده رو به رایگان در اختیار علاقه مندان این حوزه قرار داده.

✔️ برای استفاده از نسخه آنلاین و PDF این کتاب‌ها می‌تونید از لینک‌های زیر استفاده کنین:👇


0⃣ کتاب Python Data Science Handbook

Online
PDF

1⃣ کتاب Python for Data Analysis

Online
PDF

🔢 کتاب Fundamentals of Data Vis

Online
PDF

🔢 کتاب R for Data Science

Online
PDF

🔢 کتاب Deep Learning for Coders

Online
PDF

🔢 کتاب DS at the Command Line

Online
PDF

🔢 کتاب Hands-On Data Visualization

Online
PDF

🔢 کتاب Think Stats

Online
PDF

🔢 کتاب Think Bayes

Online
PDF

🔢 کتاب Kafka, The Definitive Guide

Online
PDF



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


@DataScience_ir - ZoomNotes for Linear algebra.pdf
611.5Кб
✏️ جزوه «جبرخطی برای علم داده»


👨🏻‍💻 گیلبرت استرنگ استاد معروف درس جبرخطی دانشگاه MIT، در دوران کرونا یک منبع خلاصه و منظم از مباحث کاربردی جبرخطی آماده کرد به نام ZoomNotes.

📄 بعد از دوران کووید این جزوه 80 صفحه‌ای، به یه منبع ارزشمند برای یادگیری جبرخطی — (از فاکتورگیری‌های ماتریسی بگیر تا مقادیر ویژه، فضاهای برداری و ارتباط جبر خطی با علوم داده) — تبدیل شد!


✔️ این جزوه مکمل کلاس‌های ویدیویی استرنگ در MIT هست.



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


🚨 یک یادآوری ضروری برای دیتا ساینتیست‌ها!


👨🏻‍💻 قبل از اینکه بپرین توی دنیای یادگیری ماشین و علوم داده، اول مباحث پایه‌ رو خوب یاد بگیرین! این لیست کمکتون می‌کنه مسیر رو اصولی جلو ببرین:


1️⃣ قبل از یادگیری ماشین، آمار رو یاد بگیر!

✏️ چون الگوریتم‌ها ریشه در مفاهیم آماری دارن.

➖ ➖ ➖ ➖

2️⃣ قبل از کار با BigQuery یا Snowflake، اول SQL رو یاد بگیر!

✏️ چون پایه‌ی همه‌ی کارهای دیتابیسیه.

➖ ➖ ➖ ➖

3️⃣ قبل از TensorFlow یا PyTorch، اول پایتون رو یاد بگیر!

✏️ چون بدون پایتون هیچ کاری نمی‌تونی بکنی.

➖ ➖ ➖ ➖

4️⃣ قبل از شیرجه توی یادگیری عمیق، اول Numpy و Pandas رو یاد بگیر!

✏️ چون ابزارهای اصلی برای کار با داده هستن.

➖ ➖ ➖ ➖

5️⃣ قبل از PCA یا SVD، اول جبر خطی رو یاد بگیر!

✏️ چون این روش‌ها وابسته به مفاهیم جبرخطیه.

➖ ➖ ➖ ➖

6️⃣ قبل از استنباط بیزی، اول آمار و احتمال رو یاد بگیر!

✏️ چون بدون فهم کامل مبانی احتمال، استنباط بیزی بی‌معنیه!

➖ ➖ ➖ ➖

7️⃣ قبل از آموزش مدل، تمیز کردن داده‌ها رو یاد بگیر!

✏️ چون داده‌ی تمیز = مدل بهتر.

➖ ➖ ➖ ➖

8️⃣ قبل از مهندسی ویژگی‌ها، تحلیل اکتشافی داده (EDA) رو یاد بگیر!

✏️ چون باید بفهمی داده‌هات چه شکلی هستن.

➖ ➖ ➖ ➖

9️⃣ قبل از یادگیری تقویتی، یادگیری نظارت‌شده رو درک کن!

✏️ چون پایه‌ی خیلی از مفاهیم یادگیری ماشینه.

➖ ➖ ➖ ➖

1️⃣ قبل از شبکه‌های عصبی، مدل‌های کلاسیک یادگیری ماشین رو یاد گیر!

✏️ چون همیشه شبکه‌های عصبی بهترین انتخاب نیستن!

➖ ➖ ➖ ➖

1️⃣ قبل از دیپلوی کردن مدل‌های ML، مفاهیم پایه‌ای کلود رو یاد بگیر.

✏️ چون نیاز به زیرساخت‌های ابری داری.

➖ ➖ ➖ ➖

1️⃣ قبل از یادگیری دریاچه‌های داده (Data Lakes)، اول پایپ‌لاین‌های داده رو بشناس!

✏️ چون مسیر حرکت داده رو باید بفهمی.

➖ ➖ ➖ ➖

1️⃣ قبل از دیپلوی مدل، یاد بگیر چطوری مدل رو ارزیابی کنی!

✏️ چون یه مدل خوب = مدلی که درست تست شده باشه.

➖ ➖ ➖ ➖

1️⃣ قبل از ردیابی آزمایشات، نسخه‌سازی کد (Version Control) رو یاد بگیر!

✏️ چون بدون VC، پروژه‌هات به‌هم می‌ریزه!

➖ ➖ ➖ ➖

1️⃣ قبل از تنظیم هایپرپارامترها، الگوریتم‌ها رو خوب درک کن.

✏️ چون باید بدونی داری چی تنظیم می‌کنی!

➖ ➖ ➖ ➖

✔️ و حرف آخر:

📄 اول مفاهیم پایه‌ رو خوب یاد بگیر و توش استاد شو، بعد برو سراغ بخش‌های پیچیده‌تر!



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


🗂 5 پلتفرم فرصت‌های کارآموزی علم داده


👨🏻‍💻 اگه تازه‌ کارین و دنبال یه فرصت کارآموزی در زمینه علوم داده و تحلیل داده هستین، سایت‌های زیادی وجود دارن که می‌تونن بهتون کمک کنن. من چندتا از این سایت‌ها رو اینجا براتون لیست کردم:👇


1️⃣ وبسایت Forage

⏪ ارائه‌دهنده کارآموزی‌های آنلاین و رایگان علوم داده برای تقویت مهارت‌های شغلی و کسب تجربه واقعی.

➖➖➖➖➖➖➖➖➖

2️⃣ وبسایت Catchafire

⏪ امکان همکاری داوطلبانه با شرکت‌ها برای به‌کارگیری مهارت‌های تحلیل داده در پروژه‌های واقعی.

➖➖➖➖➖➖➖➖➖

3️⃣ وبسایت DataKind

⏪ ایجاد پلی بین دانشمندان داده و شرکت‌ها برای استفاده از تحلیل داده‌ها در جهت حل مسائل اجتماعی.

➖➖➖➖➖➖➖➖➖

4️⃣ وبسایت Statistics Without Borders

⏪ پیوند متخصصان آمار و تحلیلگران داده به پروژه‌های داوطلبانه جهانی و انسانی.

➖➖➖➖➖➖➖➖➖

5️⃣ وبسایت Viz for Social Good

⏪ انجمنی برای داوطلبان که از طریق تصویری‌سازی داده‌ها به پروژه‌های خیریه و اجتماعی کمک می‌کنه.



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir


@DataScience_ir - Data Science Shortcuts.pdf
3.4Мб
⌨️ کلیدهای میانبر کاربردی
برای کار با ابزارهای علوم داده


👩🏻‍💻 پلتفرم 365datascience یه آپدیت جدید از کلیدهای میانبر کاربردی برای کار با ابزارهای علوم داده منتشر کرده که بی‌نظیره!

✏️ من خودم با نسخه قبلی هر روز چندتا شورتکات جدید یاد می‌گرفتم و مرتب تمرین‌شون می‌کردم و توی پروژه‌هام ازشون استفاده می‌کردم. این کار واقعاً سرعت کارم رو دو برابر کرد و هر هفته کلی از وقتم رو سیو می‌کردم.


🖥 تو این چیت‌شیت کاربردی، شورتکات‌های ابزارهایی مثل SPSS, R, Python, SQL Tableau, EXCEL و … اومده.



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa

5k 1 138 223

🔴 دوره رایگان Python برای GenAI


👩🏻‍💻 بچه‌ها GenAI Community یه دوره رایگان آموزش پایتون گذاشته که توی اون هم پایتون یاد می‌گیرین و هم کاربرد پایتون در هوش مصنوعی مولد!


✏️ کلاس‌ها به صورت لایوه، ولی فیلم کلاس‌ها رکورد میشه و داخل پنل کاربری‌تون بهش دسترسی دارین. ۱۰ تا ۱۲ هفته ادامه داره و کاملاً رایگانه!

✅ اگه می‌خواین پایتون رو از صفر یاد بگیرین و وارد دنیای هوش مصنوعی مولد (GenAI) بشین، این دوره مخصوص شماست! نیازی به پیش‌زمینه برنامه‌نویسی هم ندارین، فقط کافیه انگیزه یادگیری داشته باشین!


🥵 تو این دوره چه چیزهایی یاد می‌گیرین؟

✅ مفاهیم پایتون: شرط‌ها، حلقه‌ها، ساختار داده‌ها
✅ کار با APIها، مدیریت فایل‌ها و Regex
✅ برنامه‌نویسی شی‌گرا و کدنویسی ماژولار
✅ و کلی مهارت دیگه که مسیرتون رو برای ورود به دنیای هوش مصنوعی و علوم داده هموار می‌کنه.


🔔 یه نکته هم بگم که این کامیونیتی سال قبل رشد 5 برابری داشته و حالا یکی از بزرگ‌ترین کامیونیتی‌های AI دنیاست. توی آخرین دوره هکاتونی هم که برگزار کردن، ۵۰۰۰ نفر از سراسر دنیا شرکت کردن و ۲۵ هزار دلار جایزه بینشون تقسیم شد.


📣 کاملاً رایگانه! بدون هزینه، بدون محدودیت، با یه مجموعه از آدمای مشتاق برای یادگیری.👇


🔗 Learn Pyton for FREE (GenAI Python)



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


Видео недоступно для предпросмотра
Смотреть в Telegram
💡 یه پکیج کامل برای موفق شدن در مصاحبه‌های دیتا ساینس و ماشین لرنینگ!

👩🏻‍💻 یه ریپوی گیت‌هاب پیدا کردم که پر از منابعیه که برای موفق شدن توی مصاحبه‌های Data Science و Machine Learning لازم دارین!

چی توش پیدا می‌کنی؟

1⃣ چیت‌شیت‌های کاربردی: نکات مهمو یه جا جمع کرده.

🔢 کتابای خفن: منابعی که ارزش وقت گذاشتن دارن!

🔢 سوالای پرتکرار مصاحبه‌ها: مباحثی که تو بیش‌تر مصاحبه‌ها ازشون سوال اومده و باهاش احتمالا مواجه می‌شین.

🔢 پروژه‌های پورتفولیو: واسه اینکه رزومه‌تونو قوی‌تر کنین.


✅ خلاصه یه پکیج کامل واسه آمادگی برای مصاحبه‌های علوم داده، بدون سردرگمی!

🔗 اینم لینک ریپوش:👇

🔗Cracking the data science interview



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


🏳️‍🌈 ساخت نمودارهای جذاب با کتابخانه Pygal
جایگزینی برای Matplotlib و Seaborn

👨🏻‍💻 اگه به دنبال ساخت نمودارهای چشم‌نواز و تعاملی برای پروژه‌های علوم داده‌ هستین، وقتشه که با Pygal آشنا بشین!

ابزار Pygal یه کتابخانه پایتونه که بر خلاف کتابخانه‌هایی مثل Matplotlib یا Seaborn که تنظیمات و سفارشی‌سازی‌های پیچیده ای دارن، یه گزینه سبک و راحت‌تره که بهت اجازه میده فقط با چند خط کد بنویسی نمودارهای میله‌ای، خطی، دایره‌ای و... با فرمت SVG بسازی، که نه تنها توی هر سایزی کیفیت‌شون حفظ میشه، بلکه می‌تونین به راحتی توی پروژه‌هایی که قراره داده‌ها، به صورت آنلاین نمایش داده بشن هم، ازشون استفاده کنین.


💸 Pygal
📄 Documentation
🐱 GitHub-Repos

🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


🏳️‍🌈 دانلود ویرایش جدید کتاب Think Python
یکی از بهترین منابع یادگیری پایتون

👨🏻‍💻 آلن داونی پروفسور علوم کامپیوتر و نویسنده مجموعه کتاب‌های Think، که به خاطر سادگی و شیوه آموزش جذاب و مؤثر در بین علاقه‌مندان به علوم داده محبوبیت داره، ویرایش سوم کتابش رو که یکی از بهترین منابع برای یادگیری برنامه‌نویسی پایتون است، به رایگان در اختیار علاقه ‌مندان این حوزه قرار داده است.

⏪ ویرایش سوم کتاب Think Python، در کنار بهبود و ارائه محتوای قبلی به شکلی ساده و قابل فهم، یکی از بزرگترین تغییراتش رو در طراحی تمام کتاب به صورت نوت‌بوک‌های ژوپیتر به نمایش گذاشته است.

📄 برای دسترسی به ویرایش جدید این کتاب می‌تونین از لینک‌های زیر استفاده کنین:👇

💸 Think Python
📖 3rd Edition (Web)
🏳️‍🌈 3rd Edition (PDF)
🐱 GitHub-Repos
🏳️‍🌈 2nd Edition (PDF)


🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


🔥این کتابخونه پایتون واقعاً شگفت‌انگیزه!

👨🏻‍💻 خیلی وقت‌ها استخراج و تحلیل داده‌های ساختار یافته در فایل‌های PDF، به شدت زمان‌بره، اما با این ابزار، این کار به‌راحتی انجام می‌شه.

✅ فقط با چند خط کد می‌تونین جداول رو از فایل‌های PDF استخراج کنین و به یک دیتافریم پانداس تبدیل کنین!

❗️ البته دقت کنین که این روش فقط وقتی خوب کار می‌کنه که:

1️⃣جدول‌های فایل pdf با کیفیت باشه.
2️⃣بیشتر از یک جدول نباشه!
3️⃣جدول‌ها خط‌کشی و مرز مشخصی داشته باشن.

نکته: برای پردازش بیشتر از یک جدول، استفاده از Regex بعد از اینکه فایل رو با یه OCR پردازش کنین و خطوط رو جدا کنین، همچنان راه بهتریه.


🏳️‍🌈 pdfplumber library
📄 pdfplumber 0.4.4
🐱 GitHub-Repos


✏️ علاوه بر این کتابخونه، PyMuPDF4LLM هم اخیراً سروصدای زیادی کرده و گزینه‌یِ جذابیه. اگه در حال کار روی پروژه‌های مرتبط با مدل‌های زبان بزرگ (LLMs) هستین و نیاز به پردازش PDF دارین، حتماً ارزش بررسی رو داره.👌🏼



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir


@DataScience_ir - Data Cleaning.pdf
695.0Кб
📚 جزوه فارسی «پاکسازی داده‌ها»

👨🏻‍💻 اون روزایی که برای مصاحبه‌ اسنپ‌فود آماده می‌شدم، فکر می‌کردم همه چیزو عالی پیش بردم. از مصاحبه HR گرفته تا تسک آزمایشی و ارائه پروژه! اما تو آخرین مرحله، یه اشتباه ساده کار دستم داد: «یادم رفت داده‌هامو تمیز کنم»! بله، تحلیل داده‌های کثیف که نتیجه‌اش مشخصه...🙂


✏️ تا چند وقت حس می‌کردم دقیقه ۹۵ گل خوردم، ولی بعدش تصمیم گرفتم از این اشتباهم درس بگیرم. حالا یه جزوه کامل از مراحل پاکسازی داده‌ها دارم و همیشه یادم می‌مونه: اول Data Cleaning، بعد Data Analysis! 🙂‍↔️👌🏼


🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


@DataScience_ir - Math for Data Science.pdf
15.5Мб
📚 جزوه «ریاضیات علم داده»

👨🏻‍💻 این جزوه به همه مفاهیم ریاضی که برای متخصص شدن تو حوزه‌ی علم داده نیازه، به صورت کامل و پایه‌ای می‌پردازه و یه راهنمای کامل و فوق‌العاده‌ست برای اینکه پایه‌ ریاضیت رو توی علم داده قوی کنی و با پروژه‌های بزرگ خودتو به چالش بکشی!

✅ مفاهیم کلیدی که پوشش داده شده:

🔢 دیتاست‌ها
🔢 حساب دیفرانسیل،
🔢 هندسه خطی،
🔢 آمار و احتمال و... .


🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


🧰 26 ابزار طلایی برای ارتقای کارایی Pandas
⬅️ بخش اول

👨🏻‍💻 تا حالا شده فکر کنی از Pandas درست و حسابی استفاده نمی‌کنی؟ با اینکه این کتابخانه قدرتمند بین دیتا ساینتیست‌ها بسیار پرطرفداره، ولی بیشتر کاربران از توانایی‌هاش بی‌خبرن!

✅ این ابزارها می‌تونن کارهایی مثل نمایش بهتر دیتاها، آنالیز دقیق‌تر، پردازش سریع‌تر و کلی قابلیت دیگه رو به Pandas اضافه کنن. با کمک این ابزارها، انگار داری از Pandas به یه روش خیلی پیشرفته‌تر و بهتر استفاده می‌کنی.

📄 اگه شروع به استفاده ازشون کنی، قطعاً کار با Pandas برات تبدیل به یه تجربه منحصر به فرد میشه! اینا ابزارهایی هستن که کافیه فقط یک بار امتحانشون کنی تا متوجه بشی چقدر می‌تونن کارتو آسون‌تر و حرفه‌ای‌تر کنن.👌


بخش اول:

1️⃣ ابزار Jupyter-Datatables

⏪ این ابزار بهت کمک می‌کنه که پیش‌نمایش دیتاهای توی DataFrame رو توی محیط Jupyter خیلی غنی‌تر و بهتر ببینی.


2️⃣ ابزار SummaryTools

⏪ این ابزار خلاصه‌سازی و توصیف دیتا رو بهبود میده و فراتر از تابع استاندارد describe() میره.


3️⃣ ابزار Sidetable

⏪ با این ابزار، قابلیت‌های تابع value_counts() بیشتر میشه و دسته‌بندی داده‌ها رو آسون‌تر می‌کنه.


4️⃣ ابزار Sketch

⏪ این ابزار با پرسیدن سوال‌، کد و تحلیل‌های مورد نیازت رو در اختیارت می‌ذاره.


5️⃣ ابزار Deepchecks

⏪ این ابزار بهت یه گزارش کامل و جامع از اعتبارسنجی دیتاهات میده که خیالت رو از کیفیت کار راحت می‌کنه.


6️⃣ ابزار Pandas Flavor

⏪ این ابزار بهت اجازه میده که متدهای دلخواهت رو به دیتا فریم اضافه کنی.


7️⃣ ابزار Pandarallel

⏪ با این ابزار می‌تونی پردازش‌های پانداس رو سریع‌تر کنی و از همه هسته‌های CPU استفاده کنی.


8️⃣ ابزار PandasML

⏪ این ابزار، Pandas رو با scikit-learn و matplotlib یکپارچه می‌کنه تا بتونی از قابلیت‌های همه‌شون با هم استفاده کنی.


9️⃣ ابزار Geopandas

⏪ با این ابزار، دیتای مکانی و جغرافیایی رو توی Pandas راحت‌تر مدیریت و تحلیل می‌کنی.


1️⃣ ابزار DuckDB

⏪ این ابزار بهت این امکان رو میده تا روی دیتا فریم‌ها با SQL کوئری بنویسی و از ترکیب قدرتمند SQL و Pandas استفاده کنی.


1️⃣ ابزار Modin

⏪ با یه تغییر ساده توی import، می‌تونی سرعت Pandas رو تا 70 برابر افزایش بدی!


1️⃣ ابزار PivotTableJS

⏪ با این ابزار می‌تونی Pivot Table رو با قابلیت drag-and-drop بسازی.


1️⃣ ابزار Missingno

⏪ این ابزار بهت امکان میده که دیتاهای گم شده توی دیتاستت رو به صورت تصویری و واضح ببینی.


🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


Видео недоступно для предпросмотра
Смотреть в Telegram
📈 داده‌هات رو بدون کد نویسی تحلیل کن!

👨🏻‍💻 اگه می‌خواین با داده‌هاتون چت کنین و بدون نوشتن کد و در کمترین زمان ممکن اون‌ها رو تحلیل‌ کنین، Vizly دقیقاً همون چیزیه که بهش نیاز دارین!

ابزار Vizly یه پلتفرم هوشمند و قوی برای تحلیل داده‌هاست که به کمک هوش مصنوعی، در عرض چند ثانیه و بدون نیاز به کدنویسی پیچیده، می‌تونین با داده‌هاتون چت کنین، نمودارهای جذاب بسازین و تحلیل‌های دقیق آماری انجام بدین.

امکانات مهم Vizly:

1️⃣ تحلیل سریع داده‌ها: فقط کافیه فایلت رو آپلود کنی. Vizly خودش سوالات جالبی درباره داده‌هات مطرح می‌کنه و تحلیل‌های لازم رو برات انجام میده.

2️⃣ پشتیبانی از فرمت‌های مختلف: می‌تونی فایل‌های Excel ،CSV و JSON رو مستقیماً آپلود کنی. از انواع دیتابیس‌ها هم پشتیبانی می‌کنه.

3️⃣ کدنویسی خودکار: برای تحلیل‌های پیچیده‌تر، Vizly کدهای Python یا R رو به‌طور خودکار برات تولید می‌کنه تا بتونی تحلیل‌های عمیق‌تری داشته باشی.

4️⃣ امنیت داده‌ها: بعد از یه ساعت عدم فعالیت، داده‌هات پاک میشه تا از امنیت و حریم خصوصی‌ات مطمئن باشی.

5️⃣ اشتراک‌گذاری آسان: نتایج تحلیل‌هات رو می‌تونی به شکل فایل PDF یا Word، یا حتی لینک قابل اشتراک‌ در بیاری و با دیگران به اشتراک بذاری.


💸 Vizly
🏳️‍🌈 Website


🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa

Показано 20 последних публикаций.