Data Science | علم داده


Kanal geosi va tili: Eron, Forscha


📊 دانشمند داده شوید!
👔 جهت درج تبلیغات، به آیدی زیر پیام دهید:👇🏼‌
🆔 @DataScienceir_Adv

Связанные каналы  |  Похожие каналы

Kanal geosi va tili
Eron, Forscha
Statistika
Postlar filtri


@DataScience_ir - DS Handbook.pdf
4.6Mb
🥇 جزوه فارسی «علم داده»

👨🏻‍💻 بالاخره تونستم یه جزوه جامع و کامل برای علم داده آماده کنم و خیلی خوشحالم از این اتفاق!

📄 تو این جزوه به کلی موضوع جذاب پرداختم، مثل تحلیل اکتشافی داده‌ها، کار با کتابخونه‌های معروف مثل Numpy، Pandas، Matplotlib و Seaborn، و البته یادگیری ماشین (چه نظارت‌شده و چه نظارت‌نشده)، تحلیل‌های آماری و هزاران نکته مهم!

💸 هدفم این بوده که یه راهنمای کامل برای علم داده بنویسم؛ یه چیزی که هم برای مبتدی‌ها مناسب باشه و هم برای کسایی که دنبال عمیق‌تر کردن دانششون هستن.


Data Science Handbook
🐱 GitHub-Repos



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


Quera dan repost
📣 ثبت‌نام سری نهم بوتکمپ برنامه‌نویسی کوئرا آغاز شد. | QBC9

🔘 دوره‌ فشرده‌ آماده‌سازی برای ورود به بازارکار

🚩 در مسیر "پایتون"

بدون هیچ پیش‌نیازی فقط کافیه علاقه‌مند باشی.

✔️ از پایه تا پیشرفته
✔️ کار گروهی و شبکه‌سازی‎
✔️ تمرین و پروژه هدفمند
✔️ منتورینگ اختصاصی

❗️ظرفیت محدود
💳 اگه تا پایان اسفند ۱۴۰۳ ثبت‌نام کنی می‌تونی تو ۷ قسط پرداخت داشته باشی.

🌐 فرم ثبت‌نام:
🔗 https://quera.org/r/6aejg

〰️〰️〰️〰️〰️
#Quera #QBC9


تهران دیتا-دانشگاه تهران dan repost
🔜 قیمت‌ها جا موندن، شما پیشرفت کنید 🔜

🆕 ثبت‌نام سی‌وپنجمین دوره جامع علم داده و هوش مصنوعی دانشگاه تهران آغاز شد...

هوش مصنوعی همیشه در حال پیشرفته، اما قیمت ما ثابت مونده!


💡 فرصت استثنایی برای سرمایه‌گذاری روی آینده شغلی با نرخ امسال برای سال بعد😮

😀 ویژگی‌های منحصربه‌فرد این دوره:

✅ ۳۵۰ ساعت آموزش پروژه‌محور، منطبق با نیازهای واقعی بازار کار

🎓 مدرک دو زبانه معتبر تحت نظارت وزارت علوم، قابل استعلام و ترجمه رسمی

📚 ۲۱ سرفصل تخصصی از مبانی تا متوسطه

📉 کار با ۱۲ ابزار و نرم‌افزار کلیدی علم داده و هوش مصنوعی

💰 تخفیف داریم اونم چه تخفیفی⁉️
تا سقف ۸،۲۵۰،۰۰۰ تومان فقط برای ۱۰ نفر اول

💳 شرایط پرداخت اقساطی متناسب با بودجه شما

📆 شروع دوره : ۵ اردیبهشت | جمعه‌ها ۸:۳۰ تا ۱۷:۳۰

ℹ️ برای دریافت اطلاعات بیشتر و ثبت‌نام، به سایت ما مراجعه نمایید یا با ما تماس بگیرید❤️
🤙09377516759 | 09357516755
➡️ https://tehrandata.org/courses/datascience

❌ یعنی می‌تونی امروز ثبت‌نام کنی و سال بعد با همین هزینه وارد بازار کار بشی‼️

✈️ Telegram |📞 whatsapp |🎰linkedin |📷 Instagram |🌐 website | 💬 admin 1 | 💬 admin 2

#علم_داده #دیتاساینس #هوش_مصنوعی #داده_کاوی #یادگیری_ماشین


🟢 سال جدید دیتا ساینس یاد بگیر و درآمد خوب داشته باش!

⚛️ بوت‌کمپ Data Science دانشکار رو الان با ۴۰٪ تخفیف ثبت‌نام کن و تا شهریور سال بعد دیتا ساینتیست شو.

⭕️ ظرفیت محدود

شروع راه یادگیری و استخدام👇
🔗 https://dnkr.ir/yLDAX
🔗 https://dnkr.ir/yLDAX


@DataScience_ir - ChatGPT for Python.pdf
9.9Mb
📄 جزوه «ترکیب پایتون با ChatGPT»

👨🏻‍💻 جدیدا یه جزوه‌ای رو پیدا کردم که برای هر برنامه‌نویس پایتونی که دنبال استفاده عملی از ChatGPT تو پروژه‌هاشه، فوق‌العاده کاربردیه.

✅ با این جزوه یاد می‌گیرین چطور ChatGPT رو با پایتون ترکیب کنین و از این چت‌بات محبوب توی بخش‌های مختلف پروژه‌هاتون مثل کدنویسی، پاکسازی دیتاست، مصورسازی و نوشتن پرامپت‌های کاربردی و فوق العاده استفاده کنین.


🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


FaraDars_Course dan repost
🟢 تمدید شد؛ ۵۵۰+۱۵۰ آموزش پرمخاطب در فرادرس، فقط ۷۹ هزار تومن...
 
🔴 درسته آخر ساله ولی برای یادگیری، هیچ وقت دیر نیست!! 😉
 
▫️ برنامه نویسی پایتون + مثال های عملی
 
▫️ آموزش هوش مصنوعی – تکمیلی
 
▫️ وب اسکرپینگ با پایتون – Web Scraping
 
▫️ آموزش Power BI برای تحلیل داده
 
مبانی یادگیری عمیق یا Deep Learning
 
📚 لیست تمامی ۷۰۰ آموزش — [کلیک کنید]
 
🎁 کد تخفیف: AMG62

🔄 FaraDars - فرادرس


🔥🚀 با یادگیری ماشین، آینده را کدنویسی کن! 🤖💡

آیا می‌خواهید به دنیای هوش مصنوعی ورود کنید و با داده‌ها معجزه کنید؟ ✨📊
دوره یادگیری ماشین با پایتون فرصتی استثنایی برای یادگیری از صفر تا پیشرفته!

🎯 چرا این دوره؟
✅ یادگیری عمیق و کاربردی با پروژه‌های واقعی 🛠️
✅ از مفاهیم پایه تا مدل‌های پیشرفته 🤓
✅ مناسب برای ورود به بازار کار علوم داده و AI 💼

⏳ فرصت رو از دست نده! همین الان ثبت‌نام کن!
➖➖➖➖➖➖➖➖➖
برای کسب اطلاعات بیشتر به لینک زیر مراجعه کنید↙️
https://B2n.ir/z73050
➖➖➖➖➖➖➖➖➖
☎️مشاوره و ثبت نام
02167641999
📲مشاوره تلگرام
09222477250
➖➖➖➖➖➖➖➖➖
✓ جهاد دانشگاهی صنعتی شریف؛ یک پله بالاتر از تخصص


✏️ 10 پرامپت فوق العاده ChatGPT
برای پروژه‌ها و کارهای روزمره علوم داده

👨🏻‍💻 تو این مدتی که ChatGPT اومده، کلی به من توی پروژه‌های دیتا ساینس کمک کرده. توی بعضی از مراحل پروژه واقعا نمی‌دونستم دقیقاً باید از کجا شروع کنم یا چه ابزاری برای رفع مشکل مناسب‌تره.

🖋 حالا یه لیست ده‌تایی از پرامپت‌هایی که خیلی این مدت بهم کمک کردن رو آماده کردم و اینجا براتون گذاشتم. هر کدوم یه بخش از مراحل انجام پروژه‌های دیتا ساینس رو پوشش میدن و توی چالش‌های پروژه‌ها خیلی بهتون کمک می‌کنن.


🔢 بررسی و پاکسازی داده‌ها: وقتی نمی‌دونین داده‌ها رو چطور بررسی کنین یا چجوری مقادیر گم‌شده و ناهنجاری‌ها رو رفع کنین، از این پرامپت استفاده کنین.


✍️ "Given this dataset summary: [خلاصه اطلاعات دیتاست], suggest methods to explore and clean the data. Include techniques for handling missing values and outliers."


🔢 مهندسی ویژگی‌ها: ایده‌هایی برای ساخت ویژگی‌های جدید و بهینه کردن مدل‌هاتون.


✍️ "Suggest advanced feature engineering techniques for a dataset related to [موضوع موردنظر مثل پیش‌بینی ترک مشتری]. Include ideas for creating new variables."



🔢 انتخاب مدل مناسب: شناسایی مدل‌های مناسب با تمام مزایا و معایبشون.


✍️ "What are the best machine learning models for [نوع مسئله مثل طبقه‌بندی]? Provide pros, cons, and use cases for each."


🔢 ارزیابی عملکرد مدل: شناخت دقیق روش‌های ارزیابی مدل‌ها.


✍️ "Explain the most effective methods to evaluate the performance of a [نوع مدل] for [وظیفه مثل طبقه‌بندی تصاویر]. Include key metrics and their interpretation."


🔢 ایده‌های مصورسازی داده‌ها: مناسب برای وقتی که می‌خواین گزارش‌های شفاف و جذاب ارائه بدین.


✍️ "Recommend visualization techniques to present findings from [نوع داده مثل فروش]. Suggest specific charts or graphs for maximum clarity."


🔢 تحلیل آماری: به‌ راحتی فرضیاتتون رو تست کنین و تحلیل‌های آماری دقیق داشته باشین.


✍️ "How can I perform statistical analysis to test the hypothesis: [فرضیه موردنظر]? Include steps and the statistical tests to use."


🔢 خودکارسازی جریان‌های داده: اگه می‌خواین کلی از زمان‌تون رو صرفه‌جویی کنین، این پرامپت خیلی کاربردیه.


✍️ "Outline a plan to automate data collection, cleaning, and storage for a [نوع پروژه]. Suggest tools and techniques for efficiency."


🔢 تشخیص ناهنجاری‌ها: مناسب برای کشف موارد غیرعادی و مشکلات احتمالی توی داده‌هاتون.


✍️ "What methods can I use to detect anomalies in [نوع داده مثل ترافیک شبکه]? Explain the process and algorithms suitable for this task."


🔢 تحلیل سری‌های زمانی: اگر با داده‌های زمان‌محور کار می‌کنین، این پرامپت کاربردیه.


✍️ "Guide me through building a predictive model for time series data, specifically for forecasting [متریک مثل قیمت سهام]. Include preprocessing steps and algorithms."


🔢 پردازش زبان طبیعی: برای تحلیل داده‌های متنی، مثل تحلیل احساسات یا استخراج اطلاعات کلیدی.


✍️ "Explain how to process and analyze textual data for [کاربرد مثل تحلیل احساسات]. Suggest tools, libraries, and workflows for an end-to-end solution."



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


تهران دیتا-دانشگاه تهران dan repost
فقط 5 نفر تا پایان تکمیل ظرفیت آخرین دوره سال 1403

دوره حرفه‌ای تحلیل داده‌های کسب‌و‌کار و آمادگی آزمون IIBA-CBDA

📅 شروع دوره: 23 اسفند
❤️ روزهای برگزاری: پنجشنبه ها ۱۳ الی ۱۷

ویژگی‌های منحصر بفرد دوره:
✅ آموزش دو راهنمای تحلیل کسب‌وکار و تحلیل داده‌های کسب‌وکار موسسه IIBA کانادا
✅ کوچینگ و مشاوره رایگان توسط اساتید دوره
✅ اعطای گواهینامه دوزبانه و قابل استعلام از دانشگاه تهران
✅ دسترسی به پنل تست‌زنی و رفع اشکال تست‌ها
✅ آمادگی آزمون دریافت گواهینامه CBDA از موسسه بین‌المللی تحلیل کسب‌وکار (IIBA کانادا)

⛔️ شرایط استثنائی فقط برای چند ثبت نام کننده پایانی‼️

ℹ️ برای کسب اطلاعات بیشتر و ثبت نام ، به وب سایت ما مراجعه نمایید.
https://tehrandata.org/courses/babok/

یا میتوانید جهت تسریع در فرایند ثبت نام با
کارشناس ما در ارتباط باشید.
📞 09377516835

👍 همین حالا به جمع دانشجویان موفق بپیوندید.

✈️ Telegram | 📞 whatsapp | 📱 linkedin | 📱 Instagram | 🌐 website|  😀 admin

#تحلیل_داده #داده_محور #کسب_و_کار #دیتاسینس #علم_داده


🏳️‍🌈 انجام یک پروژه واقعی علم داده + PDF


👨🏻‍💻 من خیلی وقته که دیگه پروژه‌های تکراری علوم داده در اینترنت رو کنار گذاشتم. چون فهمیدم این پروژه‌های واقعی و تاثیرگذاره که مزیت رقابتی شما تو مصاحبه ‌های شغلی علوم داده میشه.

✅ من اینجا یه پروژه حرفه‌ای تحلیل داده رو قرار دادم که هم مهارت‌هاتون تو تحلیل متن و پردازش زبان طبیعی رو نشون میده و هم رزومه‌تون رو قوی‌تر می‌کنه!👇

✏️ ایده پروژه: تحلیل احساسات کاربران شبکه‌های اجتماعی (مثلا توییتر) درباره یه برند یا موضوع خاص

مراحل انجام پروژه:

🔢 با استفاده از توییتر API، داده‌ها رو مستقیم از شبکه اجتماعی جمع‌ آوری می‌کنین. می‌تونین داده‌های آماده رو از اینجا هم دانلود کنین.

🔢 متون رو با تکنیک‌های پیش‌پردازش آماده می‌کنین تا به بهترین نتیجه برسین.

🔢 احساسات مثبت، منفی یا خنثی رو تحلیل می‌کنین و با ابزارهای بصری نتایج رو نشون می‌دین.

🔢 یه گزارش کامل از روندها و یافته‌هات ارائه می‌دین که کاملاً حرفه‌ایه.


📄 اگه می‌خواین با نحوه کامل انجام پروژه هم آشنا بشین، فایل PDF زیر رو دانلود کنین.


🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


Quera dan repost
⚡️مسابقه الگوریتمی «خداحافظ ۱۴۰۳»

🗓 تاریخ برگزاری: جمعه، ۲۴ اسفند ۱۴۰۳

🔘 پس از پایان مسابقه، نفرات برتر، به شرکت بیت‌پین معرفی میشن.
🔘 شرکت توی این مسابقه روی امتیاز کوئرایتون تاثیر داره.

🎁 ۳۰ میلیون تومان جایزه نقدی به همراه هدایای دیگر

🧩 برای تمرین می‌تونی از بانک سوالات کوئرا استفاده کنی تا آمادگی بیشتری برای مسابقه داشته باشی.

✅ ثبت‌نام و اطلاعات بیشتر:
🔗 https://quera.org/r/k8x7u

➖➖➖➖➖
#Quera_Contest


ABPMP-CBPP dan repost
🏆 دوره صلاحیت حرفه‌ای مدیریت فرایندهای کسب‌و‌کار و آمادگی آزمون CBPP


📣 تخفیف ویژه ۷ میلیون تومانی، فقط برای ۱۰ نفر

🎁 هدیه ما به شما: انجام رایگان تمامی مراحل ثبت‌نام در موسسه ABPMP و فراهم نمودن تمامی زیرساخت‌های مورد نیاز برای برگزاری آزمون در کشور

🔥 شرایط اقساطی متناسب با بودجه هر شخص

⁉️ برای کسب اطلاعات بیشتر و ثبت‌نام در دوره همین حالا اقدام کنید!

🌐 لینک ثبت نام:
🔗 https://evand.com/events/cbpp

📞 تماس با ما: 09961607292

🥇 همین حالا به جمع دریافت‌کنندگان معتبرترین گواهینامه بین‌المللی مدیریت فرایندهای کسب‌وکار و دانش‌پذیران موفق دانشگاه صنعتی شریف بپیوندید‼️

😁 کانال تلگرام ما را دنبال کنید.
https://t.me/ABPMP_CBPP

#BPM #CBPP #ABPMP #فرایند


🖊 چطوری یه رزومه و پورتفولیوی حرفه‌ای برای علوم داده بسازیم؟


👨🏻‍💻 اگه دنبال اولین شغلت توی حوزه علم داده هستی، داشتن یه رزومه و پورتفولیوی حرفه‌ای خیلی اهمیت داره. این قدم‌های اولیه می‌تونه مسیر شغلیت رو تعیین کنه.

✅ به همین دلیل، یه سری مقالات نوشتم که بهت کمک می‌کنه رزومه‌ و پورتفولیو بهتری بسازی. اینا از تجربیات خودمه و مطمئنم که برات خیلی مفیده:


✏️ نوشتن رزومه‌ای که متمایزتون می‌کنه:

1️⃣ چطور رزومه‌ای بسازیم که دعوت به مصاحبه بشیم؟

◀️ لینک

2️⃣ ساخت یک رزومه بی‌نقص برای علوم داده:
10 اشتباهی که باید ازشون دوری کنی!

◀️ لینک

3️⃣ چطور با چندتا ترفند ساده، تعداد مصاحبه‌هام رو توی یک ماه 15 تا بیشتر کردم؟

◀️ لینک

💠💠💠💠💠💠💠💠💠💠💠💠

✏️ چطور یک پورتفولیوی خاص بسازیم:

1️⃣ چرا یک دانشمند داده حتماً باید پورتفولیو داشته باشه؟

◀️ لینک

2️⃣ می‌خوای توی علوم داده متمایز بشی؟
این اشتباهات در پورتفولیوت مرتکب نشو!

◀️ لینک

3️⃣ چطور پورتفولیوی علوم داده‌ای بسازیم که کار بگیریم؟

◀️ لینک

4️⃣ توصیه‌های مدیران استخدام:
برای گرفتن اولین شغل علوم داده

◀️ لینک

5️⃣ پروژه‌های راهنما:
بهترین روش برای یادگیری عملی علوم داده

◀️ لینک

6️⃣ ساخت پروژه‌های جذاب علوم داده:
10 سایت عالی + دیتاست

◀️ لینک

7️⃣ 5 ابزار رایگان برای ارتقای پورتفولیوی شما:

◀️ لینک

8️⃣ ساخت پروژه‌های علوم داده صنعتی:

◀️ لینک


🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


@DataScience_ir - Data Analysis with NumPy.pdf
813.2Kb
🏳️‍🌈 جزوه آموزشی «کتابخانه NumPy»

👨🏻‍💻 چند روز گذشته، کامل مشغول آماده کردن این جزوه آموزشی جامع کتابخانه NumPy برای علوم داده بودم و سعی کردم تمام نکات و ترفندهای این کتابخونه رو پوشش بدم.

چرا این جزوه فرق داره؟ چون فقط بر اساس مفاهیم تئوری نوشته نشده و نتیجه تجربیات و یادگیری خودمه. مثال‌های واقعی و کاربردی داره که بهتون کمک می‌کنه بهتر مفاهیم NumPy رو درک کنین و توی پروژه‌هاتون استفاده کنین.💯


🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


@DataScience_ir - Optimization for Data Science.pdf
11.2Mb
✏️ جزوه «بهینه‌سازی برای علم داده»
🖥 دانشگاه صنعتی زوریخ


👨🏻‍💻 همیشه سرکلاس به دانشجوهام میگم «اگه دیتا ساینس یه تیم فوتبال باشه، بهینه‌سازی همون مربی حرفه‌ایه که استراتژی تیم رو طوری می‌چینه که بیشترین امتیاز رو بگیره!». / برند گارتنر - استاد علوم داده دانشگاه زوریخ


چرا بهینه‌سازی انقدر توی علم داده مهمه؟ چون تو دنیای علم داده، همیشه یه مسئله وجود داره که باید به بهترین شکل حلش کنی:

✅ پیدا کردن بهترین مدل برای پیش‌بینی
✅ کم کردن هزینه پردازش
✅ بیشینه کردن دقت مدل
✅ کم کردن خطا و کاهش ریسک و...


🔔 پس اگه می‌خوای یه مدل خوب و بهینه بسازی، باید بدونی چه روش‌های بهینه‌سازی‌ وجود داره، چقدر کارایی دارن، و چقدر می‌تونن سریع‌تر تو رو به جواب بهینه برسونن. در واقع بهینه‌سازی یه ابزار کلیدی در علم داده‌ است که کمک می‌کنه مدل‌های ما بهتر و کارآمدتر بشن.



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


🔹 تنها نقشه راهی که برای یادگیری «پایتون برای علم داده» نیاز داری! + به همراه نسخه فارسی 🐍


👩🏻‍💻 پایتون مهم‌ترین مهارتیه که یه دیتا ساینتیست باید بلد باشه! خبر خوب اینه که لازم نیست برای یادگیریش کلی پول بدی و توی بوت‌کمپ‌های مختلف یا دانشگاه ثبت‌نام کنی!


✏️ داستان من: وقتی وارد دنیای علوم داده شدم، هیچی از پایتون نمی‌دونستم.
رفتم سراغ کلی مصاحبه شغلی برای کار تو حوزه دیتا ساینس... ولی همه رو رد شدم!

💸 اون موقع بود که فهمیدم اگه واقعاً بخوام یه دیتا ساینتیست بشم، باید پایتون رو کامل یاد بگیرم. ولی مشکل این بود که نه پول بوت‌کمپ داشتم، نه وقت دانشگاه رفتن.
پس خودم دست‌به‌کار شدم و بهترین روش یادگیری رو پیدا کردم!🤓


✔️ از ترکیب این ۳ روش ساده استفاده کردم:

1️⃣ این نقشه راه یادگیری پایتون
2️⃣ یادگیری با DataCamp
3️⃣ تمرین و پروژه‌سازی توی Jupyter Notebook


🗺 نقشه راه یادگیری پایتون برای علوم داده:

🔢 مفاهیم پایه‌ی پایتون

❗️ مهم‌ترین قدمه! اگه این مرحله رو رد کنی، بعداً به مشکل می‌خوری.

✔️ متغیرها و انواع داده: ()type(), int(), float(), str(), list(), dict

✔️ ساختارهای کنترلی: ()if-elif-else, for, while, range

✔️ توابع و آرگومان‌ها: def, return, args

✔️ لیست کامپرهنشن: [expression for item in iterable if condition]

➖ ➖ ➖ ➖ ➖

🔢 پردازش و پاک‌سازی داده‌ها

❗️ اگه داده‌هات تمیز نباشه، مدل‌هات به درد نمی‌خوره!

✔️ پاک‌سازی داده‌ها: ()df.dropna(), df.fillna(), df.drop_duplicates(), df.replace

✔️ ادغام و تغییر شکل داده: ()pd.merge(), df.pivot(), df.melt

✔️ گروه‌بندی و تجمیع: ()df.groupby(), df.agg

📣 چک‌پوینت اول: یه پروژه پاک‌سازی داده انجام بده!

➖ ➖ ➖ ➖ ➖

🔢 تحلیل اکتشافی داده‌ها (EDA)

❗️ اینجاست که علم و هنر باهم ترکیب می‌شن!

✔️ آمار توصیفی: df.mean(), df.median(), df.mode(), df.std(), df.var(), df.min(), df.max(), df.quantile()

✔️ توزیع داده‌ها: ()df.hist(), stats.normaltest

✔️ تحلیل همبستگی: ()df.corr(), plt.imshow(), stats.pearsonr

📣 چک‌پوینت دوم: یه پروژه EDA انجام بده!

➖ ➖ ➖ ➖ ➖

🔢 مصورسازی داده با Matplotlib

❗️ داده‌ها وقتی دیده بشن، معنا پیدا می‌کنن!

✔️ نمودارهای پایه‌ای: ()plt.plot(), plt.scatter(), plt..bar

✔️ هیستوگرام و چگالی: ()plt.hist(), plt.kde

✔️ باکس‌پلات: ()plt.boxplot

✔️ چند نمودار در یک شکل: ()plt.subplots(), fig.add_subplot

✔️ شخصی‌سازی نمودارها: ()plt.xlabel(), plt.ylabel(), plt.title(), plt.legend

📣 چک‌پوینت سوم: یه پروژه بصری‌سازی داده انجام بده!

➖ ➖ ➖ ➖ ➖

🔢 یادگیری ماشین در پایتون

❗️ اینجا جاییه که جادو اتفاق می‌افته!

✔️ آموزش و ارزیابی مدل‌ها: ()train_test_split(), cross_val_score

✔️ مدل‌های رگرسیون: ()LinearRegression(), mean_squared_error(), r2_score

✔️ مدل‌های طبقه‌بندی: LogisticRegression(), accuracy_score(), ()confusion_matrix

✔️ خوشه‌بندی: ()KMeans

📣 چک‌پوینت چهارم: اولین مدل یادگیری ماشینت رو بساز!

➖ ➖ ➖ ➖ ➖

🔔 راستی، من کل پایتون رو با DataCamp یاد گرفتم و شدیداً پیشنهادش می‌کنم!👇


🔗 همه‌ این موارد رو یه‌جا یاد بگیر: DataCamp

🔗 نسخه فارسی «پایتون برای علم داده»: PDF



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


@DataScience_ir - Complete Statistics for Data science.pdf
1012.0Kb
✏️ جزوه خلاصه «آمار برای علم داده»


👩🏻‍💻 من همیشه یه جزوه کامل آمار برای علم داده داشتم که برای پروژه‌ها و مصاحبه‌های مختلف ازش استفاده می‌کردم، ولی هربار می‌دیدم چقدر سخته توی جزوه دنبال مفاهیم کلیدی بگردی و مطمئن بشی که برای هر سوالی آماده‌ای.


▶️ همین باعث شد یه «جزوه خلاصه 30 صفحه‌ای از مهم‌ترین مباحث آماری علوم داده رو به همراه سوالاتی که معمولا توی مصاحبه‌ها مطرح میشه» آماده کنم.

✍️ حالا این همون راهنمای مرور سریعه که توی روزهای (یا حتی ساعت‌های!) آخر قبل از مصاحبه بهش نیاز داری! فرقی نداره که برای موقعیت شغلی دانشمند داده، تحلیلگر داده یا مهندس ML آماده میشی، این جزوه کمکت می‌کنه:

✅ مفاهیم کلیدی رو سریع مرور کنی.

✅ جواب‌هات رو شفاف و با اعتمادبه‌نفس بدی.

✅ از احتمال تا آزمون‌های فرضیه، مباحث رایج توی مصاحبه‌ها رو پوشش بدی.



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


🥇 جامع ترین مخزن مسابقات Kaggle + راه حل
دسترسی به تمام پروژه‌های Kaggle
🗓 آپدیت فوریه 2025


👨🏻‍💻 فرید رشیدی دکترای علوم کامپیوتر یک مخزن فوق العاده به نام Kaggle Solutions ایجاد کرده که یه گنجینه ناب برای همه‌یِ متخصصای علوم داده، مهندسای یادگیری ماشین و پژوهشگرای این حوزه است.

🖊 این لیست تقریباً تمام راه‌حل‌ها، پروژه‌ها و ایده‌های موجود در Kaggle رو پوشش میده و به محض اتمام یک مسابقه جدید به روز میشه.🤞


✏️ این مجموعه تا الان شامل 638 رقابت + راه حل میشه که تا 5 فوریه 2025 آپدیت شده است.

برای دسترسی به این مخزن فوق العاده می‌تونید از لینک زیر استفاده کنین:👇


💸 Kaggle Solutions
💰 Website



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


@DataScience_ir - Pandas.pdf
9.9Mb
❗️ پانداس فقط یه خرس نیست؛ یه معجزه توی تحلیل داده‌ست!


👨🏻‍💻 تو این چند روز حسابی با کتابخونه Pandas کار کردم و نتیجه‌اش شد تهیه این جزوه. توی این نوت‌بوک، از Series و DataFrame شروع کردم، بعدش رفتم سراغ ایندکس کردن، فیلتر کردن و حتی بصری‌سازی داده‌ها.

▶️ اگه به حوزه‌ی دیتا ساینس یا تحلیل داده علاقه‌مندین، یادتون باشه تسلط به Pandas یه چیز اختیاری نیست؛ یه مهارت واجبه!



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


🔸 مقایسه 8 کتابخونه DataFrame روی یک میلیارد ردیف داده!


👨🏻‍💻 من ۸ تا جایگزین Pandas رو روی یک میلیارد ردیف داده تست کردم، هم روی فایل‌های CSV و هم Parquet.

✏️ نتیجه؟ FireDucks بهترین عملکرد رو داشت! یه جایگزین کاملاً بهینه‌شده برای Pandas که فقط با یه خط تغییر می‌تونی ازش استفاده کنی:


این خط رو حذف کن:

import pandas as pd

و اینو جایگزین کن:

import fireducks.pandas as pd


تمومه! همون کدهای Pandas، ولی خیلی سریع‌تر!

📣 جالب‌تر اینکه، تو بعضی موارد حتی از cuDF (کتابخونه DataFrame برای GPU) هم سریع‌تر بوده! برو تستش کن و شگفت‌زده شو!😎👇


🏳️‍🌈 FireDucks
├ ♾️ Google Colab
🐱 GitHub-Repos



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa

20 ta oxirgi post ko‘rsatilgan.