Data Science | علم داده


Гео и язык канала: Иран, Фарси
Категория: Технологии


📊 دانشمند داده شوید!
👔 جهت درج تبلیغات، به آیدی زیر پیام دهید:👇🏼‌
🆔 @DataScienceir_Adv

Связанные каналы  |  Похожие каналы

Гео и язык канала
Иран, Фарси
Категория
Технологии
Статистика
Фильтр публикаций


🏳️‍🌈 ابزار PyOD؛ بهترین کتابخانه پایتون
برای تشخیص ناهنجاری‌ها در داده‌های چند متغیره

👨🏻‍💻 فرض کن داری یه عالمه داده رو بررسی می‌کنی و یه سری داده عجیب و غریب به چشمت می‌خوره که اصلاً با بقیه همخوانی نداره. این داده‌های غیرعادی که بهشون میگیم ناهنجاری یا Outlier، می‌تونن کلی مشکل توی تحلیل‌ِ داده‌هات به وجود بیارن. اینجاست که PyOD وارد میشه و به دادت می‌رسه!

🐍 اصلاً PyOD چیه؟

⏪ یه کتابخانه‌ی، پایتونه که کارش شناسایی این داده‌های غیر عادیه. با استفاده از این کتابخانه، می‌تونین به راحتی داده‌های مشکوک رو توی دیتاست‌تون پیدا کنین و ببینین کجاها باید بیشتر دقت کنین.

📌 حالا چرا باید از PyOD استفاده کنیم؟

1️⃣ تنوع الگوریتم‌ها: PyOD پر از الگوریتم‌های مختلف برای تشخیص ناهنجاری‌هاست. از روش‌های قدیمی و معروف گرفته تا جدیدترین تکنیک‌ها، همه رو توی خودش جا داده. پس می‌تونی هر روشی که به درد کار و داده‌هات می‌خوره رو انتخاب کنی.

2️⃣ استفاده راحت: PyOD خیلی ساده و راحت طراحی شده. با چند خط کد می‌تونی ازش استفاده کنی و نیاز به مهارت خیلی پیشرفته نداری. یعنی حتی اگه تازه‌کار هم باشی، به راحتی می‌تونی باهاش کار کنی.

3️⃣ مستندات کامل و شفاف: PyOD کلی راهنما و مثال داره که کار رو برات آسون می‌کنه. مستنداتش طوریه که می‌تونی قدم به قدم باهاش پیش بری و سریع راه بیفتی.

4️⃣ جامعه کاربری قوی: کلی آدم توی دنیا دارن از PyOD استفاده می‌کنن و همیشه می‌تونی از تجربیات و راهنمایی‌های اون‌ها بهره ببری. از فروم‌ها و گیت‌هاب گرفته تا گروه‌های آنلاین، کلی جای خوب برای پرسش و پاسخ هست.

🐍 PyOD
📄 Documentation
🐱 GitHub-Repos


🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


Репост из: FaraDars_Course
💥 هر آموزش، فقط ۷۹,۰۰۰ تومن — با فرادرس هر چی میخوای یاد بگیر!
 
♨️ در جشنواره شگفتی آموختن، ۵۰۰ آموزش منتخب، ۷۹ هزار تومن شد.
 
👌 برنامه نویسی پایتون + مثال های عملی
 
👌 یادگیری ماشین با پایتون – ماشین لرنینگ
 
👌 کتابخانه های NumPy و Matplotlib در پایتون
 
👌 آموزش دیتاگارد در اوراکل Oracle
 
👌 ساختمان داده ها با پایتون
 
📚 لیست تمامی ۵۰۰ آموزش — [کلیک کنید]
 
🎁 کد تخفیف: AMG54

🔄 FaraDars - فرادرس


@DataScience_ir - Data Preparation in Python using Pandas.pdf
616.1Кб
🏳️‍🌈 جزوه پانداس من
💰 نتیجه تجربیاتم در کار با کتابخانه Pandas

👨🏻‍💻 یکی از بخش‌های پرکار و زمانبر توی پروژه‌های علوم داده، آماده‌سازی و تمیز کردن داده‌هاست. تقریباً حدود 70 تا 80 درصد کار توی پروژه‌های علوم داده صرف جمع‌آوری، تمیز کردن و تحلیل داده‌ها می‌شه.

📄 کتابخونه Pandas هم یکی از اون ابزارهایی هست که اگه بهش مسلط باشی، می‌تونی در کمترین زمان ممکن فرآیند پاکسازی و پردازش داده‌ها رو انجام بدی.

✔️ من یه جزوه کار با پانداس آماده کردم که نتیجه سال‌ها تجربه‌م از کار با این کتابخونه‌س و بهتون پیشنهاد می‌کنم حتماً توی پروژه‌های علم داده ازش استفاده کنین.


🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


Видео недоступно для предпросмотра
Смотреть в Telegram
📊 دوره فارسی «مبانی علوم داده»


📺 قسمت هفتم: "ادامه مباحث آماری علوم داده"

🕓 مدت زمان: 01:33:56

📚 جزوه بخش اول: PDF

👨‍🦱 مدرس: دکتر سعیدرضا خردپیشه

🖥 دانشگاه شهید بهشتی


🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


بهترین دیتاست‌ها برای پروژه‌های علوم داده
📄 16 منبع برای دسترسی به انواع دیتاست‌ها


👨🏻‍💻 اگه تا حالا دنبال داده‌های با کیفیت برای پروژه‌هاتون بودین و نمی‌دونستین از کجا پیداشون کنین، من اینجا براتون بهترین دیتاست‌های ممکن رو جمع آوری کردم!

💸 قراره با هم 16 تا از بهترین منابع دیتاست رو بررسی کنیم که می‌تونن پروژه‌هاتون رو به سطح جدیدی ببرن. از دیتاست‌های معروف کگل گرفته تا منابع آماری اتحادیه اروپا. پس اگه دنبال داده برای پروژه‌هاتون هستین، این لیست قطعاً به کارتون میاد.👌


1️⃣ وبسایت Kaggle

✏️ کگل یه پلتفرم معروف توی جامعه علم داده‌ست که دیتاست‌های متنوعی از حوزه‌های مختلف مثل سلامت، هنر، ورزش و غیره داره. استفاده ازش آسونه و یه انجمن فعال داره که می‌تونی سوالاتت رو بپرسی.


2️⃣ وبسایت UCI ML Repository

✏️ این مخزن که توسط دانشگاه کالیفرنیا پر از دیتاست‌های مناسب برای یادگیری ماشینه. برای تمرین و بهبود مهارت‌هاتون توی یادگیری ماشین، یه منبع عالیه.


3️⃣ وبسایت StrataScratch

✏️ این وبسایت دیتاست‌هایی از شرکت‌های واقعی داره که برای آماده شدن برای مصاحبه‌های علم داده خیلی مفیده.


4️⃣ وبسایت Google Dataset Search

✏️ این ابزار مثل گوگل یه سرچ معمولیه، ولی فقط روی پیدا کردن دیتاست‌ها تمرکز داره. از منابع مختلف مثل مقالات علمی و دیتابیس‌های دولتی داده‌ها رو براتون پیدا می‌کنه.


5️⃣ وبسایت AWS Public Datasets

✏️ برنامه دیتاست‌های عمومی AWS آمازون یه عالمه اُپن دیتا داره که می‌تونی با سرویس‌های ابری AWS ترکیب کنی. اگه پروژه‌هات به منابع محاسباتی بیشتری نیاز داشته باشه، اینجا خیلی کاربردیه.


6️⃣ وبسایت Data.gov

✏️ این سایت دیتاست‌های مختلفی از سازمان‌های آمریکایی داره. از کشاورزی و سلامت عمومی گرفته تا آموزش و محیط‌ زیست، هرچی بخوای اینجا می‌تونی پیدا کنی.


7️⃣ وبسایت FiveThirtyEight

✏️ این وبسایت داده‌ها و کدهای مربوط به مقالات و گرافیک‌های خودش رو به اشتراک می‌ذاره. اگه به داستان‌سرایی داده و پروژه‌های مرتبط با رویدادهای جاری علاقه داری، اینجا جای توست.


8️⃣ وبسایت The World Bank Open Data

✏️ این بانک داده از بانک جهانی شامل اطلاعات توسعه جهانیه. داده‌های اقتصادی، محیط‌زیستی و اجتماعی از کشورهای مختلف رو اینجا می‌تونی پیدا کنی.


9️⃣ وبسایت GitHub

✏️ گیت‌هاب فقط برای اشتراک‌گذاری کد نیست. خیلی از سازمان‌ها و کاربران دیتاست‌های خودشون رو اینجا قرار میدن که همراه با مستندات و کدهای تحلیلی هست.


1️⃣ وبسایت OpenML

✏️ این پلتفرم آنلاین برای یادگیری ماشین، نزدیک به ۵۴۰۰ دیتاست داره و به اشتراک‌گذاری، سازماندهی و بحث درباره داده‌ها و نتایج تجربیات یادگیری ماشین می‌پردازه.


1️⃣ وبسایت Reddit Datasets

✏️ این ساب‌ردیت یه منبع داده جامعه‌محوره. مردم اینجا دیتاست‌ها رو به اشتراک می‌ذارن و درخواست میدن.


1️⃣ وبسایت Eurostat

✏️ دفتر آماری اتحادیه اروپا، داده‌های آماری با کیفیتی درباره کشورهای عضو اتحادیه داره. از اقتصاد و جمعیت گرفته تا سلامت و تجارت، هر چی بخوای اینجا پیدا می‌کنی.


1️⃣ وبسایت The HDX

✏️ این پلتفرم باز توسط دفتر هماهنگی امور انسان‌ دوستانه سازمان ملل مدیریت میشه و داده‌های مربوط به بحران‌ها و شرایط اضطراری انسانی رو از سراسر جهان فراهم می‌کنه.


1️⃣ وبسایت The CDC

✏️ مرکز کنترل و پیشگیری از بیماری‌ها، داده‌های مرتبط با سلامت رو داره. اگه به موضوعات سلامت عمومی علاقه داری، اینجا پر از داده‌های کاربردیه.


1️⃣ وبسایت The Bureau of Labor Stat

✏️ سایت BLS داده‌های زیادی درباره شرایط اقتصادی آمریکا، بازار کار، تغییرات قیمتی و کیفیت زندگی داره. اگه به این موضوعات علاقه داری، اینجا پر از داده‌های کاربردیه.


1️⃣ وبسایت The NASA

✏️ ناسا بیشتر از 10000 دیتاست در زمینه هوافضا، علوم زمین، داده‌های خام و نرم‌افزار داره. اگه به این موضوعات علاقه داری، اینجا برات یه دنیا داده هست.



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


🔸 هوش مصنوعی رو به کتابخانه Pandas اضافه کنین و با داده‌هاتون حرف بزنین!

👨🏻‍💻 می‌دونستین با PandasAI نه تنها می‌تونین از داده‌هاتون به صورت مکالمه سؤال بپرسین، بلکه می‌تونین داده‌هاتون رو پاک‌سازی کنین، تحلیل‌های پیچیده انجام بدین، نمودار رسم کنین و گزارش تهیه کنین. همش با زبان طبیعی!


⏪ این کتابخونه برای کسایی که زیاد برنامه‌نویسی بلد نیستن عالیه! چون کار با داده‌ها رو به شدت ساده می‌کنه. از طرفی، برای تحلیلگرها و داده‌کاوهای حرفه‌ای هم یه ابزار عالیه که زمان و انرژی زیادی رو صرفه‌جویی می‌کنه.

✅ می‌تونین از PandasAI توی Jupyter notebook یا اپلیکیشن‌های Streamlit استفاده کنین و یا به عنوان API با FastAPI یا Flask به کار ببرین. این ابزار کار تحلیل داده‌ها رو سریع‌تر و راحت‌تر می‌کنه.👇


🏳️‍🌈 PandasAI
🧾 PandasAI Doc
🐱 GitHub-Repos


🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


@DataScience_ir - Linear Algebra.pdf
5.4Мб
✏️ جزوه جبر خطی کاربردی
به زبان فارسی و در 374 صفحه!

👨🏻‍💻 دکتر سعید عبادالهی استادیار دانشکده مهندسی برق دانشگاه علم و صنعت، جزوه‌ی جبر خطی کاربردی رو به زبان فارسی و رایگان در 374 صفحه منتشر کرده است! 👌🏼

✔️ جبر خطی یکی از اون موضوعاتی‌ایه که شاید اولش یه ماتریس و معادله ساده به نظر بیاد، ولی توی دنیای علم داده خیلی کاربرد داره! اصلاً پایه و اساس خیلی از الگوریتم‌های یادگیری ماشین و هوش مصنوعی همین جبر خطیه.

📄 هرچی هم جلوتر بری، می‌بینی جبر خطی تو هر مرحله از تحلیل داده حضور داره. انگار یه پایه ریاضیاتی محکم زیر این همه تکنولوژی‌ مدرنه که شاید اول به نظر نیاد، ولی بدون اون هیچ کاری پیش نمی‌ره!


🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


@DataScience_ir - Python for Data Science (1).pdf
2.8Мб
@DataScience_ir - Python for Data Science (2).pdf
5.9Мб
📚 جزوه "پایتون برای علم داده"
📆 بر اساس تجربیات چندین ساله‌ام

👨🏻‍💻 تصمیم گرفتم تجربیات کاری و آموزشیم، در یادگیری و کار با پایتون برای علوم داده رو در قالب کتابی بنویسم و همه چیز رو از مقدماتی‌ترین مباحث پایتون آموزش بدم و کم‌کم وارد دنیای پیچیده و جذاب علوم داده‌ها بشم.

✅ مهم‌ترین کاری که در این کتاب انجام دادم، استفاده از مثال‌های کاربردی و
پروژه‌های عملی توی هر فصله.
اینطوری نه تنها مباحث رو به صورت تئوری یاد می‌گیرین، بلکه می‌تونین اون‌ها رو توی پروژه‌های واقعی به کار ببرین و نتیجه کارتون رو ببینین.👌


🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


Видео недоступно для предпросмотра
Смотреть в Telegram
📊 دوره فارسی «مبانی علوم داده»


📺 قسمت ششم: "ادامه مباحث آماری علوم داده"

🕓 مدت زمان: 01:25:00

📚 جزوه بخش اول: PDF

👨‍🦱 مدرس: دکتر سعیدرضا خردپیشه

🖥 دانشگاه شهید بهشتی


🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


راهنمای جامع انجام پروژه‌های علوم داده
چطور یک پروژه علوم داده رو انجام بدیم؟


👨🏻‍💻 اگه دنبال یادگیری و کار روی پروژه‌های علوم داده و یادگیری ماشین هستین، این مجموعه راهنمایی که نوشتم می‌تونه خیلی بهتون کمک کنه. من توی این راهنما از قدم اول که چطوری یه پروژه یادگیری ماشین رو شروع کنین، تا مراحل پیشرفته‌تر مثل مدل‌سازی و استقرار مدل‌ها توضیح دادم. هر بخش رو با زبان ساده و قابل فهم نوشتم تا هر کسی با هر سطحی از دانش بتونه ازش استفاده کنه.

1️⃣ چرخه عمر پروژه یادگیری ماشین: این بخش بهتون میگه که یک پروژه یادگیری ماشین از کجا شروع میشه و چطوری تا آخر پیش میره. یه جورایی مثل یه نقشه راهه که قدم به قدم راهنمایی‌تون می‌کنه.

📎 جریان کاری کامل یادگیری ماشین (بخش اول)
📎 جریان کاری کامل یادگیری ماشین (بخش دوم)


2️⃣ تعیین مبنای عملکرد و معیارهای موفقیت: اینجا یاد می‌گیرین چطوری می‌تونین بفهمین که پروژه‌تون داره خوب پیش میره یا نه و چه معیارهایی رو باید در نظر بگیرین.

📎 تعیین مبنای عملکرد پروژه یادگیری ماشین‌


3️⃣ پیش‌پردازش داده‌ها و مهندسی ویژگی‌ها: تو این بخش، نحوه آماده‌سازی داده‌ها و استخراج ویژگی‌های مهم رو توضیح میدم که خیلی مهمه تا داده‌های خوبی برای مدل‌سازی داشته باشین.

📎 تقسیم موثر داده‌ها برای پروژه علوم داده‌مون
📎 شش دلیل که چرا مدل شما نتایج بد می‌دهد؟


4️⃣ مدل‌سازی: اینجا می‌رسیم به انتخاب و استفاده از مدل‌های یادگیری ماشین. از مدل‌های ساده تا پیچیده‌تر رو معرفی می‌کنم و توضیح میدم چطوری ازشون استفاده کنین.

📎 راهنمای مختصر برای انتخاب مدل یادگیری ماشین
📎 راهنمای عملی برای ماشین بردار پشتیبانی در پایتون
📎 راهنمای عملی برای الگوریتم‌های بوستینگ در ML
📎 وظایف و کاربردهای یادگیری ماشین بدون نظارت
📎 راهنمای عملی برای کاهش ابعاد در پایتون
📎 یافتن تعداد بهینه خوشه‌ها به‌طور مؤثر
📎 ساخت مدل‌های پیچیده با API عملکردی Keras
📎 تنظیم سریع پارامترهای NN برای بهترین نتایج
📎 ساخت یک شبکه عصبی بازگشتی از ابتدا در پایتون


5️⃣ ارزیابی مدل: بعد از ساختن مدل، باید ببینین چقدر خوب کار می‌کنه. تو این بخش روش‌های ارزیابی مدل رو توضیح دادم.

📎 چرا نباید به‌طور کامل به دقت تست اعتماد کنیم؟


6️⃣ تفسیر پذیری یادگیری ماشین: اینجا یاد می‌گیرین که چطوری مدل‌هاتون رو تفسیر کنین و بفهمین چرا مدل‌تون یک تصمیم خاص رو گرفته.

📎 مدل‌های یادگیری ماشین دیگر جعبه سیاه نیستن


7️⃣ استقرار مدل و MLOps: در نهایت، بعد از اینکه مدل‌تون آماده شد، باید اون رو به کار بگیرین. این بخش نحوه استقرار مدل‌ها و چالش‌های مربوط به اون رو توضیح میده.

📎 راهنمای استقرار مدل Yolo3 بر روی Fast API
📎 استقرار و کاربرد الگوهای رایج یادگیری ماشین
📎 چالش‌های کلیدی استقرار مدل یادگیری ماشین
📎 چگونه داده‌های خود را تمیز و معتمد نگه داریم؟
📎 معرفی جامع ردیابی آزمایش‌های یادگیری ماشین


🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir


📊 نقشه راه یادگیری «مصورسازی داده‌ها»

👩🏻‍💻 خیلی‌ها ازم می‌پرسن برای یادگیری «مصورسازی داده‌ها» از کجا باید شروع کنیم؟

✏️ واقعیت اینه که مصورسازی داده‌ها، یه زبانی خاص خودش داره که باید یادش بگیریم. اول باید با مفاهیم پایه شروع کنیم و بعد کم‌کم بریم سراغ مباحث پیچیده‌تر.

✅ من توی این مسیر از چندتا منبع خیلی خوب استفاده کردم که هنوزم ازشون یاد می‌گیرم. با هر پروژه، مشاوره یا دوره‌ای که می‌گذرونم، تجربیاتم بیشتر می‌شه. اینجا یه خلاصه از منابع مفیدی که به من کمک کردن رو براتون گذاشتم:👇


1️⃣ بخش اول: مقالات و کتاب‌ها:

📑 مقاله‌ای کامل از Lisa Charlotte Muth

🔗 لینک مقاله: started data visualization

➖➖➖➖➖➖➖➖➖

2️⃣ کتاب‌ها:

📚 کتاب: Storytelling with Data

📚 کتاب: Practical Charts

➖➖➖➖➖➖➖➖➖

3️⃣ جوامع یادگیری:

👤 لینک عضویت: Storytelling with Data

☑️ لینک عضویت: DataVis Community

➖➖➖➖➖➖➖➖➖

4️⃣ پادکست‌ها:

🌟 لینک: SWD Podcast
🌟 لینک: Data Viz Today
🌟 لینک: PolicyViz

➖➖➖➖➖➖➖➖➖

5️⃣ منابع کلیدی:

📚 راهنمای مصورسازی داده‌ها: این راهنما شامل منابع فوق‌العاده‌ای برای یادگیری و توسعه مهارت‌های مصورسازی داده است.

➖➖➖➖➖➖➖➖➖

6️⃣ دوره‌های آموزشی:

📣 مصورسازی مؤثر داده‌ها / یادگیری تبدیل داده‌ها به هنر.

📣 طراحی اطلاعات / داستان‌سرایی با داده‌ها در Illustrator.

📣 مصورسازی داده‌ها / این دوره ابزارها و تکنیک‌های خلاقانه‌ای رو برای مصورسازی ارائه می‌ده.

➖➖➖➖➖➖➖➖➖

7️⃣ ابزارهای بصری‌سازی داده‌ها:

⬅️ لینک: Scimago Graphica
⬅️ لینک: Datawrapper
⬅️ لینک: Flourish
⬅️ لینک: Tableau Public
⬅️ لینک: RStudio & Python



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


Видео недоступно для предпросмотра
Смотреть в Telegram
📊 دوره فارسی «مبانی علوم داده»


📺 قسمت پنجم: "مباحث آماری علوم داده"

🕓 مدت زمان: 01:25:19

📚 جزوه بخش اول: PDF

👨‍🦱 مدرس: دکتر سعیدرضا خردپیشه

🖥 دانشگاه شهید بهشتی


🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


Видео недоступно для предпросмотра
Смотреть в Telegram
🚀 افزایش سرعت پانداس تا 125 برابر بیش‌تر!

با FireDucks / فقط با تغییر یک خط کد

👨🏻‍💻 اگه بهت بگم فقط با تغییر یه خط کد، می‌تونی سرعت Pandas رو تا 125 برابر افزایش بدی، باور می‌کنی؟! این دقیقاً کاریه که FireDucks انجام می‌ده. FireDucks یه جایگزین بهینه‌شده برای Pandas هست که همون API رو داره، ولی عملکردش فوق‌العاده سریع‌تره.


✏️ مشکلاتی که Pandas داره:

1⃣ فقط از یک هسته CPU استفاده می‌کنه.

🔢 دیتافریم‌هایی که تولید می‌کنه، حافظه زیادی مصرف می‌کنن.

🔢 اجرای فوری (Eager Execution) اجازه بهینه‌سازی کلی عملیات رو نمی‌ده.


✔️ سه روش استفاده از FireDucks :


1️⃣ از داخل Jupyter Notebook:

%load_ext fireducks.pandas
import pandas as pd


2️⃣ مستقیم FireDucks رو به جای Pandas ایمپورت کن:

import fireducks.pandas as pd


3️⃣ اگه اسکریپت داری، اینجوری اجراش کن:

python3 -m fireducks.pandas code.py


عملکردش چطوره؟ طبق بنچمارک‌ها:

🔎 ابزار Modin: یک برابر سریع‌تر از Pandas،
🔎 ابزار Polars: تا 57 برابر سریع‌تر از Pandas،
▶️ ابزار FireDucks: تا 125 برابر سریع‌تر!👇


🏳️‍🌈 FireDucks
📄 Documentation
✏️ Article
💰 Google Colab
🐱 GitHub-Repos


🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


@DataScience_ir - Foundations of Data Science.pdf
21.3Мб
🖥 جزوه «مبانی علم داده»
🖥 دانشگاه شریف

👨🏻‍💻 یه منبع کامل و با کیفیت برای شروع یادگیری علم داده، که هم برای افراد تازه‌کار و هم برای اونایی که کمی تو این حوزه تجربه دارن مفیده.

✏️ از پایه‌ترین مفاهیم شروع می‌کنه، مثل کار با داده‌های خام و تمیز کردن اونا، و به موضوعات پیشرفته‌تر مثل مدل‌های یادگیری ماشین، تحلیل داده‌های بزرگ و مصورسازی داده‌ها می‌پردازه.



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


Видео недоступно для предпросмотра
Смотреть в Telegram
📊 دوره فارسی «مبانی علوم داده»


📺 قسمت چهارم: "مباحث مقدماتی علوم داده (1)"

🕓 مدت زمان: 01:24:02

📚 جزوه بخش اول: PDF

👨‍🦱 مدرس: دکتر سعیدرضا خردپیشه

🖥 دانشگاه شهید بهشتی


🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


👨🏻‍💻 یکی از محبوب‌ترین مخازن گیت‌هاب برای «یادگیری و استفاده از الگوریتم‌ها در پایتون»، ریپوی The Algorithms - Python با 196K ستاره است.

✏️ یه عالمه کد مرتب و دسته‌بندی‌شده داره که می‌تونین الگوریتم‌های مختلف رو باهاش پیدا کنین، بخونین، و اجراشون کنین. هر چیزی که فکرشو بکنین اینجاست؛ از الگوریتم‌های ساده مثل مرتب‌سازی گرفته تا الگوریتم‌های پیشرفته برای یادگیری ماشین، هوش مصنوعی، شبکه‌های عصبی و...

چرا باید ازش استفاده کنیم؟

🔢 برای یادگیری: اگه دنبال اینی که الگوریتم‌ها رو در عمل یاد بگیری، اینجا عالیه.

🔢 برای تمرین: می‌تونی کدها رو برداری، اجرا کنی، و تغییر بدی تا بهتر درک کنی.

🔢 برای پروژه‌ها: حتی می‌تونی از کدهای اینجا تو پروژه‌های واقعی یا دانشگاهی استفاده کنی.

🔢 برای مصاحبه‌ها: اگه واسه مصاحبه‌های علوم داده آماده می‌شی، اینجا پر از الگوریتم‌های کاربردیه.


🏳️‍🌈 The Algorithms - Python
🐱 GitHub-Repos


🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


Видео недоступно для предпросмотра
Смотреть в Telegram
📊 دوره فارسی «مبانی علوم داده»


📺 قسمت سوم: "روش‌های درک بهتر داده‌ها"

🕓 مدت زمان: 01:24:57

👨‍🦱 مدرس: دکتر سعیدرضا خردپیشه

🖥 دانشگاه شهید بهشتی


🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


👨🏻‍💻 4 تا تجربه درست و واقعی اونم تو حوزه‌ای مثل علوم داده آدمو کلی می‌ندازه جلو. ببینید آقای ژارت اندره مربی علوم داده، برای کسایی که تازه می‌خوان وارد حوزه علوم داده بشن چه تجربیات ارزشمندی داره:


✏️ اگه تازه می‌خوای وارد حوزه‌ی علوم داده بشی، یه راه ساده‌تر برات دارم:


❗️ اینکارا رو نکن:

1⃣ سعی نکن از همون اول همه‌ی ابزارها و کتابخونه‌ها رو یاد بگیری! (مثل Python, R, TensorFlow, Hadoop و...).

🔢 ماه‌ها وقتت رو فقط روی مفاهیم تئوری بذاری، بدون اینکه روی تمرین‌ها و پروژه‌های عملی کار کنی.

🔢 رزومه‌ت رو پر از کلمات کلیدی کنی، به‌ جای اینکه روی پروژه‌های تأثیرگذار تمرکز کنی.

🔢 فکر کنی بدون مدرک دانشگاهی (ارشد و دکتری) هیچ شانسی برای ورود به این حوزه نداری.


✔️ بجاش بیا اینکارا رو بکن:

🔢 اول با Python یا R شروع کن و فقط تمرکزت رو، روی یکی‌شون بذار تا توش حرفه‌ای بشی.

🔢 یاد بگیر چطوری با داده‌های ساختاریافته کار کنی (مثل Excel یا SQL)، چون اینا پایه‌ی کارِتن.

🔢 با یه مدل ساده‌ی یادگیری ماشین (مثل رگرسیون خطی) شروع کن تا مفاهیم پایه رو یاد بگیری.

🔢 مسائل واقعی رو با دیتاست‌های اُپن سورس حل کن و نتایجت رو توی یه پورتفولیو به اشتراک بذار.

🔢 یه پروژه بساز که داستانی رو روایت کنه. مثل اینکه: چرا این پروژه مهمه، چه دستاوردهایی داشتی، و چه اقداماتی رو پیشنهاد می‌کنی.


🔔 پس تمرکزت توی شش ماه اول رو همینا باشه! یادت باشه: «کلید موفقیت توی حوزه علوم داده این نیست که همه چیز رو بدونی، بلکه اینه که بتونی با دانشی که بدست آوردی، پروژه‌های واقعی و مسائل معنادار رو حل کنی!».



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


Видео недоступно для предпросмотра
Смотреть в Telegram
📊 دوره فارسی «مبانی علوم داده»


📺 قسمت دوم: "چرخه حیات پروژه علم داده"

🕓 مدت زمان: 01:24:49

👨‍🦱 مدرس: دکتر سعیدرضا خردپیشه

🖥 دانشگاه شهید بهشتی


🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


@DataScience_ir - Data Mining.pdf
19.2Мб
📚 جزوه فارسی «داده کاوی»

👨🏻‍💻 این جزوه دانشگاهی درس داده کاوی منه و سعی شده در 220 صفحه اکثر مباحث داده کاوی رو پوشش بده. هر قسمت رو با مثال‌های ساده و کاربردی توضیح داده و مناسب کسایی که تازه می‌خوان وارد حوزه علوم داده بشن.


🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa

Показано 20 последних публикаций.