Data Science | علم داده


Channel's geo and language: Iran, Persian
Category: Technologies


📊 دانشمند داده شوید!
👔 جهت درج تبلیغات، به آیدی زیر پیام دهید:👇🏼‌
🆔 @DataScienceir_Adv

Related channels  |  Similar channels

Channel's geo and language
Iran, Persian
Statistics
Posts filter


Forward from: P3rS!??AN ArMoR
گیمرها دیگه نگران قطعی و کندی سرعت توی بازیشون نباشن! 😍

مجموعه شلتر ‌به صورت کاملا‌ «رایگان» دی‌ان‌اس در اختیارتون قرار میده تا راحت وصل بشین 🔥🫶🏻

جهت مشاهده لیست دی‌ان‌اس ها وارد چنل‌ شوید 💎

@SHELTERTM @SHELTERTM

@SHELTERTM @SHELTERTM

✔️ گذر از تحریم کاملا رایگان و با کیفیت


Forward from: تهران دیتا-دانشگاه تهران
🆓 وبینار رایگان استقرار تحلیل داده‌های کسب‌وکار در سازمان

آیا می‌خواهید بدانید چگونه داده‌ها را به تصمیمات آگاهانه و اثربخش تبدیل کنید و تیم تحلیل داده را در سازمان خود به بهترین شکل مدیریت کنید⁉️ 

🔍 در این وبینار، یاد خواهید گرفت که چگونه با بهره‌گیری از داده‌ها، عدم قطعیت را کاهش دهید، تصمیم‌گیری‌ها را بهینه کنید و یک تیم تحلیل داده قدرتمند و کارآمد بسازید!

📆 تاریخ برگزاری: یکشنبه 5 ام اسفند ماه
⏰ زمان برگزاری: 18 الی 19

👥 مخاطبان:
✅ مدیران و مشاوران کسب‌وکار
✅ تحلیل‌گران کسب‌وکار
✅ تحلیل‌گران، مهندسان و دانشمندان داده
✅ دانشجویان و علاقه‌مندان به حوزه تحلیل داده
✅ مدیران استراتژی و برنامه‌ریزی

↘️لینک ثبت‌نام رایگان↙️
👉 https://eseminar.tv/wb153477

ظرفیت محدود می‌باشد، همین حالا ثبت نام کنید‼️

❓ پاسخگوی سوالات شما عزیزان هستیم.
📞 تماس با ما : 09377516835

✈️ Telegram | 📞 whatsapp | 📱 linkedin | 📷 Instagram | 🌐 website|  💬 admin


🔎 داده‌های متنی رو به راحتی از تصاویر و اسناد استخراج کن!


👨🏻‍💻 اگه تاحالا داده‌های متنی رو از اسناد و تصاویر استخراج کرده باشین، احتمالاً با دردسر این کار خوب آشنا هستین. معمولاً مجبور میشی چندین کتابخونه رو کنار هم بچینی (مثلاً Tesseract برای OCR یا OpenCV برای پردازش تصویر) و چند ابزار دیگه رو برای مرتب‌سازی خروجی‌ها آماده کنی تا بالاخره به یه نتیجه‌ای برسی.


✏️ اما مشکل اینجاست که این کار هم وقت‌گیره، هم ممکنه خطاهای زیادی توی خروجی داشته باشی، تازه هر تغییری توی داده‌ها هم می‌تونه کل (Pipeline) رو به‌ هم بزنه!

✔️ از وقتی با Sparrow آشنا شدم، خیلی کارم راحت شده! یه API یکپارچه که همه‌یِ این کارها رو خودش انجام می‌ده، بدون اینکه نیاز باشه خودت چندین ابزار مختلف رو مدیریت کنی. یعنی چی؟


🔢 از هر مدل و بک‌اندی که بخوای می‌تونی استفاده کنی؛ (مثلاً OpenAI, Hugging Face، یا ابزارهای OCR اختصاصی).

🔢 خروجی کارت همیشه یکدست و دقیق می‌مونه؛ فارغ از اینکه از کدوم روش استخراج استفاده کنی!

🔢 توسعه و پیاده‌سازی رو فوق‌العاده ساده می‌کنه؛ چون دیگه لازم نیست برای هر سند، الگوریتم جداگانه بنویسی.

🔢 با انواع اسناد و فرمت‌ها کار می‌کنه؛ از PDF گرفته تا رسیدهای خرید، فاکتورها و حتی تصاویر و جزوات دست‌نویس!


🖥خلاصه، دیگه لازم نیست برای استخراج اطلاعات از اسناد کد نویسی کنی یا نگران ناپایداری پردازش‌هات باشی. فقط به Sparrow بگو چی می‌خوای، اون خودش کامل برات انجام می‌ده.👇


🕊 Sparrow
📄 Document
🐱 GitHub-Repos



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


📢 آغاز مسیر حرفه‌ای شما به عنوان یک توسعه‌دهنده بک‌اند با جهاد دانشگاهی صنعتی شریف! 🚀

🔍 اگر به دنبال یادگیری مهارت‌هایی هستید که مستقیماً شما را برای ورود به بازار کار آماده کند، این دوره دقیقاً همان چیزی است که نیاز دارید.

🔴 دوره آموزشی برنامه نویسی Back End با Django

✅ آموزش کامل و پروژه‌محور بک‌اند
✅ دریافت گواهینامه معتبر و قابل ترجمه
✅ پشتیبانی و راهنمایی در طول دوره
✅ تدریس توسط اساتید حرفه‌ای با تجربه بازار کار

📎 برای کسب اطلاعات بیشتر و ثبت‌نام کلیک کنید.
👉https://B2n.ir/t88460

💡 فرصت را از دست ندهید و همین حالا اولین قدم را به سوی شغل رویایی خود بردارید! 🌟

🎯 سرمایه‌گذاری در مهارت‌های خود، بهترین سرمایه‌گذاری است!

➖➖➖➖➖➖➖➖➖➖➖➖
✓ جهاد دانشگاهی صنعتی شریف؛ یک پله بالاتر از تخصص


Video is unavailable for watching
Show in Telegram
با هر ریپوی گیت‌هاب رایگان چت کن!

👨🏻‍💻 به‌ عنوان یه تحلیلگر داده، چه بخوایم کد یه مقاله رو بررسی کنیم، چه یه پروژه مرتبط با محصولمون رو آنالیز کنیم همیشه سر و کارمون با ریپوی‌های گیت‌هاب زیاده.

✏️ تو اینجور مواقع، یه دستیار هوشمند که بتونه اطلاعات لازم رو سریع بهمون بده، خیلی می‌تونه کمک کننده باشه!

روش اول: استفاده از GithubChat! یه پروژه اِپن سورس که با AdalFlow ساخته شده.👇


💬 GithubChat
🐱 GitHub-Repos


☑️ روش دوم: فقط کافیه توی لینک (URL) گیت‌هاب، "hub" رو با "ingest" جایگزین کنی، بعدش یه نسخه متنی از کل کدبیس رو می‌گیری! اینطوری خیلی راحت هر ریپوی گیت‌هاب رو به متن تبدیل می‌کنی و ازش توی مدل‌های زبان بزرگ (LLMs) استفاده می‌کنی.

📹 نحوه پیاده سازی هر دو روش هم داخل ویدیوی بالا هست.



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


📢بوت‌کمپ تحلیل داده رهنماکالج:

این بوت‌کمپ ۸ هفته‌ای برای علاقه‌مندان کار با داده و حل مسئله، به صورت ترکیبی از کارگاه‌های حضوری (پنجشنبه ها) و آنلاین طراحی شده است.

پیش نیاز دارد؟
برای حضور موفق در این بوت‌کمپ آموزشی، لازم است آشنایی قبلی با یک زبان برنامه‌نویسی داشته باشید.


چه چیزهایی می‌آموزیم؟
🔸 داستان‌سرایی با داده
🔸 تصمیم‌سازی با داده
🔸 آمار
🔸 زبان‌های برنامه‌نویسی پایتون و SQL
🔸 جمع‌آوری داده
🔸 آماده‌سازی داده
🔸 مثال‌های واقعی کسب‌وکار



📍منتورینگ و پروژه‌محور بودن:
در کل این مسیر منتورها همراه شما هستند تا هر کجا سوال یا نیاز به راهنمایی داشتید، به شما کمک کنند. با کار تیمی و پروژه عملی آموخته‌ها را به مهارت تبدیل می‌کنیم.

📌فرایند ثبت‌نام:
برای ثبت‌نام لازم است چالش ورودی را از سایت رهنماکالج دانلود کنید و پس از انجام آن، همراه رزومه خود، در سایت ارسال کنید.


📎اطلاعات کامل بوت‌کمپ تحلیل داده


🆔@Rahnemacollege


Forward from: FaraDars_Course
🔥 با ۷۹ هزار تومن هر چی میخوای یاد بگیر! 🔥
 
🎉 جشنواره شگفتی فرادرس 🎉
 
♨️ ۵۵۰ آموزش منتخب، فقط ۷۹ هزار تومن ♨️
 
🔻 برای مشاهده آموزش‌ها و شروع یادگیری، همین حالا وارد لینک زیر شوید:
 
🔗 فهرست ۵۵۰ آموزش — [کلیک کنید]
 
➕ کد تخفیف ۵۰ درصدی برای سایر آموزش‌ها: TAK58
 
▫️ مشاهده سایر آموزش‌ها [+]

🔄 FaraDars - فرادرس


@DataScience_ir - Starting a Career in Data Science.pdf
962.0Kb
🥇 ترجمه فارسی و رایگان
کتاب «شروع حرفه‌ای در علم داده»


👨🏻‍💻 از حدود پنج سال پیش کار با اکسل و داشبورسازی حرفه‌ای رو شروع کردم و اتفاقات به گونه‌ای پیش رفت که عجیب به دنیای علم داده علاقه مند شدم و تصمیم گرفتم برای خودم و تمام کسانی که به تازگی وارد حوزه علم داده شدن کتاب «شروع حرفه‌ای مسیر علم داده» رو از پلتفرم 365datascience به فارسی ترجمه کنم و و در اختیار علاقه مندان این حوزه قرار بدم:👇


📗 نسخه فارسی: PDF
📙 نسخه انگلیسی: PDF



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


🔰 چطور در سال 2025 دانشمند داده بشیم؟


👨🏻‍💻 اگه می‌خواین تو دیتا ساینس حرفه‌ای بشین، این مسیر رو دنبال کنین! من یه نقشه راه کامل با بهترین منابع رایگان آماده کردم که می‌تونین مهارت‌های ضروری این حوزه رو یاد بگیریم.


🔢 گام اول: ریاضیات و آمارت رو قوی کن!

✏️ پایه و اساس یادگیری علم داده، ریاضیات، جبر خطی و آمار و احتمالاته. مباحثی که باید روشون مسلط بشین:

جبر خطی: ماتریس‌ها، بردارها، مقادیر ویژه.

🔗 دوره: MIT 18.06 Linear Algebra


حساب دیفرانسیل و انتگرال: مشتق، انتگرال، بهینه‌سازی.

🔗 دوره: MIT Single Variable Calculus


آمار و احتمال: قضیه بیز، آزمون فرضیه.

🔗 دوره: Statistics 110

➖ ➖ ➖ ➖ ➖

🔢 گام دوم: برنامه‌نویسی یاد بگیر

✏️ زبان پایتون رو یاد بگیرین و باهاش حسابی کدنویسی کنین. مهم‌ترین مباحثی که باید روش مسلط بشین:

پایتون: کتابخونه‌های Pandas, NumPy, Matplotlib

🔗 دوره: FreeCodeCamp Python Course

زبان SQL: دستورات Join، توابع Window، بهینه‌سازی کوئری‌ها.

🔗 دوره: Stanford SQL Course

ساختمان داده و الگوریتم‌ها: آرایه‌ها، لیست‌های پیوندی، درخت‌ها.

🔗 دوره: MIT Introduction to Algorithms

➖ ➖ ➖ ➖ ➖

🔢 گام سوم: یادگیری تمیز کردن و مصورسازی داده‌ها

✏️ یاد بگیرین چطور داده‌ها رو پردازش و تمیز کنین و بعدش یه داستان جذاب ازشون بسازین!

پاکسازی داده: کار با مقادیر گمشده و تشخیص داده‌های پرت.

🔗 دوره: Data Cleaning

مصورسازی داده: Matplotlib, Seaborn, Tableau

🔗 دوره: Data Visualization Tutorial

➖ ➖ ➖ ➖ ➖

🔢 گام چهارم: یادگیری یادگیری ماشین

✏️ وقتشه وارد دنیای جذاب یادگیری ماشین بشین! باید این مباحث رو بلد باشین:

یادگیری تحت نظارت: رگرسیون، دسته‌بندی.

یادگیری بدون نظارت: خوشه‌بندی، PCA، کشف ناهنجاری.

یادگیری عمیق: شبکه‌های عصبی، CNN, RNN


🔗 دوره: CS229: Machine Learning

➖ ➖ ➖ ➖ ➖

🔢 گام پنجم: کار با داده‌های حجیم و تکنولوژی‌های ابری

✏️ اگه قراره تو دنیای واقعی کار کنین، باید بلد باشین با داده‌های بزرگ (Big Data) و پردازش ابری کار کنین.

ابزارهای داده‌های حجیم: Hadoop, Spark, Dask

پلتفرم‌های ابری: AWS, GCP, Azure

🔗 دوره: Data Engineering

➖ ➖ ➖ ➖ ➖

🔢 گام ششم: پروژه‌های واقعی انجام بده!

✏️ تئوری کافیه، وقتشه دست به کد بشین! پروژه‌های واقعی انجام بدین و یه پورتفولیوی قوی بسازین.

مسابقات Kaggle: حل چالش‌های واقعی.

پروژه‌های End-to-End: جمع‌آوری داده، مدل‌سازی، پیاده‌سازی.

گیت‌هاب: پروژه‌هات رو توی GitHub منتشر کن.

🔗 پلتفرم: Kaggle 🔗 پلتفرم: ods.ai

➖ ➖ ➖ ➖ ➖

🔢 گام هفتم: یادگیری MLOps و استقرار مدل‌ها

✏️ یادگیری ماشین فقط ساخت مدل نیست! باید یاد بگیرین چطور یه مدل رو استقرار بدین و مانیتور کنین.

آموزش MLOps: ورژن‌بندی مدل، نظارت، بازآموزی مدل.

استقرار مدل‌ها: Flask, FastAPI, Docker

🔗 دوره: Stanford MLOps Course

➖ ➖ ➖ ➖ ➖

🔢 گام هشتم: به‌روز بمون و شبکه‌سازی کن

✏️ علم داده هر روز در حال تغییره، پس لازمه که هر روز خودتون رو آپدیت کنین و با آدمای باتجربه و متخصص این حوزه مرتب در ارتباط باشین.

مقالات علمی بخونین: arXiv, Google Scholar

با کامیونیتی داده در ارتباط باشین:

🔗 سایت: Papers with code
🔗 سایت: AI Research at Google



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


Forward from: تهران دیتا-دانشگاه تهران
💥 جشن یادگیری با تخفیف ۵ تا ۲۵٪ به مناسبت اعیاد شعبانیه‼️

🔄 سه دوره آموزشی، یک فرصت طلایی🔄

دوره اول: دوره جامع علم داده و هوش مصنوعی
09377516759
دوره دوم: دوره جامع هوش تجاری
09377516682
دوره سوم: دوره تحلیل داده‌های کسب‌وکار و آمادگی آزمون IIBA®-CBDA
09377516835

فرصت محدود - همین امروز ثبت‌نام کنید!

🕘 برای اطلاعات بیشتر و ثبت‌نام، با کارشناس هر یک از دوره ها ارتباط برقرار نمایید یا به [لینک سایت] مراجعه فرمایید.

📨 Telegram | 📱 linkedin | 🌐 Instagram | 🌐 website


@DataScience_ir - Data Cleaning.pdf
1.1Mb
✏️ جزوه جامع پاکسازی داده‌ها با Python, R, Excel, Power BI, SQL


👨🏻‍💻همیشه اولین توصیه‌ای که برای انجام یک پروژه علوم داده می‌کنم اینه که، قبل از اینکه مدل بسازین، داده‌هاتون رو تمیز کنین!

❗️ 80% از زمان یک دانشمند داده صرف پاکسازی و اصلاح داده‌های بهم‌ریخته می‌شه.


▶️ چرا پاک‌سازی داده‌ها انقدر ضروریه؟

⏯️ حذف داده‌های تکراری: دیگه خبری از رکوردهای اضافی نیست!

2️⃣ اصلاح فرمت‌ها: داده استاندارد = تحلیل بی‌دردسر!

3️⃣ مدیریت داده‌های ناقص: بدون گپ، بدون خطا!

4️⃣ شناسایی داده‌های پرت: ناهنجاری‌ها رو کنترل کن!

5️⃣ افزایش دقت مدل‌ها: داده تمیز = پیش‌بینی بهتر!


🔀 مراحل ضروری پاک‌سازی داده:

✔️ حذف داده‌های تکراری و استانداردسازی
✔️ پر کردن یا حذف داده‌های ناقص
✔️ شناسایی و اصلاح داده‌های پرت
✔️ نرمال‌سازی و تبدیل داده‌ها
✔️ خودکارسازی پاک‌سازی با Python, SQL


💡 نکته طلایی: پاک‌سازی داده‌ها فقط یه کار روتین نیست، پایه و اساس تحلیل‌هایِ قابل اعتماد شماست!



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


Video is unavailable for watching
Show in Telegram
🔴 اولین AI Copilot ویژه دیتاساینستیست‌ها!


👨🏻‍💻 معرفی می‌کنم؛ Data Copilot یه دستیار خفن از Mito. دستیار هوشمندی که شیوه کار با Jupyter Notebook رو برای همیشه براتون تغییر می‌ده و باعث میشه سریع‌تر، راحت‌تر و بهینه‌تر کار کنین.


✏️ چرا عاشقش می‌شین؟

🔢 کد رو فوری براتون می‌نویسه: فقط ازش بپرسین، خودش کد رو تولید می‌کنه.

🔢 خطاها رو تو چند ثانیه رفع می‌کنه: دیگه ساعت‌ها وقتتون روی دیباگ هدر نمی‌ره.

🔢 کدتون رو بهینه می‌کنه: پیشنهادهای هوشمند برای بهینه‌سازی می‌ده.

🔢 دیتافریم‌هاتون رو تعاملی می‌کنه و نمودارها رو خودکار می‌سازه.

🔢 تحلیل داده رو از صفر تا صد براتون انجام می‌ده: از پاکسازی داده‌ها گرفته تا ویژوال‌سازی، همه‌چی رو ساپورت می‌کنه!


✔️ و بهترین قسمتش؟ اوپن سورسه و فقط با یه دستور نصب میشه. فقط کافیه این یه خط رو اجرا کنین:👇

pip install mito-ai mitosheet

🤖 AI Copilot
📄 Mito
🐱 GitHub-Repos



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


پنج درسی که تو 5 سال اولم به عنوان یه دانشمند داده یاد گرفتم:


🔢 اول داده، بعد مدل!

✏️ قبل از اینکه توی انتخاب مدل و مدل سازی غرق بشی، اول ببین اصلاً داده‌‌های که داری درست و تمیزه یا نه. ۷۰٪ کار یه پروژه ML تمیز کردن داده‌هاست، نه مدل زدن! پس اول داده‌هاتو بررسی و تمیز کن، بعد برو سراغ مدل!

➖ ➖ ➖ ➖ ➖ ➖

🔢 انتخاب متریک درست، شاه‌کلید موفقیته!

✏️ هر مدلی که بزنی، بدون یه متریک درست، هیچ ارزشی نداره. یه مدل ممکنه روی کاغذ عالی به نظر بیاد، ولی اگه متریک درستی برای سنجیدنش نداشته باشی، نمی‌فهمی واقعاً خوبه یا نه. دقت (accuracy) همیشه بهترین گزینه نیست. گاهی F1-score یا AUC-ROC مهم‌تره. پس متریک رو هوشمندانه انتخاب کن.

➖ ➖ ➖ ➖ ➖ ➖

🔢 همیشه کارِ تو با ساده‌ترین روش شروع کن!

✏️ قبل از این که مدل‌های سنگین و پیچیده رو امتحان کنی، یه بیس‌لاین (Baseline) ساده بزن. لازم نیست از همون اول مدل‌های پیچیده‌ای مثل شبکه‌های عصبی رو بیاری وسط. خیلی وقتا یه مدل ساده مثل رگرسیون خطی یا حتی یه رول‌بیس می‌تونه کلی از کارت رو راه بندازه.

➖ ➖ ➖ ➖ ➖ ➖

🔢 تحلیل اکتشافی داده‌ها (EDA) واجبه!

✏️ بله، واجبه! چون با EDA می‌فهمی توی دیتاستت چی می‌گذره. پس قبل از مدل‌سازی، یه نگاه دقیق به داده‌هات بنداز. ببین توزیع‌شون چطوریه، مقدارهای گمشده (Missing Values) داری یا نه، داده‌های پرت (Outliers) چقدرن. این کار بهت کمک می‌کنه بفهمی چه ویژگی‌هایی مهمن و از اول مسیر رو درست بری.

➖ ➖ ➖ ➖ ➖ ➖

🔢 کدت رو طوری بنویس که چند وقت بعد خودت هم بفهمیش!

✏️ قابلیت تکرارپذیری، یعنی هر کسی بتونه کدت رو اجرا کنه و همون نتیجه رو بگیره. بارها پیش میاد که یه ماه بعد برمی‌گردی سراغ کدی که نوشتی و هیچی ازش نمی‌فهمی! همیشه مرتب کدنویسی کن و از notebooks بی‌نظم دوری کن، از از کامنت‌گذاری، نسخه‌بندی (Git)، logging و documentation استفاده کن.

✍️ اگه اینارو زودتر می‌دونستم، کلی از زمانم ذخیره می‌شد!



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


@DataScience_ir - Introduction to Statistics.pdf
231.2Kb
🖥جزوه «آمار برای علوم داده»


👨🏻‍💻 خیلیا هنوز فکر می‌کنن اولین قدم برای یادگیری علوم داده و ML، کدنویسیه. در صورتی که اول باید توی آمار و احتمال قوی بشین!

✏️ من خیلی وقت گذاشتم تا آمار رو عمیق یاد بگیرم و تو این مسیر یادداشت‌های خیلی مفصلی نوشتم تا مفاهیم اصلی رو که برای کار با داده‌ها نیاز دارم، به‌خوبی درک کنم. الان خیلی خوشحالم که می‌تونم این یادداشت‌ها رو به اشتراک بذارم.

🖥 اولش همه مباحث رو دست‌نویس نوشته بودم، ولی حالا با LaTeX دوباره بازنویسی‌شون کردم که خیلی مرتب‌تر و خواناتر بشن.


📝 می‌تونید از طریق لینک زیر به نسخه‌های دست نویس هم دسترسی داشته باشین:👇

🖥 آمار ➖ 🖥 احتمال


💰 لینک دوره‌هایی هم که برای نوشتن این جزوات ازشون استفاده کردم اینجا گذاشتم:👇

🖥 Statistics
🖥 Discrete Probability Distributions
🖥 Continuous Probability Distributions



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


2️⃣ ریپوی گیت‌هاب ROBIN آپدیت شد!


👨🏻‍💻 ابزار ROBIN یه محصول خفن برای شناسایی و حذف داده‌های پرت و افزایش دقت مدل‌ها بر اساس گراف‌های سازگاریه که قراره تحلیل داده‌ها و پروژه‌های ML شما رو حسابی مقاوم‌تر کنه! این ابزار توسط Jingnan Shi و Heng Yang تهیه شده و در آپدیت جدیدش کلی بهینه‌ش کردن.


✏️ چرا ابزار ROBIN یه شاهکاره؟

🔢 دقیق و مقاوم در برابر نویزه.

🔢 سبک و سریع و بدون دردسر پردازشیه.

🔢 نصبش هم با یه خط کد حل می‌شه.

🔢 قبلا امتحانش رو پس داده! پارسال توی مسابقات NSS Challenge ازش استفاده‌ کردیم و تیم اول مسابقات شدیم!

(فقط یه عدد ببینید: RMSE ما = ۰.۰۵۶ متر😎، نفر دوم؟ ۲.۴۱۴ متر🙂‍↔️!!!)


🔗 لینک ریپوی آپدیت‌شده: ROBIN



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


@DataScience_ir_80_Python_use_case_based_interview_questions_with.pdf
410.4Kb
🏳️‍🌈 ۸۰ سوال مصاحبه‌ای Python
📄 با جواب و کد!


👨🏻‍💻 کریش نایک محقق و دانشمند داده معروف هندی، یه مجموعه عالی از ۸۰ سوال پرکاربرد در مصاحبه‌های Python رو همراه با جواب و کد منتشر کرده! 🤩

✅ این می‌تونه یه منبع فوق‌العاده برای کسایی باشه که خودشون رو برای مصاحبه‌های برنامه‌نویسی و علوم داده آماده می‌کنن.👌🏼



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


👨🏻‍💻 انتشارات O'Reilly Media یکی از معتبرترین ناشران در حوزه برنامه‌نویسی، داده کاوی و AI، اومده 10 تا از کتاب‌های حوزه علوم داده رو به رایگان در اختیار علاقه مندان این حوزه قرار داده.

✔️ برای استفاده از نسخه آنلاین و PDF این کتاب‌ها می‌تونید از لینک‌های زیر استفاده کنین:👇


0⃣ کتاب Python Data Science Handbook

Online
PDF

1⃣ کتاب Python for Data Analysis

Online
PDF

🔢 کتاب Fundamentals of Data Vis

Online
PDF

🔢 کتاب R for Data Science

Online
PDF

🔢 کتاب Deep Learning for Coders

Online
PDF

🔢 کتاب DS at the Command Line

Online
PDF

🔢 کتاب Hands-On Data Visualization

Online
PDF

🔢 کتاب Think Stats

Online
PDF

🔢 کتاب Think Bayes

Online
PDF

🔢 کتاب Kafka, The Definitive Guide

Online
PDF



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


@DataScience_ir - ZoomNotes for Linear algebra.pdf
611.5Kb
✏️ جزوه «جبرخطی برای علم داده»


👨🏻‍💻 گیلبرت استرنگ استاد معروف درس جبرخطی دانشگاه MIT، در دوران کرونا یک منبع خلاصه و منظم از مباحث کاربردی جبرخطی آماده کرد به نام ZoomNotes.

📄 بعد از دوران کووید این جزوه 80 صفحه‌ای، به یه منبع ارزشمند برای یادگیری جبرخطی — (از فاکتورگیری‌های ماتریسی بگیر تا مقادیر ویژه، فضاهای برداری و ارتباط جبر خطی با علوم داده) — تبدیل شد!


✔️ این جزوه مکمل کلاس‌های ویدیویی استرنگ در MIT هست.



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


🚨 یک یادآوری ضروری برای دیتا ساینتیست‌ها!


👨🏻‍💻 قبل از اینکه بپرین توی دنیای یادگیری ماشین و علوم داده، اول مباحث پایه‌ رو خوب یاد بگیرین! این لیست کمکتون می‌کنه مسیر رو اصولی جلو ببرین:


1️⃣ قبل از یادگیری ماشین، آمار رو یاد بگیر!

✏️ چون الگوریتم‌ها ریشه در مفاهیم آماری دارن.

➖ ➖ ➖ ➖

2️⃣ قبل از کار با BigQuery یا Snowflake، اول SQL رو یاد بگیر!

✏️ چون پایه‌ی همه‌ی کارهای دیتابیسیه.

➖ ➖ ➖ ➖

3️⃣ قبل از TensorFlow یا PyTorch، اول پایتون رو یاد بگیر!

✏️ چون بدون پایتون هیچ کاری نمی‌تونی بکنی.

➖ ➖ ➖ ➖

4️⃣ قبل از شیرجه توی یادگیری عمیق، اول Numpy و Pandas رو یاد بگیر!

✏️ چون ابزارهای اصلی برای کار با داده هستن.

➖ ➖ ➖ ➖

5️⃣ قبل از PCA یا SVD، اول جبر خطی رو یاد بگیر!

✏️ چون این روش‌ها وابسته به مفاهیم جبرخطیه.

➖ ➖ ➖ ➖

6️⃣ قبل از استنباط بیزی، اول آمار و احتمال رو یاد بگیر!

✏️ چون بدون فهم کامل مبانی احتمال، استنباط بیزی بی‌معنیه!

➖ ➖ ➖ ➖

7️⃣ قبل از آموزش مدل، تمیز کردن داده‌ها رو یاد بگیر!

✏️ چون داده‌ی تمیز = مدل بهتر.

➖ ➖ ➖ ➖

8️⃣ قبل از مهندسی ویژگی‌ها، تحلیل اکتشافی داده (EDA) رو یاد بگیر!

✏️ چون باید بفهمی داده‌هات چه شکلی هستن.

➖ ➖ ➖ ➖

9️⃣ قبل از یادگیری تقویتی، یادگیری نظارت‌شده رو درک کن!

✏️ چون پایه‌ی خیلی از مفاهیم یادگیری ماشینه.

➖ ➖ ➖ ➖

1️⃣ قبل از شبکه‌های عصبی، مدل‌های کلاسیک یادگیری ماشین رو یاد گیر!

✏️ چون همیشه شبکه‌های عصبی بهترین انتخاب نیستن!

➖ ➖ ➖ ➖

1️⃣ قبل از دیپلوی کردن مدل‌های ML، مفاهیم پایه‌ای کلود رو یاد بگیر.

✏️ چون نیاز به زیرساخت‌های ابری داری.

➖ ➖ ➖ ➖

1️⃣ قبل از یادگیری دریاچه‌های داده (Data Lakes)، اول پایپ‌لاین‌های داده رو بشناس!

✏️ چون مسیر حرکت داده رو باید بفهمی.

➖ ➖ ➖ ➖

1️⃣ قبل از دیپلوی مدل، یاد بگیر چطوری مدل رو ارزیابی کنی!

✏️ چون یه مدل خوب = مدلی که درست تست شده باشه.

➖ ➖ ➖ ➖

1️⃣ قبل از ردیابی آزمایشات، نسخه‌سازی کد (Version Control) رو یاد بگیر!

✏️ چون بدون VC، پروژه‌هات به‌هم می‌ریزه!

➖ ➖ ➖ ➖

1️⃣ قبل از تنظیم هایپرپارامترها، الگوریتم‌ها رو خوب درک کن.

✏️ چون باید بدونی داری چی تنظیم می‌کنی!

➖ ➖ ➖ ➖

✔️ و حرف آخر:

📄 اول مفاهیم پایه‌ رو خوب یاد بگیر و توش استاد شو، بعد برو سراغ بخش‌های پیچیده‌تر!



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa


🗂 5 پلتفرم فرصت‌های کارآموزی علم داده


👨🏻‍💻 اگه تازه‌ کارین و دنبال یه فرصت کارآموزی در زمینه علوم داده و تحلیل داده هستین، سایت‌های زیادی وجود دارن که می‌تونن بهتون کمک کنن. من چندتا از این سایت‌ها رو اینجا براتون لیست کردم:👇


1️⃣ وبسایت Forage

⏪ ارائه‌دهنده کارآموزی‌های آنلاین و رایگان علوم داده برای تقویت مهارت‌های شغلی و کسب تجربه واقعی.

➖➖➖➖➖➖➖➖➖

2️⃣ وبسایت Catchafire

⏪ امکان همکاری داوطلبانه با شرکت‌ها برای به‌کارگیری مهارت‌های تحلیل داده در پروژه‌های واقعی.

➖➖➖➖➖➖➖➖➖

3️⃣ وبسایت DataKind

⏪ ایجاد پلی بین دانشمندان داده و شرکت‌ها برای استفاده از تحلیل داده‌ها در جهت حل مسائل اجتماعی.

➖➖➖➖➖➖➖➖➖

4️⃣ وبسایت Statistics Without Borders

⏪ پیوند متخصصان آمار و تحلیلگران داده به پروژه‌های داوطلبانه جهانی و انسانی.

➖➖➖➖➖➖➖➖➖

5️⃣ وبسایت Viz for Social Good

⏪ انجمنی برای داوطلبان که از طریق تصویری‌سازی داده‌ها به پروژه‌های خیریه و اجتماعی کمک می‌کنه.



🌐 #علم_داده #DataScience
➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖
📊 دانشمند داده شوید :
📊 @DataScience_ir

20 last posts shown.