این مخزن شامل تمام مطالب، کدها، تمرینها و پروژههای دوره جامع علم داده با پایتون است. دوره بر اساس کتاب مرجع "Data Science Essentials in Python" نوشته Dmitry Zinoviev طراحی شده و در ۱۲ جلسه آنلاین برگزار میشود.
یادگیری عملی و پروژهمحور علم داده از مفاهیم اولیه برنامهنویسی پایتون تا اجرای یک پروژه واقعی علم داده.
آراز شاه کرمی - مدرس علم داده و پایتون
- آشنایی با علم داده و جایگاه آن
- چرخه کامل پروژه علم داده
- انواع دادهها و Data Acquisition Pipeline
- معرفی محیط کاری (Python، Jupyter، Google Colab)
- اولین تحلیل داده عملی
- کار با رشتهها و ساختمان دادهها
- خواندن و نوشتن فایلها
- دریافت داده از وب (
urllib,requests) - Regular Expressions
- Pickling & Unpickling
- پردازش HTML با BeautifulSoup
- کار با CSV و JSON
- مقدمهای بر پردازش زبان طبیعی (NLTK)
- پروژه: جمعآوری و تحلیل اخبار
- MySQL و اجرای کوئریها
- MongoDB و دادههای NoSQL
- اتصال Python به پایگاهداده
- ایجاد و دستکاری آرایهها
- Broadcasting و ufuncs
- Aggregation و Set operations
- کار با DataFrame و Series
- Reshaping, Pivot, Melt
- مدیریت دادههای گمشده
- Merge/Join ترکیب دادهها
- مفاهیم گراف و NetworkX
- سنجشهای مرکزیت و خوشهبندی
- پروژه: تحلیل شبکه اجتماعی
- Matplotlib و انواع نمودار
- زیباسازی و سفارشیسازی
- ترسیم مستقیم از Pandas
- توزیعهای آماری و شاخصها
- آزمونهای آماری
- تحلیل همبستگی
- رگرسیون خطی (Linear Regression)
- K-Means Clustering
- Random Forest
- ارزیابی مدل
- انتخاب و تعریف پروژه
- پیادهسازی کامل
- ارائه نتایج
- Python 3.8+
- NumPy - محاسبات عددی
- Pandas - تحلیل دادههای جدولی
- Matplotlib - مصورسازی
- Scikit-learn - یادگیری ماشین
- BeautifulSoup - وب اسکرپینگ
- NetworkX - تحلیل شبکه
- Requests - HTTP requests
- MySQL - پایگاه داده رابطهای
- MongoDB - پایگاه داده NoSQL
- Jupyter Notebook
- Google Colab
data-science-python-course/
│
├── sessions/ # مطالب هر جلسه
│ ├── session-01/ # جلسه اول
│ │ ├── slides/ # اسلایدها
│ │ ├── notebooks/ # Jupyter Notebooks
│ │ ├── data/ # دادههای نمونه
│ │ └── exercises/ # تمرینها
│ ├── session-02/
│ └── ...
│
├── projects/ # پروژههای دوره
│ ├── mini-projects/ # پروژههای کوچک
│ └── final-project/ # پروژه نهایی
│
├── datasets/ # مجموعه دادههای دوره
│ ├── raw/ # دادههای خام
│ ├── processed/ # دادههای پردازش شده
│ └── external/ # دادههای خارجی
│
├── resources/ # منابع و مراجع
│ ├── books/ # کتابها و مقالات
│ ├── cheatsheets/ # برگههای کمک سریع
│ └── links.md # لینکهای مفید
│
├── setup/ # راهاندازی محیط
│ ├── installation.md # راهنمای نصب
│ └── environment.yml # محیط conda
│
├── requirements.txt # کتابخانههای Python
├── LICENSE # مجوز استفاده
└── README.md # این فایل
- Python 3.8 یا بالاتر
- Git (برای کلون کردن مخزن)
# کلون کردن مخزن
git clone https://github.com/arazshah/Data-science-with-python.git
cd Data-science-with-python
# ایجاد محیط conda
conda env create -f setup/environment.yml
conda activate data-science-course
# راهاندازی Jupyter
jupyter notebook# کلون کردن مخزن
git clone https://github.com/arazshah/Data-science-with-python.git
cd Data-science-with-python
# ایجاد محیط مجازی
python -m venv venv
source venv/bin/activate # در Windows: venv\Scripts\activate
# نصب کتابخانهها
pip install -r requirements.txt
# راهاندازی Jupyter
jupyter notebookبرای استفاده بدون نصب:
- بروید به Google Colab
- فایلهای
.ipynbرا از مخزن آپلود کنید - کتابخانههای موردنیاز از قبل نصب شدهاند
- هر جلسه، پوشه مربوطه را بررسی کنید
- ابتدا اسلایدها را مطالعه کنید
- Notebook های آموزشی را اجرا کنید
- تمرینها را انجام دهید
- در صورت سوال، Issue ایجاد کنید
- از جلسه اول شروع کنید
- مطالب را به ترتیب دنبال کنید
- تمرینها را حتماً انجام دهید
- پروژههای کوچک را پیادهسازی کنید
- تحلیل دادههای فروش: آنالیز ترندهای فروش ماهانه
- اسکرپینگ اخبار: جمعآوری و دستهبندی اخبار
- تحلیل شبکه اجتماعی: بررسی روابط در شبکههای اجتماعی
"تحلیل الگوهای تردد شهری"
- جمعآوری دادههای تردد
- پاکسازی و آمادهسازی
- تحلیل الگوهای زمانی و مکانی
- مصورسازی تعاملی
- مدل پیشبینی تراکم
- مخزن را Fork کنید
- شاخه جدید ایجاد کنید (
git checkout -b feature/AmazingFeature) - تغییرات را Commit کنید (
git commit -m 'Add some AmazingFeature') - به شاخه Push کنید (
git push origin feature/AmazingFeature) - Pull Request ایجاد کنید
- گزارش باگها
- پیشنهاد بهبودها
- اضافه کردن مثالهای جدید
- ترجمه مطالب
- بهبود مستندات
- ایمیل: araz.shah@gmail.com
- تلگرام: @arazshah
- LinkedIn: https://www.linkedin.com/in/araz-shahkarami/
برای گزارش مشکلات فنی یا پیشنهادات، لطفاً Issue جدید ایجاد کنید.
قبل از سوال، لطفاً FAQ را بررسی کنید.
- کتاب "Data Science Essentials in Python" - Dmitry Zinoviev
- دورههای Coursera و edX
- جامعه Python و کتابخانههای متنباز
- تمام دانشجویان دوره برای بازخوردهای ارزشمند
- توسعهدهندگان کتابخانههای NumPy، Pandas، Matplotlib
- تیم Jupyter برای ایجاد محیط عالی تحلیل داده
برای اطلاع از آخرین بهروزرسانیها:
- ⭐ مخزن را Star کنید
- 👀 Watch کنید تا از تغییرات مطلع شوید
- 📧 در لیست ایمیل دوره عضو شوید
موفق باشید در مسیر یادگیری علم داده! 🚀
آخرین بهروزرسانی: [26/5/1404] | نسخه: 1.0.0
requirements.txtenvironment.ymlLICENSEresources/faq.md