MPS LLM Forge: Fine-tuning & RL on Apple Silicon

This project provides a complete pipeline for fine-tuning and Reinforcement Learning (RL) with Large Language Models (LLMs) on Apple Silicon. The implementation is optimized for memory efficiency and performance using Metal Performance Shaders (MPS).

Features

LoRA Fine-tuning: Parameter-efficient fine-tuning with configurable rank and alpha
Mac Optimization: Leverages Metal Performance Shaders (MPS) for GPU acceleration
Memory Efficient: Gradient checkpointing, CPU offloading, and dynamic memory management
Flexible Data: Support for various data formats and preprocessing pipelines
Monitoring: Comprehensive logging with TensorBoard and WandB integration
Evaluation: Built-in evaluation metrics and generation quality assessment

Requirements

macOS 12.3+ (for MPS support)
Apple Silicon Mac (M1/M2/M3) with 16GB+ RAM recommended
Python 3.8+
20GB+ free disk space for model and checkpoints

Installation

Clone the repository:

git clone <repository-url>
cd mps-llm-forge

Create a virtual environment:

python -m venv venv
source venv/bin/activate  # On macOS/Linux

Install dependencies:

pip install -r requirements.txt

Quick Start

Download the model (first time only):

python scripts/download_model.py

Prepare your training data in the data/raw/ directory
Configure training parameters in config/training_config.yaml
Start training:

python run_train.py

Run inference with your fine-tuned model:

python run_inference.py --model_path outputs/ --interactive

Project Structure

mps-llm-forge/
├── config/          # Configuration files
├── data/            # Training data
├── src/             # Source code
├── scripts/         # Utility scripts
├── outputs/         # Training outputs
├── logs/            # Training logs
└── tests/           # Unit tests

Configuration

Training Configuration (`config/training_config.yaml`)

Model settings (base model, LoRA parameters)
Training hyperparameters (learning rate, batch size, etc.)
Data processing settings
Output and logging configuration

LoRA Parameters

Rank: 8-16 (recommended for memory efficiency)
Alpha: 16-32 (scaling factor)
Target Modules: q_proj, v_proj, k_proj, o_proj
Dropout: 0.1

Data Format

The training data should be in one of these formats:

JSON: {"instruction": "...", "input": "...", "output": "..."}
CSV: Columns for instruction, input, and output
Text: Plain text files (one example per line)

Training Tips

Memory Management:
- Start with small batch sizes (1-2)
- Use gradient accumulation (4-8 steps)
- Enable gradient checkpointing
- Monitor memory usage with psutil
Performance Optimization:
- Use mixed precision training (FP16/BF16)
- Leverage MPS backend for GPU acceleration
- Optimize sequence length for your use case
Monitoring:
- Check training logs in logs/ directory
- Use TensorBoard for real-time metrics
- Monitor memory usage and training speed

Evaluation

The project includes several evaluation metrics:

Perplexity: Language model quality measure
Generation Quality: Human-readable output assessment
Memory Usage: Training efficiency metrics
Training Speed: Tokens per second

Troubleshooting

Common Issues

Out of Memory:
- Reduce batch size or sequence length
- Enable gradient checkpointing
- Use CPU offloading for optimizer states
Slow Training:
- Check MPS backend availability
- Verify mixed precision settings
- Monitor CPU/GPU utilization
Model Loading Issues:
- Ensure sufficient disk space
- Check Hugging Face token permissions
- Verify model compatibility

Contributing

Fork the repository
Create a feature branch
Make your changes
Add tests if applicable
Submit a pull request

License

This project is licensed under the MIT License - see the LICENSE file for details.

Acknowledgments

Meta AI for Llama 3 models
Hugging Face for the Transformers library
Microsoft for PEFT implementation
Apple for MPS backend support

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
config		config
scripts		scripts
src		src
tests		tests
.gitignore		.gitignore
MODEL_NAMING_CONSISTENCY.md		MODEL_NAMING_CONSISTENCY.md
PROJECT_SUMMARY.md		PROJECT_SUMMARY.md
README.md		README.md
SETUP_GUIDE.md		SETUP_GUIDE.md
activate_env.sh		activate_env.sh
quick_start.py		quick_start.py
requirements.txt		requirements.txt
requirements_exact.txt		requirements_exact.txt
run_inference.py		run_inference.py
run_train.py		run_train.py
setup.py		setup.py
test_imports.py		test_imports.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

MPS LLM Forge: Fine-tuning & RL on Apple Silicon

Features

Requirements

Installation

Quick Start

Project Structure

Configuration

Training Configuration (`config/training_config.yaml`)

LoRA Parameters

Data Format

Training Tips

Evaluation

Troubleshooting

Common Issues

Contributing

License

Acknowledgments

About

Uh oh!

Releases

Packages

Languages

JC-Gu/mps-llm-forge

Folders and files

Latest commit

History

Repository files navigation

MPS LLM Forge: Fine-tuning & RL on Apple Silicon

Features

Requirements

Installation

Quick Start

Project Structure

Configuration

Training Configuration (config/training_config.yaml)

LoRA Parameters

Data Format

Training Tips

Evaluation

Troubleshooting

Common Issues

Contributing

License

Acknowledgments

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Training Configuration (`config/training_config.yaml`)

Packages