Bu proje, farklı formatlarda bulunan kredi kartı numarası, son kullanma tarihi (exp) ve CVV bilgilerini tespit edip çıkartmak için geliştirilmiş iki ayrı araç içerir:
- cvv2net.py - Metin tabanlı dosya tarayıcı
- ocr_card_extractor.py - OCR tabanlı PDF ve görsel kart bilgisi çıkartıcı + AI organizasyon sistemi
- Kredi kartı, exp ve CVV için gelişmiş ve esnek regex havuzu
- JSON, CSV, metin, e-posta ve PDF desteği
- Yan yana ve alt alta geçen verilerde context yakalama
- Alakasız (username, password, domain, host, vb.) alanları filtreleme
- Sonuçları ekrana ve isteğe bağlı olarak CSV dosyasına yazma
- ✅ PDF ve Görsel Desteği: PDF, JPG, PNG, BMP, TIFF formatlarını destekler
- ✅ Alt Klasör Desteği 🆕: Klasör içindeki tüm alt klasörleri otomatik tarar
- ✅ Python 3.13+ Uyumlu 🆕: Kaldırılan
imghdrmodülü gerektirmez - ✅ Akıllı Dosya Tespiti: İçerik analiziyle yanlış/eksik uzantılı dosyaları tespit eder
- ✅ Magic Byte Analizi: Uzantıdan bağımsız format tespiti (PDF, JPEG, PNG, GIF, BMP, TIFF, WebP)
- ✅ Tesseract OCR: Tam kart bilgisi (PAN, SKT, CVV) çıkarma
- ✅ Görüntü İşleme: Kabartmalı/yazılı rakamları netleştirme (Gaussian blur, adaptive threshold)
- ✅ AI Organizasyon: Dosyaları kart sahibine göre otomatik organize etme (Nero AI Photo Tagger benzeri)
- ✅ Çoklu Dil Desteği: Türkçe, İngilizce, İspanyolca etiket tanıma
- ✅ Zaman Damgası: Her tarama için zaman kaydı
- ✅ Güvenli Çıktı: CSV dosyasına kısıtlı izinlerle kaydetme (chmod 600)
- ✅ Detaylı Raporlama: Başarı/başarısızlık istatistikleri + tespit yöntemi takibi
Windows için özel hazırlanan kolay kurulum ve kullanım:
- Hızlı Kurulum:
setup_windows.batdosyasına çift tıklayın - Çalıştırma:
- Metin tarayıcı için:
run_cvv2net.bat - OCR çıkartıcı için:
run_ocr_extractor.bat
- Metin tarayıcı için:
- EXE Oluşturma:
build_windows_exe.bat(Python kurulu olmayan bilgisayarlar için)
📖 Detaylı Windows Kılavuzu: WINDOWS_GUIDE.md dosyasına bakın
Öncelikle Python 3 yüklü olmalı.
Not: Python 3.13+ uyumlu -
imghdrmodülü gerektirmez.
OCR tabanlı çıkartıcı (ocr_card_extractor.py) kullanacaksanız, sisteminizde Tesseract OCR kurulu olmalıdır:
Linux/Ubuntu:
sudo apt-get update
sudo apt-get install tesseract-ocr
sudo apt-get install poppler-utils # PDF dönüşümü içinMacOS:
brew install tesseract
brew install popplerWindows:
- Kolay kurulum için
setup_windows.batdosyasını çalıştırın (otomatik kontrol yapar) - Manuel kurulum: Tesseract installer sayfasından indirip kurun
- Kurulum sonrası
ocr_card_extractor.pydosyasında tesseract yolunu güncelleyin - Detaylı adımlar için WINDOWS_GUIDE.md dosyasına bakın
Tüm bağımlılıkları yüklemek için:
pip install -r requirements.txtveya manuel olarak:
pip install PyPDF2 pdf2image pytesseract opencv-python pandas numpyNot: Standart Python kurulumu genellikle diğer gerekli modülleri (json, csv, re) içerir.
Scripti bilgisayarınıza indirin ya da repodan klonlayın:
git clone https://github.com/cvv2com/ccfinder.git
cd ccfinderWindows kullanıcıları için üç farklı yöntem:
Proje klasöründe hazır batch dosyalarına çift tıklayın:
run_cvv2net.bat - Metin tabanlı tarayıcı
run_ocr_extractor.bat - OCR tabanlı çıkartıcı
Batch dosyaları otomatik olarak:
- Python'un kurulu olduğunu kontrol eder
- Gerekli paketleri yükler
- Programı çalıştırır
Python kurulu olmayan bilgisayarlarda kullanmak için:
build_windows_exe.batBu komut dist/ klasöründe .exe dosyaları oluşturur:
cvv2net.exeocr_card_extractor.exe
Bu .exe dosyaları başka Windows bilgisayarlara kopyalanabilir ve Python kurulumu olmadan çalışır.
Komut satırında (CMD veya PowerShell):
python cvv2net.py📖 Detaylı Windows kullanımı için: WINDOWS_GUIDE.md
Komut satırında scriptin bulunduğu dizine geçin:
cd "C:\klasor\yolunuz" # Windows
cd /home/kullanici/klasor # Linux/MacBir dosyada veya klasörde arama yapmak için:
python cvv2net.py
# VEYA Windows için: run_cvv2net.batProgram sizden taranacak yol ve thread sayısı gibi bilgileri isteyecektir.
PDF ve görsel dosyalarından OCR ile kart bilgilerini çıkartmak için:
mkdir kart_kayitlari
# PDF ve görsel dosyalarınızı bu klasöre veya alt klasörlerine koyunDesteklenen Formatlar:
- PDF dosyaları (
.pdf) - Görsel dosyaları (
.jpg,.jpeg,.png,.bmp,.tiff,.tif)
Örnek Klasör Yapısı (Alt klasörler desteklenir):
kart_kayitlari/
├── dosya1.pdf
├── pdf/
│ ├── dosya2.pdf
│ └── dosya3.pdf
└── images/
└── kart1.jpg
python ocr_card_extractor.pyScript otomatik olarak:
./kart_kayitlariklasöründeki ve tüm alt klasörlerindeki PDF ve görsel dosyalarını tarar- PDF'leri 300 DPI çözünürlükte görsele dönüştürür
- Görüntü işleme ve OCR ile rakamları okur
- Kart sahibi, numara, SKT ve CVV bilgilerini ayıklar
- Sonuçları
musteri_kredi_kartlari_tam_liste.csvdosyasına kaydeder - Dosyaları kart sahibine göre
./organize_kartlarklasörüne organize eder (AI tagging)
ocr_card_extractor.py dosyasını düzenleyerek:
KAYNAK_KLASORU: PDF ve görsellerin bulunduğu klasör yoluCIKTI_DOSYASI: Çıktı CSV dosyasının adıORGANIZE_KLASORU: Organize edilmiş dosyalar için klasörpytesseract.pytesseract.tesseract_cmd: Windows için Tesseract yolu
PDF dosyalarını taramak için PyPDF2 paketinin yüklü olması gerekir.
E-posta dosyaları için .eml ve .mbox desteği vardır.
Card: 4556123412341234, Exp: 0528, CVV: 123, Line: 42, Context: Card: 4556 1234 1234 1234 Exp: 05/28 CVV: 123
Toplam 5 dosya taranacak...
İşleniyor: kart_001.pdf
---> Kart Bulundu: 4546********
İşleniyor: kart_002.pdf
---> Kart Bulundu: 5412********
Başarılı! Tüm veriler 'musteri_kredi_kartlari_tam_liste.csv' dosyasına kaydedildi.
CSV Dosyası Format:
Kart_Sahibi,Kart_Numarasi,SKT,CVV,Dosya_Kaynagi
"JOHN DOE","4546571054123456","04/25","123","kart_001.pdf"
"JANE SMITH","5412345678901234","12/26","456","kart_002.pdf"Aşağıdaki anahtar kelimeler içeren satırlar/alanlar kart/exp/cvv aramasında dikkate alınmaz:
- user, username, domain, password, pass, host, server, login, smtp, imap, ftp, ssh, dns
- Yüksek Çözünürlük: PDF'ler 300 DPI ile görsele dönüştürülür (küçük CVV kodlarını okumak için kritik)
- Görüntü İşleme: Adaptive threshold ile kabartmalı yazıları netleştirir
- PAN Yakalama: 13-19 haneli kart numaralarını (boşluklu veya bitişik) yakalar
- CVV Ayrıştırma: "CVV/CVC" etiketi arar, bulamazsa izole 3-4 haneli sayıları alır
- Regex Desenleri: MM/YY formatında son kullanma tarihi ve büyük harfli isim desenleri
- Tam PAN (Primary Account Number)
- Son kullanma tarihi (Expiration Date)
- CVV/CVC güvenlik kodu
Güvenlik Önerileri:
- CSV dosyalarını veritabanına aktardıktan sonra diskten geri getirilemeyecek şekilde silin (
shredkomutu veya secure delete araçları) - Kaynak PDF'leri de aynı şekilde güvenli olarak silin
- Veritabanında kartı saklamak yerine tokenization kullanın
- Erişimi sadece yetkili personelle sınırlandırın
- Tüm işlemleri denetim kaydı (audit log) tutarak yapın
- Script hem Windows hem Linux hem de MacOS ortamında çalışır.
- Hata alırsanız veya yeni format/özellik ekletmek isterseniz veya bana ulaşabilirsiniz. https://bhf.pro/threads/629649/ https://www.cvv2.net
MIT Lisansı (veya kendi seçtiğiniz bir açık kaynak lisansı).