İlk Spam Filtre Şeysim

Bir süredir ML Class'ın Machine Learning dersleriyle uğraşıyorum. Artık yavaş yavaş birşeyler yapmaya başladık.

Mesela bugünkü ödevimizde Octave kullanarak SVM algoritmalı bir spam filtresi geliştiriyoruz.

Girdimiz şu şekilde:

Do You Want To Make $1000 Or More Per Week?

If you are a motivated and qualified individual - I
will personally demonstrate to you a system that will
make you $1,000 per week or more! This is NOT mlm.

Call our 24 hour pre-recorded number to get the
details.

000-456-789

I need people who want to make serious money. Make
the call and get the facts.

Invest 2 minutes in yourself now!

000-456-789

Looking forward to your call and I will introduce you
to people like yourself who
are currently making $10,000 plus per week!

000-456-789

3484lJGv6-241lEaN9080lRmS6-271WxHo7524qiyT5-438rjUv5615hQcf0-662eiDB9057dMtVl72

Bu arkadaş çeşitli elemelerden geçtikten sonra aşağıdaki hale döndürülüyor.

Sonuç olarak eğitilen algoritma %99.5 seviyelerinde doğruluk oranına sahip oluyor. Tabi ki bu değer, eldeki verilerle ortaya çıkıyor. Veri miktarına göre sonuç da değişecektir.

 Spam lan bu