Creative Commons License
Excepto donde se indique otra cosa, todo el contenido de este lugar está bajo una licencia de Creative Commons.
Taquiones > sysadmin > estadísticas en dspam

estadísticas en dspam

Existe un programa llamado dspam_stats que proporciona información sobre la efectividad del filtro desde el primer momento ó desde la última llamada al mismo.

La información que muestra es la siguiente:

victor:
            TP True Positives:              0
            TN True Negatives:           3889
            FP False Positives:         15046
            FN False Negatives:          1769
            SC Spam Corpusfed:            192
            NC Nonspam Corpusfed:           0
            TL Training Left:               0
            SHR Spam Hit Rate           0.00%
            HSR Ham Strike Rate:       79.46%
            OCA Overall Accuracy:      18.78%

Y cada uno de los valores proporcionan pistas para saber qué está pasando:

TP True Positives

Esta cifra es el número total de mensajes clasificados como Spam.

TN True Negatives

Esta cifra es el númeor total de mensajes clasificados como ham.

FP False Positives

Son los mensajes válidos, pero que han sido marcados equivocadamente como spam.

FN False Negatives

Son los mensajes no válidos (spam), pero que han sido marcados equivocadamente como ham.

SC Spam Corpusfed

Total de mensajes spam que han sido incorporados al filtro como corpus.

NC Nonspam Corpusfed

Idem pero para los mensajes ham.

TL Training Left

Número de mensajes que faltan para que el filtro finalice el proceso de aprendizaje inicial (por debajo de 2.500). Se le resta a esta cifra la suma de los mensajes que el filtro ha clasificado como ham (innocent_classified) más la de los mensajes que se le ha enseñado (innocent_learned).

SHR Spam Hit Rate

Este es el ratio de aciertos del filtro en cuando a clasificación de spam. Se obtiene con la siguiente fórmula

( 100.00 - ( spam_misclassified / all_spam ) * 100.00 )

siendo spam_misclassified el total de correos marcados erróneamente como spam y all_spam el número total de mensajes marcados como spam.

HSR Ham Strike Rate

Igual que el anterior pero referido a los errores al clasificar mensajes ham como spam; en este caso las variables son:

  • innocent_classified
  • all_innocent

OCA Overall Accuracy

Este es el indicador de precisión total, basado en la relación entre correos marcados como ham y la de marcados como spam.