Explicação:
O filtro bayesiano é o processo de usar métodos estatísticos para classificar documentos por categorias. O filtro de Bayes foi definido depois do documento de Paul Graham, A Plan for Spam,[1] e transformou-se num mecanismo popular para distinguir um e-mail ilegítimo conhecido como spam de um e-mail legítimo.
A probabilidade de um email ser um spam por conter determinada palavra é, por inferência bayesiana, igual à estatística de aparecimento daquela palavra em emails que sejam marcados pelo usuário como spam, multiplicada à estatística geral de spams por total de emails recebidos e dividida pela estatística geral de aparecimento daquela palavra.
Por exemplo, palavras comuns como "você", "eu", "casa" e "festa" aparecem com frequência em mensagens que sejam spam, todavia também aparecem com frequência em mensagens que não sejam spam. Mas no caso de outras expressões, como "viagra", "dinheiro fácil" e "preço imperdível", que são raras em emails comuns e comuns em mensagens de spam, é altamente provável que mensagens que as possuam sejam spams.
Fonte: Wikipédia https://pt.wikipedia.org/wiki/Filtro_bayesiano