Kolejny ciekawy false-positive. Tym razem od BRE Ubezpieczenia. Co miesiąc wysyłają mi informacje o pobraniu składki z konta (ubezpieczenie przez mBank). Wiadomość oznaczana jest przez NetArt jako spam.
X-Spam-Flag: YES
X-Spam-Score: 8.189
X-Spam-Level: ********
X-Spam-Status: Yes, score=8.189 tagged_above=-10 required=6.31
tests=[BAD_ENC_HEADER=2.87, MIME_QP_LONG_LINE=1.819, NA_PORN=1,
SARE_ADLTSUB4=2.5] autolearn=disabled
subject: ***SPAM*** =?iso-8859-2?Q?Ubezpieczenie - zbli=BFa si=EA termin
pobrania sk=B3adki?=
O ile znaczniki BAD_ENC_HEADER i MIME_QP_LONG_LINE można przemilczeć, bo kto by tam czytał RFC, to warto zauważyć dwa pozostałe: NA_PORN i SARE_ADULTSUB4.
Niestety nie wiem z jakiego dodatku pochodzi pierwszy i jakimi regułami się kieruje, natomiast ten drugi wyłapał słowo „pobrania” z tematu i dorzucił 2,5 punkta. Czemu akurat pobrania? Bo pasuje do wyrażenia regularnego /(?!\bpo(?:rn|ur))\bp.?o.?r.?n/i – tak jak porn.
Nie mam pod ręką słownika polskiego (Wy możecie mieć), ale może ktoś na szybko dopasuje inne słowa?
header SARE_ADLTSUB4 Subject =~ /(?!\bpo(?:rn|ur))\bp.?o.?r.?n/i
describe SARE_ADLTSUB4 Apparent spam seems to contain porn subject
score SARE_ADLTSUB4 2.500 # type=obfu
Zobacz też:

