우리가 이메일 계정을 열 때 원하지 않는 수백 건의 원치 않는 전자 메일이 아니라면 수천 건의 맹공격에 시달리는 사람들은 베이지안 스팸 필터의 형태로 잠시 휴식을 취할 수있는 희망이 있습니다. 수년간 스패머들은 새로운 스팸 필터가 개발 될 때마다 블로깅을 조정하고 회피 할 수있는 창의력과 능력으로 인해 스팸 차단기보다 한 걸음 더 앞서 나갈 수있었습니다. 결과적으로, 안티 스팸 소프트웨어 개발자들은 이전의 작업을 확신했습니다. 스패머의 새롭고 창조적 인 기술을 통해 지속적으로 학습 할 수있는 소프트웨어를 개발하여 결과적으로 스팸 차단 게임에 결코 뒤지지 않습니다..
IAML5.12 : 스팸 탐지를위한 Naive Bayes
최근에는 이러한 솔루션이 베이지안 필터의 형태로 개발되었습니다. 필터가 기반이되는 베이지안 통계 방법은 전자 메일을 범주로 나누는 전제에서 작동합니다. 이 소프트웨어는 열려는 전자 메일과 단순히 삭제 한 전자 메일의 로그를 사용합니다. 그동안 열어 본 이메일과 읽지 않은 이메일의 특성을 모니터링합니다. 시간이 지남에 따라이 수치를 통해 알 수 있습니다. 그것은 당신이 끊임없이 무시하는 그 전자 우편에서 빈번하게 나타나는 특정 낱말을 인식 할 것이다. 이 소프트웨어는 특정 단어의 빈도가 높은 전자 메일을 스팸으로 분류하는 경향이 더 커집니다.
하지만 수 고모의 이메일 몇 개를 열지 않으면 갑자기 ';수';라는 단어가 포함 된 모든 이메일이 스팸으로 분류되어 베이지안 필터가 전체적으로 작동한다는 것을 알아야합니다. 즉, 전자 메일을 열어서 어떤 알고리즘을 사용할지 결정하지 않으면 알고리즘에 영향을 미치지 만 수만 명이 아닌 다른 사용자도 마찬가지입니다. 그러한 광범위한 사용자에게 퍼져서 그런 기간 동안 데이터를 모으는 것은 잘못된 라벨링의 위험을 최소화하는 것입니다. 오히려 당신이 얻는 것은 스팸을 차단하는 매우 정확한 장기적인 도구입니다. 불행히도 허위 블로킹을 방지하는 동일한 특성은 베이지안 스팸 필터가 새로운 스팸 기술의 전면 전파를 차단하는 것을 제한합니다. 따라서 종종 효과는 알고리즘에 적용될 때까지 균열을 통해 스며드는 새로운 기술의 며칠 또는 몇 주일입니다.
그러나 동일한 토큰으로 베이지안 스팸 필터의 큰 장점 중 하나는 개별화 될 수 있다는 것입니다. 온라인 관심사에 따라 과도한 양의 스팸을 받으면 실제로 스팸성이있는 특정 단어를 치료하도록 베이지안 스팸 차단기를 수정할 수 있습니다. 말하자면, 사용자가 묻는 메시지가 나오면, 베이지안 필터는 과도한 차단을 피하기 위해주의를 기울이지 만, 특정 유형의 스팸 전자 메일을 차단하도록 소프트웨어를 구성 할 수 있습니다.
최근에야이 기술이 상용화되었습니다. 현재이 제품은 제한된 수의 안티 스팸 소프트웨어 프로그램으로 제공되며 구입할 수 있으며 전자 메일이 열리기 전에 각 전자 메일을 검사합니다. 다른 형태는 실제로 메일 서버 소프트웨어 자체에 내장 된 형태입니다. 즉, 고객의 전자 메일이 전자 메일 공급자를 열기 전에 이미 스캔되고 분류되어 있음을 의미합니다