Bayesisk filter

Forfatter: Robert Simon
Oprettelsesdato: 24 Juni 2021
Opdateringsdato: 1 Juli 2024
Anonim
Bayesisk filter - Teknologi
Bayesisk filter - Teknologi

Indhold

Definition - Hvad betyder det Bayesiske filter?

Et bayesisk filter er et computerprogram, der bruger Bayesian-logik eller Bayesian-analyse, der er synonyme udtryk. Det bruges til at evaluere overskriften og indholdet af s og bestemme, om det udgør spam - uopfordret eller det elektroniske ækvivalent til hard kopi bulk mail eller junk mail). Et bayesisk filter bruges bedst sammen med antivirusprogrammer.


En introduktion til Microsoft Azure og Microsoft Cloud | Gennem denne vejledning lærer du, hvad cloud computing handler om, og hvordan Microsoft Azure kan hjælpe dig med at migrere og drive din virksomhed fra skyen.

Techopedia forklarer det Bayesiske filter

Et bayesisk filter fungerer med sandsynligheder for, at specifikke ord vises i overskriften eller indholdet af en. Visse ord indikerer en stor sandsynlighed for, at det er spam, såsom Viagra og refinansiere. Filteret starter ikke med at vide sandsynligheden for, at et ord indikerer en stor sandsynlighed for spam. Brugere skal manuelt identificere som spam. Når der findes tilstrækkelige forekomster af ordet, og det identificeres som spam, lærer det Bayesiske filter at identificere ordet ved hjælp af sandsynlighedsfunktioner. Det gør det samme med mange andre ord og sætninger. Med tiden bliver det bayesiske filter mere og mere effektivt til at identificere spam for en bestemt bruger. Når sandsynligheden når en bestemt tærskel, såsom 95 procent, identificeres den som spam og flyttes ofte til en uønsket mappe (eller nogle gange endda slettes automatisk). Brugeren kan med jævne mellemrum se den og beslutte, om den skal slettes eller ej. Alternativt vil nogle spam-programmer flytte det til en karantæneplacering, hvor brugere kan se og gennemgå softwarens beslutning.


Indledende "træning" kan ofte forbedres til at reducere falske positive eller falske negativer, når der findes forkerte vurderinger. Dette tillader softwarens Bayesiske filter at tilpasse sig den spam, der konstant udvikler sig.

Nogle spamfiltre bruger også heuristik sammen med det Bayesiske filter. Foruddefinerede regler indstilles af brugeren for yderligere at øge nøjagtigheden af ​​at identificere sig som spam. Disse regler kan omfatte antallet af forekomster af et givet ord, eliminere eller ignorere neutrale ord som "the", "a" eller "some" eller identificere sekvenser af værker som "Viagra er godt for" i modsætning til at anvende en sandsynlighed funktion til alle fire individuelle ord.

Spammere kan bruge en teknik kaldet Bayesian-forgiftning for at forringe effektiviteten af ​​spamfiltre ved hjælp af Bayesian-filtrering. Nogle teknikker inkluderer indsprøjtning legitim fra nyheder eller litterære kilder, ved hjælp af tilfældige uskyldige ord, der sjældent findes i spam eller endda erstattes med billeder.


Mange klienter deaktiverer visning af billeder af sikkerhedsmæssige årsager. Således kan spam muligvis nå ud til færre modtagere.

Et Bayesian-filter ved hjælp af Bayesian-logik kan bruges til at klassificere alle slags data. Medicin, videnskab og teknik har alle fundet anvendelser. Interessant nok har videnskabelige forskere spekuleret i, at selv den menneskelige hjerne kan bruge Bayesiansk logikmetodologi til at klassificere stimuli og bestemme specifik responsadfærd.