Entropi (informationsteori)

Skabelon:Harflertydig4 Skabelon:Kilder

I informationsteori er entropi (også informationsentropi eller Shannon-entropi) en måde at betegne og give værdi til evolution og vækst i viden. Især KI-applikationer gør brug af entropi til at læse informationer. De sammenligner simpelthen systemets dele og vælger det stykke data med mindst (~0) entropi.

Entropien $S$ er givet ved en sum over alle mulige tilstande:

$S = - \sum_{i} P_{i} \log_{2} P_{i}$

hvor $P_{i}$ er sandsynligheden for tilstanden $i$ .^[1]

Entropien opnås være at tage gennemsnittet af informationsmængden for hvert udfald:

I_{i} = - \log_{2} P_{i}

For et system med forskellige udfald $i$ er entropien altså den gennemsnitlige informationsmængde, der opnås ved en måling. Jo højere entropien er, jo større usikkerhed er der omkring udfaldet.^[2]

Inden for fysikken kaldes den tilsvarende ligning for Gibbs' entropiformel.^[3]

Simpelt eksempel

I det følgende gives eksempler på beregning af entropi.

Møntkast

Når en ærlig mønt bruges til at slå plat eller krone, har den 50 % - dvs. $\frac{1}{2}$ - sandsynlighed for at lande på krone og 50 % sandsynlighed for at lande på plat. Informationsmængden for hver udfald er derfor:

I = - \log_{2} \frac{1}{2} = \log_{2} 2 = 1 bit

Den gennemsnitlige informationsmængde - entropien - for ét mønstkast er derfor også 1:

S_{1} = - [\frac{1}{2} \log_{2} (\frac{1}{2}) + \frac{1}{2} \log_{2} (\frac{1}{2})] = - \log_{2} \frac{1}{2} = \log_{2} 2 = 1 bit

For to mønter fordobles informationsmængden ,og derfor bliver entropien 2. Der er nemlig 4 mulige udfald med to mønter, og hvert udfald har 25 % sandsynlighed, så:

S_{2} = - 4 [\frac{1}{4} \log_{2} (\frac{1}{4})] = \log_{2} 4 = \log_{2} 2^{2} = 2 \log_{2} 2 = 2 bit

Da antallet af mulige udfald fordobles med hver mønt, må antallet af mulige udfald for et arbitrært antal $N$ mønter være $2^{N}$ . Sandsynligheden per udfald $i$ er derfor:

P_{i} = \frac{1}{2^{N}}

Og derfor er entropien:

S_{N} = - 2^{N} [\frac{1}{2^{N}} \log_{2} (\frac{1}{2^{N}})] = \log_{2} (2^{N}) = N \log_{2} 2

Entropien for $N$ møntkast er altså simpelthen $N$ .

$S_{N} = N bit$

Så jo flere mønter, jo højere entropi, da hvert udfald bliver mere og mere usandsynligt, og informationen omvendt bliver større og større.

Bernoulli-proces

En Bernoulli-proces er en måling, hvor der er to mulige udfald med sandsynlighederne $p$ og $1 - p$

\begin{matrix} P_{1} & = p \\ P_{2} & = 1 - p \end{matrix}

hvor $p$ er konstant. Dette er en generalisering af den ærlige mønt, hvor $p = \frac{1}{2}$ . Entropien er:

$S (p) = - p \log_{2} (p) - (1 - p) \log_{2} (1 - p)$

For $p = \frac{1}{2}$ er entropien 1 som før, men for $p = 0$ - dvs. hvis udfald 1 er umuligt - bliver entropien:

S (0) = - 0 \log_{2} (0) - 1 \log_{2} (1) = 0 bit

Entropien ville også være 0 bit, hvis kun udfald 2 var muligt. Hvis kun ét udfald er muligt, er der ikke længere nogen usikkerhed, mens usikkerheden er størst, hvis begge udfald er lige sandsynlige (se figur).^[2]

Kildehenvisninger

Skabelon:Reflist

Skabelon:Matematikstub Skabelon:Autoritetsdata

[pathriaBook-1] Skabelon:Cite book

[blundell_153-155-2] 2,0 ^2,1 ^2,2 Skabelon:Cite book

[blundell_146-148-3] Skabelon:Cite book

[1]

[2]

[3]

Entropi (informationsteori)

Indholdsfortegnelse

Simpelt eksempel

Møntkast

Bernoulli-proces

Kildehenvisninger

Navigationsmenu

Entropi (informationsteori)

Simpelt eksempel

Møntkast

Bernoulli-proces

Kildehenvisninger

Navigationsmenu

Søg