Delfølge

Fra testwiki
Spring til navigation Spring til søgning

En delfølge er i matematik en talfølge som kan afledes af en anden talfølge ved at fjerne nogle af elementerne uden at ændre rækkefølgen af de tilbageværende elementer. For eksempel er talfølgen A,B,D en delfølge af A,B,C,D,E,F som er fremkommet ved at fjerne elementerne C, E og F.

Fælles delfølge

Hvis X og Y er to talfølger, siges talfølgen Z at være en fælles delfølge af X og Y, hvis Z er en delfølge af både X and Y. For eksempel, hvis

X=A,C,B,D,E,G,C,E,D,B,G og
Y=B,E,G,C,F,E,U,B,K

så vil en fælles delfølge af X og Y være

Z=B,E,E.

Det vil ikke være den længste fælles delfølge, da Z kun 3 elementer, og den fælles delfølge B,E,E,B har længden 4. Den længste fælles delfølge af X og Y er B,E,G,C,E,B.

Anvendelser

Delfølger har anvendelser i datalogi,[1] specielt inden for bioinformatik hvor computere bruges til at sammenligne, analysere og gemme strenge af DNA, RNA og proteiner.

Tag for eksempler to følger af DNA med 37 elementer:

SEQ1 = ACGGTGTCGTGCTATGCTGATGCTGACTTATATGCTA
SEQ2 = CGTTCGGCTATCGTACGTTCTATTCTATGATTTCTAA

Den længste fælles delfølge (LCS = Longest Common Subsequence) af følgerne SEQ1 og SEQ2 er:

LCS(SEQ1,SEQ2) = CGTTCGGCTATGCTTCTACTTATTCTA

Dette kan illustreres ved at fremhæve de 27 elementer i den længste fælles delfølge:

SEQ1 = ASkabelon:Font colorGSkabelon:Font colorGSkabelon:Font colorTSkabelon:Font colorGASkabelon:Font colorGSkabelon:Font colorGSkabelon:Font colorASkabelon:Font colorGSkabelon:Font color
SEQ2 = Skabelon:Font colorCSkabelon:Font colorTASkabelon:Font colorGSkabelon:Font colorTTSkabelon:Font colorASkabelon:Font colorGSkabelon:Font colorTSkabelon:Font colorA

En anden måde at vise dette er at justere de to følger så elementer i den længste fælles delfølge er placeret under hinanden (markeret med en lodret streg) og introducere et særligt tegn (her en vandret streg) i en følge hvor to elementer under hinanden er forskellige:

SEQ1 = ACGGTGTCGTGCTAT-G--C-TGATGCTGA--CT-T-ATATG-CTA-
        | || ||| ||||| |  | |  | || |  || | || |  |||
SEQ2 = -C-GT-TCG-GCTATCGTACGT--T-CT-ATTCTATGAT-T-TCTAA

Delfølger bruges til at bestemme hvor ensartede to stykker DNA er ved at bruge rækkefølgen af DNA-baserne: adenin (A), guanin (G), cytosin (C) og thymin (T).

Sætninger

Noter

  1. I datalogi er streng ofte brugt som et synonym for talfølge, men man skal være opmærksom på at delstreng og delfølge ikke er synonymer. Delstrenge er sammenhængende dele af en streng, hvilket delfølger ikke nødvendigvis er. Det betyder at delstreng af en streng altid er en delfølge af strengen, mens delfølge af en streng ikke altid er en delstreng af strengen, se: Skabelon:Cite book