Tekstkomprimeringsteknikken, der erstatter ofte anvendte ord med en enkelt karakter, kaldes
substitution .
Sådan fungerer det:
1. Identificer hyppige ord: Algoritmen analyserer teksten og identificerer ord, der forekommer hyppigst.
2. Tildel en enkelt tegn: Hvert hyppigt ord tildeles en unik enkelt karakter (normalt ikke en del af det originale alfabet).
3. Udskift ord: Den originale tekst scannes derefter, og hvert hyppigt ord erstattes med dets tildelte enkelt karakter.
4. Opbevar kortlægningen: Kortlægningen af tegn til ord gemmes separat, så det kan bruges til at dekomprimere teksten senere.
Eksempel:
Lad os sige, at de hyppige ord i en tekst er "The", "og" "er" og "til."
* kortlægning:
* "The" -> 'A'
* "og" -> 'b'
* "er" -> 'C'
* "til" -> 'd'
* komprimeret tekst: "Dette er en fantastisk dag b det c Sunny D gå ud."
Bemærk: Denne teknik er enkel, men ofte ikke særlig effektiv til komprimering af store mængder tekst. Det kan være mere effektivt, når det kombineres med andre teknikker som run-længde-kodning.