Quello della compressione dei file è un processo con cui tutti prima o poi devono confrontarsi. Dal salvataggio dei documenti alla navigazione sul web, fino allo streaming, tutto si basa sul medesimo procedimento: mettere sui due piatti della bilancia la qualità dei file e l’esperienza utente, sia in termini di velocità di download delle informazioni richieste che di spazio necessario per salvare i file.
Anche se si tratta di un aspetto oscuro ai più, esistono algoritmi che mirano a ridurre all’osso le dimensioni dei file, scongiurando risultati di basso livello, come accadeva in passato. Se in rete sono gli esperti a decidere, quando si tratta di fruizione e archiviazione dei dati la palla passa all’utente. Ecco cosa c’è da sapere sulla compressione dei dati.
File più piccoli sono più vantaggiosi, sia per le dimensioni che per la rapidità di download. Ma è la qualità a fare la differenza.
Per comprimere i file possono essere utilizzate due differenti strategie: la prima, chiamata lossless, permette che nel processo di compressione non vada persa alcuna informazione; la seconda, chiamata lossy, permette di ridurre le dimensioni dei file eliminando informazioni ritenute superflue.
Nel comprimere un file utilizzando una tecnica lossless (senza perdita in italiano), l'algoritmo utilizza tecniche statistiche per eliminare parte delle informazioni che si ripetono (e quindi ridondanti) sostituendole con delle istruzioni che dicono al computer come 'ricomporre' il file al momento della decompressione.
Le immagini che seguono possono aiutarci a capire meglio come funziona questo processo.
Nella prima abbiamo un totale di dieci mattoncini, di cui due rossi, cinque gialli e tre blu.
Nella seconda, a seguito del processo di compressione, abbiamo solamente tre mattoncini - uno per ogni colore - ognuno dei quali porta con sé le istruzioni necessarie alla decompressione.
In questo caso abbiamo a che fare con una tecnica lossless: l'algoritmo utilizzato ha ridotto le dimensioni occupate dai mattoncini sostituendo alle ridondanze (i mattoncini dello stesso colore che si ripetevano) le istruzioni. La stringa ffffffffuuuuuuuuuuuuu potrebbe essere compressa con tecnica lossless nella stringa f8u13, dove i numeri indicano il numero di volte che le lettere si ripetono nella stringa originale.
Programmi come WinZip, WinRar e 7Zip utilizzano tecniche di questo tipo: grazie ad algoritmi molto sofisticati, riescono ad individuare informazioni o schemi che si ripetono all'interno del file e li sostituiscono con porzioni di codice meno pesanti. Tecniche lossless, però, trovano ampio utilizzo in ambito multimediale. Il formato immagine PNG e il formato audio FLAC, ad esempio, sono file compressi che mantengono intatto il loro contenuto informativo.
In questo modo, il file risultante è più piccolo del file nativo ma di qualità inferiore.
Un file immagine formato JPEG e un file audio formato MP3 sono i due esempi più noti di compressione con perdita. Nel caso delle immagini, l'algoritmo agisce più o meno in questa maniera. In una foto con sfondo dello stesso colore ma dalle tonalità non uniformi, l'algoritmo andrà a selezionare il colore predominante e lo sostituirà, quando possibile, alle altre sfumature. Così facendo la dimensione del file sarà ridotta - dovranno essere conservate meno informazioni e quindi meno bit - ma il risultato sarà comunque accettabile.
Nel caso delle tracce audio, invece, la compressione agirà a livello di bitrate: il flusso dei dati verrà compresso a favore della dimensione del file e a discapito della qualità audio. Per l'orecchio umano, comunque, le differenze saranno minime.
Il grande problema della compressione lossy è dato dal fatto che non prevede un percorso “inverso”.
Mentre un file lossless può essere decompresso e riportato alle sue dimensioni - e qualità - originarie, ciò non accade per un file compresso con perdita. Per questo è consigliabile utilizzare sempre tecniche di compressione senza perdita quando è necessario comprimere un file e, allo stesso tempo, conservare intatto il suo contenuto informatico.
Ciò, ovviamente, richiede però un maggiore spazio occupato su disco. Lo stesso vale per le immagini.
Un documento in formato jpeg appare qualitativamente valido, soprattutto se visualizzato sul display di un dispositivo di dimensioni piccole o medie, come lo schermo di uno smartphone o di un computerdesktop o laptop. Le differenze iniziano sentirsi su monitor più grandi o schermi tv, per non parlare della stampa a grandi dimensioni. In tal caso, l’assenza di determinati elementi più farsi sentire e alterare visivamente il risultato finale.
È ragionando in termini di trasferimento dei dati che la compressione lossless assume, oggigiorno, il suo ruolo chiave.
Sono in crescita i servizi di streaming audio che forniscono agli utenti l’ascolto di musica ad alta fedeltà, senza pesare sui tempi di download o sulla banda, soprattutto quando per la navigazione si usano piani a consumo, con quantità limitate di dati a disposizione. App come Apple Music, Deezer e Tidal già hanno introdotto tale opportunità. Una decisione che fa scopa con l’utilizzo di dispositivi di ascolto come cuffie e auricolari dalla qualità top, ampiamente presenti sul mercato anche a prezzi accessibili.
Il discorso, invece, cambia per chi sfrutta device wireless. Anche i migliori si affidano al formato lossy - seppure con compressioni di livello minimo - per godere di una velocità di trasmissione dal dispositivo all’indossabile praticamente immediata. Diventa quindi evidente come, in alcuni casi, la perdita di dati sia l’inevitabile prezzo da pagare per godere di maggiore libertà.