MP3 og lydkvalitet
12. mars 2009av Magnus Kåre Skjeggedal Andersen
I dag kan vi lese at unge mennesker liker lyden av MP3 bedre enn ukomprimert lyd. Så hvis du liker ukomprimert lyd begynner du kanskje å bli gammel og utdatert? Jeg lar det spørsmålet ligge og ser litt på komprimeringsteorien bak MP3.

Plassbesparende
MP3 er en forkortelse for MPEG-1 Audio Layer 3, et format som ble godtatt som en ISO standard helt tilbake i 1991. Målet var å lage et format som gjorde det mulig å lagre god lyd på få MB. Faktisk bruker MP3 i den mye brukte kvaliteten 128 kbps 1/10 av plassen CD-lyd bruker.
I denne prosessen går informasjon tapt. Sånn sett er MP3 et «lossy» format, i motsetning til andre formater som f.eks. FLAC og ALAC som er lossless.
Hva er det egentlig som går tapt med MP3? Og er denne informasjonen viktig?
Plassbesparingen gjøres ved å fjerne informasjon i lydbildet som vanligvis regnes for uhørbar for det menneskelige øret. En vanlig CD inneholder nemlig mye mer informasjon enn hjernen din kan prosessere. To toner som er nesten like kan høres ut som en tone, og en høy lyd kan gjøre at andre lavere lyder ikke legges merke til. Teorien bak dette heter psykoakustikk og er forsket mye på.
Det en MP3 encoder gjør er altså å bryte ned en lydstrøm i elementer som så sammenliknes med modeller basert på psykoakustikk som ligger lagret i encoderen. Bitraten avgjør hvor mange elementer som tas med MP3-filen, sortert etter viktighet. Etter dette kjøres MP3-filen gjennom en mer tradisjonell pakkeprosess (slik zom ZIP-teknologien).
Mer om psykoakustikk
Mennesket kan oppfatte visse frekvenser innenfor ulike typer bølger. Vi har f.eks. synlig lys og hørbar lyd. Et instrument gir fra seg masse vibrasjoner som et øre ikke kan oppfatte. I tillegg er en av de viktigste funksjonene til hjernen å fokusere og forkaste sanseinntrykk. Det gjør at det er svært mye informasjon tilgjengelig for opptak som vi hverken vil oppfatte ved avspilling eller forsåvidt trenger. Dette er psykoakustikk-teorien som en MP3-encoder bruker.
Da er vel alle formater «lossy»?
Både ja og nei. Lossless formater innholder like mye informasjon som originalopptaket. Men samtidig vil alle opptak i sin natur være lossy, fordi det ikke er mulig å gjenskape situasjonen som var akkurat da lyden ble skapt inkludert alle tenkelige og utenkelige vibrasjoner. Resultatet vi får ut av våre høytalere vil selvfølgelig uansett være annerledes enn den lyden som var på opptakstidspunktet.
Så konklusjonen blir?
Etter min mening er det ingen grunn til å ta vare på informasjon som aldri vil ha noen nytte. Derfor vil et opptak i MP3 med tilstrekkelig bitrate (192 kbps etter min mening) i praksis være like bra å høre på som et lossless format som f.eks. FLAC. Originallyden får vi uansett ikke.
Kilder:
http://en.wikipedia.org/wiki/Psychoacoustics
http://en.wikipedia.org/wiki/MP3
http://oreilly.com/catalog/mp3/chapter/ch02.html
I dag kan vi lese at unge mennesker liker lyden av MP3 bedre enn ukomprimert lyd. Så hvis du liker ukomprimert lyd begynner du kanskje å bli gammel og utdatert? Jeg lar det spørsmålet ligge og ser litt på komprimeringsteorien bak MP3.

Plassbesparende
MP3 er en forkortelse for MPEG-1 Audio Layer 3, et format som ble godtatt som en ISO standard helt tilbake i 1991. Målet var å lage et format som gjorde det mulig å lagre god lyd på få MB. Faktisk bruker MP3 i den mye brukte kvaliteten 128 kbps 1/10 av plassen CD-lyd bruker.
I denne prosessen går informasjon tapt. Sånn sett er MP3 et «lossy» format, i motsetning til andre formater som f.eks. FLAC og ALAC som er lossless.
Hva er det egentlig som går tapt med MP3? Og er denne informasjonen viktig?
Plassbesparingen gjøres ved å fjerne informasjon i lydbildet som vanligvis regnes for uhørbar for det menneskelige øret. En vanlig CD inneholder nemlig mye mer informasjon enn hjernen din kan prosessere. To toner som er nesten like kan høres ut som en tone, og en høy lyd kan gjøre at andre lavere lyder ikke legges merke til. Teorien bak dette heter psykoakustikk og er forsket mye på.
Det en MP3 encoder gjør er altså å bryte ned en lydstrøm i elementer som så sammenliknes med modeller basert på psykoakustikk som ligger lagret i encoderen. Bitraten avgjør hvor mange elementer som tas med MP3-filen, sortert etter viktighet. Etter dette kjøres MP3-filen gjennom en mer tradisjonell pakkeprosess (slik zom ZIP-teknologien).
Mer om psykoakustikk
Mennesket kan oppfatte visse frekvenser innenfor ulike typer bølger. Vi har f.eks. synlig lys og hørbar lyd. Et instrument gir fra seg masse vibrasjoner som et øre ikke kan oppfatte. I tillegg er en av de viktigste funksjonene til hjernen å fokusere og forkaste sanseinntrykk. Det gjør at det er svært mye informasjon tilgjengelig for opptak som vi hverken vil oppfatte ved avspilling eller forsåvidt trenger. Dette er psykoakustikk-teorien som en MP3-encoder bruker.
Da er vel alle formater «lossy»?
Både ja og nei. Lossless formater innholder like mye informasjon som originalopptaket. Men samtidig vil alle opptak i sin natur være lossy, fordi det ikke er mulig å gjenskape situasjonen som var akkurat da lyden ble skapt inkludert alle tenkelige og utenkelige vibrasjoner. Resultatet vi får ut av våre høytalere vil selvfølgelig uansett være annerledes enn den lyden som var på opptakstidspunktet.
Så konklusjonen blir?
Etter min mening er det ingen grunn til å ta vare på informasjon som aldri vil ha noen nytte. Derfor vil et opptak i MP3 med tilstrekkelig bitrate (192 kbps etter min mening) i praksis være like bra å høre på som et lossless format som f.eks. FLAC. Originallyden får vi uansett ikke.
Kilder:
http://en.wikipedia.org/wiki/Psychoacoustics
http://en.wikipedia.org/wiki/MP3
http://oreilly.com/catalog/mp3/chapter/ch02.html
