Vysoký bitrate pri audioknihách je ako luxusnejší obal na párkoch

Ak patríte medzi aktívnych konzumentov digitálneho obsahu, kvalita nahrávky je jednou z podstatných vlastností, ktoré vás pri takomto tovare zaujímajú.

To, čo sme niekedy nemuseli riešiť pri CD nosičoch, sa pri digitálnom formáte stalo otázkou číslo jedna:

V akej kvalite je dostupná táto nahrávka?

Keďže kvalita je veľmi ťažko definovateľná vlastnosť, bitrate – alebo tiež dátový tok – sa stali jej synonymom.

  • Čo to ten bitrate vlastne je?
  • Dá sa o kvalite hovoriť len zvyšujúcim sa číslom bitrate?
  • Môže nižší bitrate ponúkať rovnakú kvalitu ako vyšší bitrate?

Poďme sa na to pozrieť zblízka.

Čo to ten bitrate vlastne je

Aby sme vedeli o čom hovoríme, špecifikujme si najprv základné pojmy.

Bitrate je množstvo dát – počet bitov – ktoré sú dostupné k spracovaniu počas definovanej časovej jednotky. Pri zvukovom zázname je touto jednotkou sekunda a množstvo dát sa udáva v kilobitoch.

img-alternative-text

Ak teda hovoríme o zázname s bitrate 256 kbps, znamená to, že jedna sekunda tohto záznamu obsahuje 256 kb dát.

Stále komplikované?

Čím viac dát reprezentuje – opisuje – danú časovú jednotku, tým detailnejší výstup získavame. Kvalita teda je priamo úmerná veľkosti bitrate.

Ak je to tak jednoduché, k čomu je táto diskusia dobrá? Pretože pri digitálnej reprezentácii zvuku nič nie je až tak jednoznačné.

Skúsme sa na to pozrieť z pohľadu kopírky. Viem, divné prirovnanie, ale funguje.

Ak máme k dispozícii najkvalitnejšiu kopírku na svete a ako predlohu zlú kópiu obrázku, bude výsledkom kopírovania originálny obrázok? Ťažko. Kvalitu výstupu neovplyvňuje len perfektný proces spracovania, ale tiež vstup samotný.

img-alternative-text

Ľudský hlas je ako málo kvalitný obrázok

Nahrávanie zvukového záznamu je komplexný proces. Záleží pri ňom, v akej kvalite je nahrávka spravená. V akej samplovacej frekvencii, bitovej hĺbke, s akým mikrofónom, s akým prahovým hlukom a podobne. Do podrobností jednotlivých zložiek nebudem zachádzať, tie nie sú z nášho pohľadu teraz dôležité.

Ak je nahrávka spravená vo vysokej kvalite, vyšší bitrate dokáže lepšie interpretovať túto kvalitu väčším množstvom dát. Ak je nahrávka spravené v nízkej kvalite, vysoký dátový tok nemá čo reprezentovať, nezachráni kvalitu a je zbytočný. Podobne ako s našou kopírkou.

img-alternative-text

Zjednodušene môžme tvrdiť, že ľudský hlas je ako ten málo kvalitný obrázok.

Nie z pohľadu subjektívneho posudzovania, ale z pohľadu jeho frekvenčnej reprezentácie. Pokiaľ ľudský sluch je schopný počuť v tom lepšom prípade všetko od 20 Hz do 20 kHz, ľudský hlas pri bežnej reči kolíše medzi 300 Hz až 4 kHz.. Z pohľadu počuteľného frekvenčného pásma je to teda aj s rezervou menej ako jeho tretina.

Ak na zachytenie celého frekvenčného spektra hudby s množsvom vysokých a nízkych frekvencií potrebujeme vysoký objem dát, na zachytenie frekvenčného spektra ľudského hlasu už nie.

Zjednodušený výpočet podľa Nyquist-Shannon samplovacej teórie hovorí, že na zachytenie všetkých informácií o zvuku potrebujeme použiť dvojnásobok rozsahu frekvencií použitých v danom zvuku. V prípade ľudského hlasu je to teda dvojnásobok 4 kHz, t.j. 8 kHz.

Na zmysluplné zachytenie hlasu potrebujeme aj s rezervou 8 bitovú hĺbku, čo nám dá spolu dátový tok 64 kbps (8 kHz x 8 bit).

Audioknihy a bitrate

Z vyššieho vyplýva, že audiokniha je zvukovo nenáročné médium. Z veľkej väčšiny je obsah tvorený ľudským hlasom, ktorého reprezentácia je dátovo menej náročná, ako reprezentácia hudby.

Rozsah ľudského hlasu je natoľko úzky, že 64 kbps dátový tok ho dokáže reprezentovať dostatočne kvalitne aj s veľkou rezervou.

Problém do tejto jednoduchej rovnice vnáša prahový hľuk t.j. zvuk pozadia.

Napriek tomu, že štúdiá sú odhľučnené a veľmi tiché miestnosti, zvuk pozadia je aj v nich stále prítomný. Je nedeliteľnou súčasťou frekvenčného rozsahu nahrávky.

Aby sme sa vyhli akémukoľvek orezaniu týchto „nevnímaných“ frekvencií a neorezali tak neprirodzene celú nahrávku, je istejšie použiť vyšší dátový tok, napr. 96 kbps, ktorý nechá nahrávke dostatočný priestor okolo všetkých počuteľných frekvencií a nahrávka nebude znieť plechovo.

V prípade, že v audioknihe používa vydavateľ aj jednoduché zvučky a zvukové prechody, je istejšie zvýšiť dátový tok na 128 kbps. Akékoľvek ďalšie navýšenie dátového toku sa stáva už zbytočným.

Ak zoberieme do úvahy, že hudobné časti sú len malým zlomkom celej audioknižnej nahrávky, zvyšovať dátový tok celej nahrávky je prinajmenšom neekonomické.

Netreba zabúdať, že pokiaľ je audiokniha generovaná len v mono kvalite, 128 kbps je ekvivalentom 256 kpbs stereo nahrávky. Tento bitrate je štandardom hudby dostupnej napríklad na iTunes od Apple.

Viaceré testy potvrdili, že rozdieľ medzi 64 kbps, 96 kbps a 128 kbps hovoreného slova v štúdiovom prostredí je takmer nepostrehnuteľný aj v prípade najvalitnejšieho štúdiového vybavenia.

Ak zoberieme do úvahy to, že audioknihy počúva väčšina z nás pomocou štandardných slúchadiel v prostredí s množstvom okolitého hluku, je tento rozdiel neregistrovateľný aj pre to najvytrénovanešie ucho.

Ekonomika ukrytá v dátovom toku

Limitovanie dátového toku má na pozadí pravdaže aj ekonomické dôvody. Zvyšovanie bitrate znamené zvyšovanie objemu dát nutných na prenesenie a následne na uskladnenie.

Ak je priemerná audiokniha dlhá 11 hodín, rozdiely v objeme sú na prvý pohľad znateľné :

  • 64 kbps = 310 MB
  • 96 kbps = 464 MB
  • 128 kbps = 619 MB
  • 192 kbps = 928 MB

Ak tieto dáta chceme preniesť na pomalom, alebo objemovo limitovanom pripojení, na zariadenie s limitovaným množstvom pamäte, rozdiel sa stáva o to poznateľnejší.

Audioknižný standard u nás a vo svete

Audiolibrix sa hneď pri vzniku rozhodol ísť cestou bezpečného optima. Ako sme si vysvetlili vyššie, 64 či 96 kbps by postačilo na kvalitnú reprezentáciu väčšiny audioknižného katalógu v našej ponuke. Nakoľko mnohé z ponúkaných audiokníh však obsahujú aj hudobné vložky, rozhodli sme sa celý katalóg držať v 128 kbps bitrate a len vo veľmi ojedinelých prípadoch, kde hudba tvorí signifikantnú zložku celej nahrávky v 192 kbps.
**Ako sa s rovnakým problémom vysporiadali audioknižný lídri z celého sveta?**audible.com ponúka svojim zákazníkom na výber 4 rôzne formáty :

  • Format 2 – 8 kbps
  • Format 3 – 16 kpbs
  • Format 4 – 32 kbps
  • Enhanced Format – 64 kbps

iTunes.com v audioknižnej sekcii :

  • AAC – 32 kbps

eStories.com :

  • MP3 – 32 kbps

Downpour.com :

  • MP3 – 128 kbps

Bodka na záver

Pokiaľ pri plnohodnotných hudobných nahrávkach s vysokým rozpätím frekvencií dáva vyšší bitstream poslucháčovi porovnateľne vyššiu kvalitu a teda zážitok, rovnaký prístup neplatí pre hovorené slovo a audioknihy.

Nie je to vecou tvorenia kompromisov pre nezmyselné šetrenie, ale využívanie toho, čo je dobré, vhodné a potrebné.

Nech dáme párku akýkoľvek luxusnejší obal a názov, stále to bude len párok. Možno budeme mať pri rozbaľovaní lepší pocit z toho, že ideme konzumovať niečo unikátne. Na jeho chuti a kvalite to však nič nezmení.