Ljudboksvågen som kan spola bort textboken

Ljudvågorna från audioböcker spolar bort textböckerna.

Bokbranschen surfar på en ljudboksvåg. Frågan är förstås om eller när den kommer att brytas och hur stor del av textboksläsningen som spolas bort.

Den här krönikan har jag gått och grunnat på hela sommaren. Var och varannan dag läser jag rapporter från hela världen om hur ljudboksförsäljningen växer, inte bara i form av streaming utan även download.

Vad ligger bakom ljudboksvågen och hur kunde ett format som för fem-tio år sedan var marginaliserat plötsligt vara på väg att ta över? Det enkla svaret är förstås digitaliseringen. Ljudböckerna var visserligen digitala i någon mån redan tidigare eftersom de lagrades på CD-skivor och efterhand som MP3-formatet fick stöd så minskade behovet av de tjocka travarna och böcker fördelade på 15 stycken ljudboks-CD-skivor. Men likväl – den fysiska skivan som bärare var avskräckande.

Jag kan bara se på mina egna vanor. Jag lyssnade aldrig på ljudböcker innan Storytel slog igenom. Tanken på att hålla på med en massa CD-skivor var en tröskel. Kanske rädslan för att när man lyssnat på de första tolv skivorna skulle finna att skiva nr 13 var försvunnen. Eller att man skulle råka stoppa i skiva nr 9 istället för nr 6 och först senare märka att jag tappat bort ett par kapitel?

Tekniken bakom ljudboksvågen

Det är flera olika faktorer som gjort att ljudboksvågen tagit fart. Den tekniska utvecklingen med högre kapacitet på bredband även mobilt har gjort att vi kan ladda ner en hel ljudbok på några minuter – eller strömma den efterhand som vi lyssnar. Våra mobiltelefoner har blivit kraftfulla datorer med större lagringsutrymme och kapacitet att fungera som musikspelare. När musiken flyttade in i mobiltelefonerna så följde med det intresset för bättre hörlurar vilket i sig blev en fördel för ljudbokslyssnandet.

Trådlösa hörlurar som täcker hela örat istället för jobbiga öronsnäckor, där har ni en faktor som kanske inte alla tänker på.

Det finns många andra fördelar med ljudboken. Du kan lyssna på en bok samtidigt som du gör något annat (lagar mat, tränar, klipper gräset, diskar, åker bil/tåg/buss/cykel osv). Det gör helt enkelt att den som inte har tid att läsa ändå kan hitta tid att lyssna på böcker.

Ur förlagets perspektiv finns en nackdel med ljudböcker – det kostar pengar att producera. Nya kostnader samtidigt som alla andra kostnader finns kvar för redigering, korrekturläsning, formgivning och allt annat som hör till vid en traditionell utgivning på papper. För en bästsäljare är det ingen tvekan om att det lönar sig, men för en smalare titel kan det ta tid innan ljudboksinläsningen blir en plusaffär.

Samtidigt så innebär ljudboksvågen att backlist får ett nytt liv, precis som med eböckerna. Det finns ingen upplaga som kan ta slut, de digitala filerna är alltid tillgängliga. Eller rättare sagt, det finns problemet med att rättigheter går ut och författare som byter förlag kan leda till att en ljudbok som funnits i flera år över en natt plötsligt försvinner från streamingtjänsterna. Något som hände Jo Nesbø i samband med flytten från Piratförlaget till Bonniers förra året.

Kostnaderna för att spela in ljudböcker har visserligen sjunkit i takt med att tekniken blivit billigare. En ljudboksstudio går idag att bygga upp mycket billigare än för tio-tjugo år sedan. I vissa fall kan lyssnare acceptera en sämre inspelning precis som med podcastare och youtubers. Men i andra fall så ökar snarare kraven på att det är professionellt klippt och superbt ljud.

Kanske är det här som de stora förlagen kan skilja ut de stora titlarna från de mindre titlarna? Genom att öka ljudboksbudgeten och lägga till ljudeffekter eller rentav flera skådespelare – för de lyssnare som vill ha det vill säga. En del föredrar inläsare som dramatiserar, adderar olika röster för olika karaktärer och som läser med inlevelse. Andra vill hellre att inläsaren inte tar plats, läser med neutral och tydlig röst och låter lyssnaren själv bygga upp sina intryck i huvudet precis som när man läsar en bok.

Talsyntes för ljudböcker

Nästa steg är förstås att även inläsarna digitaliseras. Talsyntes finns redan idag, ett flertal bolag jobbar med att utveckla text-till-tal. Främsta användningsområdet är att göra olika webbplatser tillgängliga för synskadade eller de som av andra anledningar har svårt att läsa. Man ska helt enkelt kunna få texter upplästa för sig.

Den här tekniken blir bättre och bättre. Man kan tänka sig att den inom några år är tillräckligt bra för att ersätta inläsaren i studion. Förlagen kan komma att välja en talsyntesproduktion. Rösten är fortfarande baserad på en verklig person som fått läsa in mängder av ord till en röstbank. Ju större underlag, desto bättre kvalitet. En produktionsstudio skulle då kunna producera en ljudbok på mindre än 48 timmar från en textfil. Kanske rentav på någon timme om man bortser från korrekturlyssning.

Men, kommer det inte att låta hemskt när den här digitala rösten ska läsa upp ortsnamn eller namn på personer som den inte vet hur de ska uttalas? Nej, det går givetvis att koda fonteiskt i textfilen. Det går också att koda ifall något parti ska betonas eller viskas. Ifall det ska läsas snabbt eller långsamt. Epub3-formatet har redan stöd för kodning av audiouppläsning.

Det skulle inte vara svårt att bygga vidare och låta en ljudbok bli en dramatisering genom att använda flera olika röster i en sådan här produktion. Att producera en ljudbok med flera olika skådespelare i studion för att exempelvis göra de olika karaktärerna röster är dyrt, men att bara lägga in det i källkoden till eboken och sedan låta systemet läsa upp repliker med olika röster skulle vara enkelt.

Nästa utvecklingssteg blir förstås att appar från exempelvis streamingtjänster får stöd för talsyntes. Då blir det plötsligt möjligt att välja uppläsare själv, kanske ladda ner sina favoritröster, och få boken i örat även om boken inte finns som ljudbok. Och byta uppläsare mitt i boken ifall man tröttnar.

Du inser kanske nu att ljudboksvågen bara har påbörjats. Redan idag finns det mobilappar som du kan använda för att fotografera en sida med text, låta programvaran ocr-tolka den och förvandla till bilden till text och därefter få den uppläst. Bäst funkar det förstås på engelska och andra stora språk, men tekniken utvecklas hela tiden.

Behöver vi kunna läsa själva i framtiden?

Det självklara svaret på frågan ”behöver man kunna läsa?” blir inte längre givet ”ja, självklart” när du med teknikens hjälp kan få precis vilken text som helst uppläst för dig. Och dessutom översatt till valfritt språk.

Jag kan själv villigt erkänna att jag de senaste tre åren har lyssnat till fler böcker än jag har läst. Det beror helt enkelt på att det är lättare att hitta tid för att lyssna på böcker än att läsa dem.

Samtidigt predikar jag att barnen ska lära sig läsa eftersom det är helt avgörande för deras möjligheter att klara av skolan. Att kunna läsa och förstå text liksom att kunna uttrycka sig i skrift är ovärderligt.

Men så läser jag om hur tekniken utvecklas och plötsligt slår det mig. Är det verkligen självklart att man måste kunna läsa själv om några år? Kommer inte undervisningen i skolan att gynnas av att man inför mer ljudböcker än textböcker för att undvika att dyslexi eller andra läshinder påverkar inlärningen?

Den här insikten är viktig även för bokbranschen. En del har kanske konstaterat att eboken inte har fått det genomslag som vi trodde att den skulle få. Men det som sker är kanske att eböcker inte främst kommer att läsas – utan lyssnas. Eböcker i epub-format blir källkoden för framtidens ljudböcker.

Okej, låt oss ta en liten reality check innan vi utropar inte pappersbokens utan till och med textbokens död. För visst finns det fördelar med textböcker också.

Även om det går att styra hastigheten på uppläsningen i apparna så är det fortfarande mycket enklare att göra det när du själv läser texten. Du kan som läsare bestämma tempot och växla mellan att skumma och att stanna upp och till med läsa ett stycke flera gånger. Fundera över vad ett ord betyder och rent av slå upp det. Dessutom är det svårt att lyssna lika fort som en riktig snabbläsare klarar av.

Att stanna upp i en ljudbok är krångligare och ofta bemödar du dig inte med att göra det. Det här kommer säkert att förändras i takt med att röststyrning blir vanligare och bättre. När du säger ”pausa” eller ”spola tillbaka 30 sekunder” eller ”läs om stycke” så är det mer intuitivt än att leta på mobilens skärm efter en knapp för att pausa eller spola.

På samma sätt är det enklare att skumma en text, snabbläsa mellanrubriker för att komma vidare. Att repetera en text exempelvis är givetvis enklare när den är i textform. Även saker som att stryka under är svårt att återskapa i en ljudbokslyssning. Å andra sidan har du båda händerna fria för att anteckna ifall du lyssnar istället för att läsa…

En annan möjlighet som text erbjuder men som inte ljudboken har är givetvis sökning. Det har å andra sidan inte textboken i pappersformat heller, bortsett från ifall den innehåller ett index eller register. Och även här när ljudboken har en källkod i form av epub-filen så blir sök ingen omöjlighet. Däremot kanske lite svårare att presentera ett sökresultat i ljudformat?

Ljudboken dödar textboken eller?

Så kommer ljudboken att döda textboken? Nej, givetvis inte. Men om textboken kommer att ha 80, 50 eller 10 procent av marknaden är betydligt svårare att förutspå.

Kommer förmågan att läsa text att ha lika stor betydelse i framtiden? Nej, förmodligen inte. Däremot kommer det att vara en eftertraktad förmåga eftersom källkoden under lång tid framöver kommer att kräva att en människa skriver den. Eller ja, Microsoft har ju utvecklat en programvara för att konvertera tal-till-text som har bättre träffsäkerhet än en mänsklig sekreterare i genomsnitt. Så i princip kan du som författare diktera och få ut ett manus i textform som sedan distribueras som en epubfil och konsumeras som ljud. Själva redigeringsarbetet lär dock vara svårt att göra på något annat sätt än i textform även om det inte är otänkbart med audiovisuella verktyg som kan generera källkoden trots att man lyssnar och läser in ändringar.

Själv funderar jag givetvis över hur den här utvecklingen kommer att påverka Boktugg. Ska alla artiklar i framtiden även kunna lyssnas på? Även om jag är övertygad om att bokbranschen är en av de branscher som kommer att ha störst andel läskunniga även framöver.

Extraläsning (som om inte den här långa artikeln skulle räcka): för tio år sedan skrev jag en novell som gav en bild av en framtid där läsning kanske inte var en lika given kunskap som idag. Den ligger fortfarande på min blogg: Bara en massa bokstäver.

Bilden, foto: Fotolia.

Stödprenumeration. Boktugg Mini (från 10,42 kr/mån) ger tillgång till vissa premiumartiklar.


Sölve Dahlgren

Sölve Dahlgren

Sölve Dahlgren är journalist sedan 30 år tillbaka och författare till mer än tio böcker. VD och chefredaktör för Boktugg.

solve@boktugg.se

Gör som ...

… och alla våra andra sponsorer som stöttar oss ekonomiskt. Vill ditt företag bli sponsor? Kontakta sales@boktugg.se för mer information. Privatpersoner och mindre företag som vill bidra swishar valfritt belopp till 123-483 18 71 (klicka här för QR-kod) eller med andra betalmedel.

Lucas Lund deckardebuterar med ”Morden på Park Lane”

”Morden på Park Lane” är en berättelse som riktar sig främst till dig som gillar spänning och mordgåtor, här i brittisk miljö.

Den förmögne Angus MacFergus bor i ett stort hus i centrala London tillsammans med sin syster,