ANALYSBREVET
Söndagsbrev. Dagens Analysbrev Àr lite annorlunda Àn vanligt. Det krÀver nÀmligen att man klickar sig vidare, loggar in och lÀser sista delen pÄ sajten. Det har att göra med flödet bakom kulisserna och Àr samtidigt ett test.
Ămnet för dagen Ă€r AI-röster och tanken föddes utifrĂ„n att jag lyssnade pĂ„ tvĂ„ olika podcasts som bĂ„da tog upp fenomenet ur lite olika perspektiv.
/Sölve Dahlgren
chefredaktör
Du fÄr detta nyhetsbrev för att du eller din arbetsgivare tecknat en prenumeration pÄ Boktugg Insider. För att hantera din prenumeration kan du logga in pÄ boktugg.se och gÄ in pÄ Mitt konto.
DAGENS ANALYSBREV
SpökinlÀsare nÀsta trend
I takt med framstegen inom generativ AI sprider sig teknikpaniken. NÀr allt fler författare tar offentligt avstÄnd frÄn att lÄta sina böcker bli ljudböcker med AI-röster blir den logiska slutsatsen att spökinlÀsare blir nÀsta trend.
Vi har skrivit alldeles för lite om AI i Analysbrevet. Delvis för att jag kÀnt att det hÀnder saker precis hela tiden och det jag skriver idag Àr inaktuellt imorgon. Men ocksÄ för att AI mer Àn nÄgot annat Àr ett verktyg, eller snarare en teknik som kommer att byggas in i alla de verktyg vi anvÀnder redan idag.
Faktum Àr att AI, eller Ätminstone maskininlÀrning, Àr en del av nÀstan alla verktyg som anvÀnds i bokbranschen frÄn Word till Photoshop. Skillnaden Àr att vi nu kommer att ta nya stora tekniksprÄng.
Boktugg skrev om talsyntes lÄngt innan det blev ett debattÀmne och döptes om till AI-röster. För snart tvÄ Är sedan kom ett Analysbrev med rubriken Fem steg till sjÀlvlÀsande böcker via ljudböcker med talsyntes. Den ger ett historiskt perspektiv och en bra bakgrund till resonemanget i detta Analysbrev.
UtifrÄn den skala som jag ritade upp dÀr sÄ befinner vi oss just nu nÄgonstans mellan nivÄ 4 och 5.
4. Naturlig röst. Genom inlÀrning byggs modeller av röster och tal Äterskapas sÄ att de inte gÄr att skilja frÄn mÀnniskan. Men det krÀvs fortfarande en producent (mÀnniska) som kan gÄ in och justera felaktiga uttal av ord, tempo, betoningar och sÄ vidare.
5. SjĂ€lvlĂ€sande. Algoritmerna har nu lĂ€rt sig att sjĂ€lva tolka hur en text ska lĂ€sas, precis som mĂ€nskliga inlĂ€sare. Uttal av ortsnamn eller ord baseras pĂ„ preferenser samt data frĂ„n miljontals timmar inlĂ€sta ljudböcker. MĂ„nga kommer pĂ„ denna nivĂ„ att anse att talsyntes ger bĂ€ttre resultat Ă€n med mĂ€nsklig inlĂ€sare. Producentens roll blir hĂ€r att instruera och ge kontext. Och genom att Ă€ndra denna kan hela ljudboken genereras pĂ„ nytt â kanske pĂ„ nĂ„gra fĂ„ sekunder.
NĂ€r Storytel för drygt en mĂ„nad sedan introducerade AI-röster pĂ„ engelska sĂ„ att lyssnare kunde vĂ€lja mellan dels originalinlĂ€sningen och dels ett par AI-röster har tonlĂ€get i debatten nĂ„tt en ny nivĂ„. Den har pendlat mellan att avfĂ€rda resultatet som uselt och att âdet dĂ€r kan aldrig ersĂ€tta en mĂ€nniskaâ till mer öppenhjĂ€rtig panik över att inlĂ€sare kan komma att förlora sina jobb om vi accepterar AI-röster.
VÄga vÀgra AI-röster
Flera författare har gÄtt ut och deklarerat att de minsann aldrig skulle tillÄta att deras böcker lÀstes in (eller upp) av nÄgot annat Àn en mÀnniska av kött och blod.
Och det Àr naturligtvis lÀtt att sÀga ifall man skrivit böcker som lyssnas tillrÀckligt mycket för att förlaget ska vilja investera inte bara i en okÀnd skÄdespelare med bra röst utan Àven en eftertraktad stjÀrninlÀsare som Àlskas av lyssnarna.
Flera lyssnare pÄpekade genast att de bara lyssnar pÄ böcker av de inlÀsare som de gillar. Samtidigt var det just dessa ljudbokslyssnare som levererade ett tungt argument för AI-röster. Att det finns de som vÀljer bort en bok pÄ grund av att de inte gillar inlÀsaren.
DÀrför Àr förstÄs Storytels voice switcher ett smart alternativ för dessa lyssnare och ljudböcker.
Men bÄde författare och inlÀsare kan lista ut att det finns miljoner skÀl för Storytel (och alla andra bokförlag) att inte stanna dÀr.
Om ljudboksproduktionen kostar lika mycket som hela det redaktionella arbetet med manus sÄ Àr det klart att förlagen ser en möjlighet att spara pengar ifall man kan producera ljudboken med AI-röster.
Ett podavsnitt som Äldrades snabbt
I mĂ„ndags slĂ€pptes det nya avsnittet av Förlagspodden dĂ€r Lasse Winkler och Kristoffer Lind som tidigare varit imponerade av AI-röster redan i rubriken deklarerade âlite överraskande Ă€ven för oss sjĂ€lva, tror vi inte lĂ€ngre pĂ„ robotrösten som nĂ„got vĂ€rlden kommer att bry sig om.â De bĂ„da har aldrig gjort sig kĂ€nda för att vara politiskt korrekta utan alltid sĂ€ga vad de tycker. Annars hade man nĂ€stan kunnat tro att de höll inne med nĂ„got.
TIDIGARE ANALYSBREV
I arkivet hittar du tidigare utgÄvor av Analysbrevet. MÄnga av dem Àr lika relevanta idag som nÀr de skrevs. HÀr Àr nÄgra av de senaste utgÄvorna ifall du missat dem.
ARKIV: Tidigare utgÄvor av Analysbrevet hittar du hÀr >>
TIPS: FĂ„ ut mer av Boktugg
Aktuella debutanter – se till att ditt förlags debutanter finns med hĂ€r >>
Bli sponsor och stötta det fria innehÄllet pÄ Bokugg >>
Kolla in alla som redan Àr med och sponsrar >>
Se till att författarsidor och förlagssidor Àr uppdaterade i vÄr databas >>
Kolla in FrĂ„ga Boktugg – stĂ€ll egna frĂ„gor om det saknas >>
Och tipsa oss om Àmnen till Analysbrevet eller vanliga artiklar/reportage pÄ sajten. Skicka ett mejl till tips@boktugg.se