ANNONS

Storytel: Talsyntes verklighet inom en inte alltför avlägsen framtid

Mikael Holmquist, ansvarig för appar och hemsida på Storytel.

På Storytel följer man noga den tekniska utvecklingen inom talsyntes. Att lyssnaren själv kan välja inläsare till en bok verkar inte längre omöjligt.

– Vi på teknikavdelningen följer utvecklingen inom talsyntes med mycket stort intresse. Att kunna ”välja inläsare” till en bok man vill lyssna på lät för bara några år sedan som en komplett omöjlighet om man inte nöjde sig med att välja mellan olika supermonotona robotröster. Med med de senaste årens enorma utveckling inom AI och Machine learning, är detta inte sci-fi längre utan verklighet, säger Mikael Holmquist som är ansvarig för appar och hemsida på Storytel.

Boktugg skrev nyligen om de tekniska genombrott för talsyntes som har skett under det senaste året med flera AI-bolag som tittar på tillämpningar främst inom olika digitala assistenter men även för att läsa upp texter, och ljudböcker.

Den här artikeln är INTE låst.

Om du har möjlighet, hjälp oss gärna att hålla våra nyhetsartiklar olåsta utan betalvägg. Köp en stödprenumeration och bli en Boktugg INSIDER. Avsluta när du vill.

35 kr/mån 350 kr/år
Eller valfritt engångsbelopp via Swish.

– Under året har vi sett exempel på talsyntes-algoritmer som inte bara kan producera de mest människolika genererade rösterna vi någonsin hört utan kan också tränas att efterlikna specifika människors röster, så länge man har tillräckligt med träningsdata. Just träningsdata är ju något det inte råder någon brist på hos Storytel. Vi har ett enormt bibliotek med röstinspelningar av hög kvalitet, inspelade i ideala förhållanden, säger Mikael Holmquist.

Så frågan är förstås: Hur länge dröjer det innan Storytelkunder själva kan välja röst på uppläsaren när man ska lyssna på vilken ljudbok som helst?

– Vill inte avslöja några detaljer, men förutsättningarna finns för att detta ska kunna bli verklighet på Storytel inom en inte alltför avlägsen framtid, säger Mikael Holmquist.

En fråga som genast dyker upp är förstås vad som händer med skådespelarna – kommer de att konkurreras ut av datoralgoritmer och vara hänvisade till att lämna röstprover och licensiera ut sina röster?

ANNONS

– Jag tror inte röstskådespelarna behöver vara särskilt oroliga än på en stund. För en del kunder, som föredrar så lite dramatisering som möjligt och nära på monotona inläsningar skulle förmodligen tekniken som finns redan idag vara tillräcklig för att vilja använda. Några av våra mest populära inläsningar är dock sådana där inläsaren dramatiserar mer, ger karaktärer olika röster och så vidare. Något som skulle kräva några stora steg till innan det blir möjligt.

Även om just talsyntes, även känt som text-to-speech, fortfarande ligger något eller några år framåt i tiden så använder sig Storytel redan av den motsatta tekniken.

– Vi använder röstigenkänning (sound-to-text) för att möjliggöra en funktion vi har i vår app där användaren sömlöst kan växla mellan att lyssna på ljudboksversionen och läsa eboksversionen av samma bok, säger Mikael Holmquist.


❤ Gillade du den här artikeln? Vi hoppas det.
Kanske fick du lite kunskap eller tips eller bara ett gott skratt… I så fall har vi lyckats. Som du märkte slapp du betalvägg, eftersom vi vill välkomna nya läsare och göra det enkelt för trogna boktuggare. Om du gillar det vi gör och har möjlighet tar vi gärna emot ditt bidrag. En slant som tack för en bra artikel eller en stödprenumeration för att du läser varje vecka. Stötta den hårdast arbetande lilla redaktionen i landet.
35 kr/mån 350 kr/år

Dela på facebook
Dela på twitter
Dela på linkedin
Dela på email
Dela på print
Sölve Dahlgren

Sölve Dahlgren

Sölve Dahlgren är journalist sedan 25 år tillbaka och författare till nio böcker. VD och chefredaktör för Boktugg.

solve@boktugg.se