Audioteka wypuściła audiobook czytany przez sztuczną inteligencję
Najnowsza produkcja miała być testem umiejętności lektorskich sztucznej inteligencji (fot. Audioteka)
Należąca do grupy Wirtualna Polska Audioteka wypuściła na rynek pierwszy audiobook czytany przez sztuczną inteligencję. Wybór padł na tytuł "Gaming na giełdzie" Pawła Sugalskiego, ponieważ zawiera wiele danych i technicznych pojęć, których czytanie stanowi obecnie wyzwanie dla AI.
Testy weryfikujące, w jaki sposób algorytmy mogą usprawnić proces produkcji audiobooków, trwały w studiu nagraniowym Audioteki od roku. Jednak twórcy zaznaczają, że AI będzie wykorzystywana jedynie w tych obszarach, w których jej specyficzne funkcje mogą podnieść jakość doświadczenia odbiorców, ułatwiając przyswojenie treści.
SI nie jest idealnym lektorem
– Idea wygenerowania audiobooka przy użyciu AI wzięła się z chęci eksploracji nowych rozwiązań i dostosowania się do zachodzących zmian – komentuje Arkadiusz Seidler, CEO Audioteki. – Chcieliśmy przekonać się, jak w praktyce przebiega praca z algorytmem sztucznej inteligencji i jakie wyzwania stawia.
Czytaj też: "The New York Times" pozywa OpenAI i Microsoft za wykorzystywanie artykułów do kształcenia SI
Sztuczna inteligencja nie jest jednak idealnym lektorem. Praca z nią zajęła dwukrotnie więcej czasu niż tradycyjne nagranie. Jak wyjaśniają twórcy – wynikało to z konieczności bardziej szczegółowego opracowania i przygotowania tekstu niż przy standardowej produkcji.
W celu dostosowania akapitu do wymagań AI najpierw generuje się go w wersji testowej. Jest to podstawa do zidentyfikowania błędów interpretacyjnych i intonacyjnych. Następnie, stosując znaki specjalne, interpunkcyjne oraz rozróżniając wielkość liter, wprowadza się korekty do tekstu i ponownie go generuje. Proces ten powtarza się aż do uzyskania oczekiwanego efektu.
Trudności sztucznej inteligencji
– Mimo że AI skutecznie rozpoznaje język i poprawnie akcentuje większość słów, to miewa trudności z czytaniem liczebników i krótkich wyrazów, które często interpretuje jako skróty. Zadaniem realizatora jest opracowanie tekstu w taki sposób, aby był on prawidłowo interpretowany przez AI – proces ten można porównać do programowania. Specjalnej transkrypcji wymagał pozornie prosty zwrot "gry online". Dopiero zapis "-GRy on'lajn" pozwalał sztucznej inteligencji na odpowiednie przeczytanie tego określenia – wyjaśnia Bartosz Sroczyński, kierownik studia nagrań i postprodukcji w Audiotece.
Czytaj też: X i Musk chcą zablokować prawo wymagające ujawniania jak radzą sobie z mową nienawiści i dezinformacją
Spółka zamierza kontynuować prace nad wykorzystaniem AI w procesie tworzenia audiobooków. Audioteka deklaruje, że ponieważ prace testowe w zakresie sztucznej inteligencji wypadły pozytywnie, jeszcze w tym roku zamierza stworzyć z użyciem AI kolejne produkcje. Firma podkreśla, że działa ze szczególną dbałością o ochronę własności intelektualnej w przestrzeni cyfrowej. Nadal priorytetem Audioteki jest nagrywanie treści we współpracy z najlepszymi polskimi lektorami i aktorami, jednak w przypadku audiobooków, których treść i fabuła mogą być wsparte przez sztuczną inteligencję, zamierza wykorzystywać technologię AI.
Do tej pory w Polsce sztuczna inteligencja czytała głosem Jarosława Kuźniara serwisy informacyjne dotyczące wojny w Ukrainie (Voice House). W lecie ubiegłego roku na antenie lokalnego Radia Piekary zadebiutowała też wirtualna prezenterka stworzona w oparciu o AI.
Czytaj też: Debata Donalda Trumpa w Fox News z większą widownią niż jego rywali w CNN
(PAR, 20.01.2024)