Republika z własnym badaniem exit poll  |  O projekcie nowej ustawy medialnej  |  Koszty działalności KRRiT  |  Artegence dzieli operacje  |  Świetlik i Staniszewski uruchomili serwis  |  "Królowie" w TVP 1  |  Widownia "Kabaretu na żywo. Chyba Czesuaf" w Polsacie  |  Właściciel serwisu Sweet.tv  |  "Zakup w ciemno" w TTV miał nieco mniej widzów  |  Zoom TV i Nowa TV ze spadkami  |  Sytuacja finansowa Jawnego Lublina  |  Specjalne wydanie "Pani Domu"  |  Jak dziennikarze śledczy "NYT" korzystają z AI  |  TikTok: 51 proc. dorosłych użytkowników ogląda dokumenty  |  Frisco wybrała  |  Dyrektorka ds. marketingu w BMP Consulting  |  GPD i GoldenSubmarine  |  Ministerstwo Cyfryzacji zaprasza agencje  |  Netflix zrealizuje serialową biografię Madonny  |  Amazon będzie mieć z reklam na Prime Video 1,7 mld dol.  |  Zapraszamy do newslettera "Presserwis" – dziś aż 45 newsów ze świata mediów i reklamy  |  Nowy numer magazynu "Press" już dostępny w salonach prasowych  |  Kliknij tutaj, by zobaczyć zapowiedź nowego numeru. Rozmowa z Wałkuskim, sylwetka Turskiego i pięć lat podcastu Rosiaka – polecamy!  | 

Republika z własnym badaniem exit poll  |  O projekcie nowej ustawy medialnej  |  Koszty działalności KRRiT  |  Artegence dzieli operacje  |  Świetlik i Staniszewski uruchomili serwis  |  "Królowie" w TVP 1  |  Widownia "Kabaretu na żywo. Chyba Czesuaf" w Polsacie  |  Właściciel serwisu Sweet.tv  |  "Zakup w ciemno" w TTV miał nieco mniej widzów  |  Zoom TV i Nowa TV ze spadkami  |  Sytuacja finansowa Jawnego Lublina  |  Specjalne wydanie "Pani Domu"  |  Jak dziennikarze śledczy "NYT" korzystają z AI  |  TikTok: 51 proc. dorosłych użytkowników ogląda dokumenty  |  Frisco wybrała  |  Dyrektorka ds. marketingu w BMP Consulting  |  GPD i GoldenSubmarine  |  Ministerstwo Cyfryzacji zaprasza agencje  |  Netflix zrealizuje serialową biografię Madonny  |  Amazon będzie mieć z reklam na Prime Video 1,7 mld dol.  |  Zapraszamy do newslettera "Presserwis" – dziś aż 45 newsów ze świata mediów i reklamy  |  Nowy numer magazynu "Press" już dostępny w salonach prasowych  |  Kliknij tutaj, by zobaczyć zapowiedź nowego numeru. Rozmowa z Wałkuskim, sylwetka Turskiego i pięć lat podcastu Rosiaka – polecamy!  | 

Republika z własnym badaniem exit poll  |  O projekcie nowej ustawy medialnej  |  Koszty działalności KRRiT  |  Artegence dzieli operacje  |  Świetlik i Staniszewski uruchomili serwis  |  "Królowie" w TVP 1  |  Widownia "Kabaretu na żywo. Chyba Czesuaf" w Polsacie  |  Właściciel serwisu Sweet.tv  |  "Zakup w ciemno" w TTV miał nieco mniej widzów  |  Zoom TV i Nowa TV ze spadkami  |  Sytuacja finansowa Jawnego Lublina  |  Specjalne wydanie "Pani Domu"  |  Jak dziennikarze śledczy "NYT" korzystają z AI  |  TikTok: 51 proc. dorosłych użytkowników ogląda dokumenty  |  Frisco wybrała  |  Dyrektorka ds. marketingu w BMP Consulting  |  GPD i GoldenSubmarine  |  Ministerstwo Cyfryzacji zaprasza agencje  |  Netflix zrealizuje serialową biografię Madonny  |  Amazon będzie mieć z reklam na Prime Video 1,7 mld dol.  |  Zapraszamy do newslettera "Presserwis" – dziś aż 45 newsów ze świata mediów i reklamy  |  Nowy numer magazynu "Press" już dostępny w salonach prasowych  |  Kliknij tutaj, by zobaczyć zapowiedź nowego numeru. Rozmowa z Wałkuskim, sylwetka Turskiego i pięć lat podcastu Rosiaka – polecamy!  | 

Wydanie: PRESS 03-04/2024

Warsztat: AI przepisze na wczoraj

Ogłaszamy przewrót kopernikański w prasie i internecie. Koniec spisywania wywiadów

Kiedy w lipcu 2021 roku publikowaliśmy w „Press” tekst zatytułowany „Jak (nie) spisywać wywiadu”, o tak szerokim zastosowaniu sztucznej inteligencji jak dziś nie było jeszcze mowy, choć na rynku istniało już oprogramowanie, które umożliwiało transkrypcję nagrań audio. Magdalena Rigamonti, wówczas autorka cotygodniowego wywiadu w „Dzienniku Gazecie Prawnej” (dziś w Onecie), przyznawała, że godzina nagrania oznacza dla niej dziewięć godzin spisywania rozmowy. – Przy okazji tekst układam i redaguję – wspominała.

O programach do automatycznej transkrypcji nie miała jednak zbyt dobrej opinii. W większości przypadków okazywały się nieskuteczne i kompletnie nieprzydatne, zwłaszcza w przypadku pracy nad dłuższymi formami. Oprogramowanie sprzed kilku lat trudno porównywać dziś z tym, co przyniosła w ostatnich kilkunastu miesiącach rewolucja w dziedzinie AI.

Pierwsza fala narzędzi generatywnej sztucznej inteligencji skupiała się głównie na takich możliwościach jak pisanie tekstu czy tworzenie obrazów, jednak wraz z jej rozwojem AI coraz częściej jest wykorzystywana do przetwarzania innych typów danych, w tym plików dźwiękowych. Choć to wciąż nowa technologia – czasem zawodna – to już dziś specjalistyczne oprogramowanie do wykonywania transkrypcji może wyręczyć nas w jednym z najbardziej znienawidzonych dziennikarskich zadań.

Na potrzeby naszego eksperymentu postanowiliśmy przetestować pięć programów do automatycznej transkrypcji, które potrafią rozpoznawać i przetwarzać cyfrowy dźwięk w języku polskim. W przypadku plików o bardzo dobrej studyjnej jakości większość aplikacji dostępnych na rynku ze spisywaniem radzi sobie bardzo dobrze. W codziennej dziennikarskiej pracy bardzo rzadko zdarza się jednak, by nagrania były wolne od przypadkowych dźwięków, szumów czy rozmów prowadzonych w tle. Zadanie postanowiliśmy więc utrudnić.

Pierwszym nagraniem, które wykorzystaliśmy, był początek przemówienia premiera Donalda Tuska z Marszu Miliona Serc, który odbył się w październiku 2023 roku (oryginalny plik, z którego korzystaliśmy, można znaleźć na oficjalnym profilu Tuska na YouTubie). Na nagraniu – oprócz niosącego się echa – słychać okrzyki, oklaski, kibicowskie trąbki i syreny służb medycznych.

Drugim nagraniem jest rozmowa Magdy Mołek z aktorką Sonią Bohosiewicz dostępna na kanale dziennikarki „W twoim stylu” na portalu YouTube. Wykorzystaliśmy to nagranie dlatego, że rozmowy nagrywane są w formie zdalnej poprzez dostępne na rynku komunikatory, a dźwięk nie jest idealny (choć wciąż dobrej jakości). Taka forma wywiadu jest coraz częściej spotykana także w redakcjach, może więc dawać wyobrażenie, czy programy do automatycznej transkrypcji mogą poradzić sobie z wywiadem nagranym przez Skype’a, Google Meet, czy Microsoft Teams i czy są w stanie rozróżnić głosy występujące w nagraniu.

Obok prezentujemy transkrypcję wykonaną przez dziennikarza, a w ramkach efekt pracy poszczególnych programów.

Piotr Zieliński

Aby przeczytać cały artykuł:

Zapisz się na nasz newsletter i bądź na bieżąco z najświeższymi informacjami ze świata mediów i reklamy. Pressletter

Press logo
Ta strona korzysta z plików cookies. Korzystając ze strony bez zmiany ustawień dotyczących cookies w przeglądarce zgadzasz się na zapisywanie ich w pamięci urządzenia. Dodatkowo, korzystając ze strony, akceptujesz klauzulę przetwarzania danych osobowych. Więcej informacji w Regulaminie.