Wydawcy zamieszczają zastrzeżenia, by algorytmy AI nie wykorzystywały ich treści
Według nowelizacji ustawy o prawie autorskim, która wdraża dyrektywę DSM, możliwe jest użycie treści chronionych prawem autorskim w celach komercyjnych, tylko jeśli ich właściciel nie wycofał na to zgody poprzez zamieszczenie stosownej informacji (fot. Pixabay.com)
Niektórzy polscy wydawcy już od dawna zamieszczają w swoich serwisach internetowych zastrzeżenie, by algorytmy AI nie wykorzystywały ich treści.
Chodzi o zastrzeżenie dotyczące tzw. text and data mining, czyli eksploracji tekstów i danych metodami automatycznymi lub półautomatycznymi w celu znalezienia nowych wzorców, trendów i prawidłowości statystycznych (metoda TDM jest przydatna w nauce, biznesie, a dziś także w trenowaniu sztucznej inteligencji).
Komunikat w serwisach Wyborcza.pl i Gazeta.pl
Według nowelizacji ustawy o prawie autorskim, która wdraża dyrektywę DSM, możliwe jest użycie treści chronionych prawem autorskim w celach komercyjnych, tylko jeśli ich właściciel nie wycofał na to zgody poprzez zamieszczenie stosownej informacji.
Czytaj też: "Rzeczpospolita" liderem październikowego zestawienia najczęściej cytowanych mediów
Jak pisaliśmy w ubiegłym tygodniu, niektórzy europejscy wydawcy radzą sobie w ten sposób, że publikują zastrzeżenie w swoim regulaminie na stronie internetowej. Również polscy wydawcy zamieszczają stosowne komunikaty – pojawiają się one m.in. przy kopiowaniu materiałów oraz są dostępne w specjalnych zakładkach na stronie.
I tak na przykład na samym dole serwisów Wyborcza.pl i Gazeta.pl, a także właśnie przy kopiowaniu treści wyświetla się formuła: "Właściciel niniejszego serwisu nie wyraża zgody na zwielokrotnianie ani inne korzystanie z utworów rozpowszechnionych w tym serwisie, w celu eksploracji tekstów i danych".
Do niej dołączony jest link odsyłających do strony Agora.pl ze szczegółowymi regulacjami. Czytamy tam m.in., że "zastrzeżenie nie dotyczy eksploracji treści dokonywanej w celu ustalenia pozycjonowania stron internetowych zawierających serwisy internetowe w ramach indeksowania wyników wyszukiwania wyszukiwarek internetowych".
Rozwiązania Grupy Agora i RASP
Jak przekazało nam biuro prasowe Agory, komunikat dotyczący zastrzeżenia eksploracji tekstów i danych wyświetla się na stronach wszystkich mediów Grupy Agora – w tym serwisach należących do Gazeta.pl i Wyborcza.pl – już od początku tego roku.
Czytaj też: TVN 24 liderem kanałów informacyjnych. Na drugie miejsce awansowała Republika
– W związku z wejściem w życie nowelizacji prawa autorskiego komunikat został zaktualizowany we wrześniu br. Ponadto, Grupa Agora korzysta z rozwiązania popularnego wśród anglojęzycznych wydawców, czyli tzw. pliku robots.txt, który pozwala na ograniczenie zakresu działalności automatycznych botów na naszych stronach, choć przestrzeganie tej instrukcji jest dobrowolne – przekazała nam Aleksandra Kubrak, PR manager w Agorze.
Z kolei wydawnictwo RASP informuje "Presserwis", że zastrzeżenie dotyczące eksploracji tekstów i danych wprowadziło już w październiku 2023 roku.
– Podmioty chcące eksplorować nasze treści i dane są zobowiązane każdorazowo do wystąpienia o naszą zgodę. Nie mamy obecnie planów wprowadzenia innych rozwiązań w tym zakresie – zaznaczyła Agnieszka Skrzypek-Makowska, zastępczyni dyrektora komunikacji korporacyjnej.
IWP opracowuje propozycję noty dla wydawców
Wspomniane zastrzeżenie pojawia się przy kopiowaniu tekstów: "Systematyczne pobieranie treści, danych lub informacji z tej strony internetowej (web scraping), jak również eksploracja tekstu i danych (TDM) (w tym pobieranie i eksploracyjna analiza danych, indeksowanie stron internetowych, korzystanie z treści lub przeszukiwanie z pobieraniem baz danych), czy to przez roboty, web crawlers, oprogramowanie, narzędzia lub dowolną manualną lub zautomatyzowaną metodą, w celu tworzenia lub rozwoju oprogramowania, w tym m.in. szkolenia systemów uczenia maszynowego lub sztucznej inteligencji (AI), bez uprzedniej, wyraźnej zgody Ringier Axel Springer Polska sp. z o.o. (RASP) jest zabronione" – napisano w komunikacie.
Czytaj też: Widzom najbardziej brakowałoby Polsatu i TVN, a najwięcej usunęłoby TV Trwam i Republikę
I dalej: "Wyjątek stanowią sytuacje, w których treści, dane lub informacje są wykorzystywane w celu ułatwienia ich wyszukiwania przez wyszukiwarki internetowe".
Jak przekazał nam prezes Izby Wydawców Prasy Marek Frąckowiak, organizacja opracowuje propozycję noty dla wydawców, która będzie uwzględniała kwestie związane z text and data mining. To podobna inicjatywa, jak w 2015 roku, gdy IWP sporządziła regulamin korzystania z artykułów prasowych.
Czytaj też: Natura dresiary. Rozmowa z Katarzyną Kasią, prowadzącą "Kwiatki polskie" w TVP
(MZD, 08.12.2024)