BloombergGPT wyznacza kierunek dla dużych wydawców w zakresie AI
Model językowy Bloomberga od podstaw był tworzony z myślą o finansach (fot. materiały prasowe)
Bloomberg pochwalił się modelem sztucznej inteligencji (AI) stworzonym dla potrzeb sektora finansowego. Został on przeszkolony na olbrzymiej bazie danych znajdujących się w zasobach agencji. W ten sposób Bloomberg pokazał wydawcom, że mogą opracowywać modele językowe przydatne dla różnych branż i mogą konkurować nimi z popularnymi modelami ogólnymi.
BloombergGPT powstał w celu analizowania danych i do tworzenia materiałów w języku naturalnym (NLP) dla branży finansowej. To pierwszy tak duży model AI stworzony z myślą o tym segmencie. Z prezentacji Bloomberga wynika, że jego generator nie tylko odpowiada na pytania i klasyfikuje wiadomości, ale też analizuje nastroje panujące na rynkach. Ma umożliwiać pełniejsze wykorzystanie masy danych dostępnych w terminalu Bloomberga.
Czytaj też: Zapowiada się pierwszy na świecie pozew przeciwko ChatGPT
Joshua Benton, założyciel i publicysta NiemanLab, napisał, że o BloombergGPT należy myśleć jak o wielkim komputerze, który chce wiedzieć wszystko, co wie firma.
Maszyna BloombergGPT była uczona na zestawie 363 mld tokenów danych Bloomberga (głównie raportów finansowych napisanych w języku angielskim) i 345 mld tokenów danych ogólnodostępnych (m.in. zawartość Wikipedii). Ostatecznie korzysta na bieżąco z 50 mld parametrów. Dla porównania GPT-3 firmy OpenAI został przeszkolony na 500 mld tokenów i korzysta z 175 mld parametrów, ale ten model nie jest ograniczony do jednej dziedziny, służy do generowania tekstów na dowolne tematy.
– Model BloombergGPT, który ma 50 mld parametrów, przewyższy inne modele w zadaniach finansowych, takich jak analiza danych. Jego sukces może wynikać też z tego, że w przeciwieństwie do innych modeli, które były szkolone na publicznych danych internetowych, połowa danych BloombergGPT była dotąd zastrzeżonymi danymi Bloomberga – komentuje Paweł Nowacki, niezależny konsultant rynku mediów, właściciel firmy DigitalFlow.pl.
Czytaj też: Nowa kampania reklamowa Blika wykorzystuje ChatGPT
Szef zespołu Bloomberg ML Product and Research Gideon Mann, zachwalając model swojej firmy, podkreśla, że właśnie jakość modeli uczenia maszynowego i NLP zależy od danych, które są w nich umieszczane. Przewagą projektu stworzonego przez jego zespół jest to, że bazował on na raportach i analizach finansowych tworzonych od 40 lat według schematu Bloomberga – to nie tylko bardzo duży zbiór, ale też weryfikowany i co do zasady pozbawiony błędów.
– Firmy z obszernymi, zamkniętymi zbiorami danych mogą pójść za przykładem tego wydawcy i próbować zbudować własne modele AI dostosowane do ich potrzeb biznesowych. Pewna prawidłowość w interpretacji oczekiwanych zmian, jakie niesie AI, ciągle się powtarza: to nie AI zastąpi dziennikarzy i wydawców, którzy tego się boją, ale zastąpią ich dziennikarze i wydawcy, którzy umiejętność korzystania z możliwości sztucznej inteligencji włączą do własnej pracy lub biznesu – podsumowuje Nowacki.
Czytaj też: Google uruchomiło nowe narzędzie do weryfikacji stron. Walka z dezinformacją
(GK, 11.04.2023)