Delajmo skupaj, knjižnikujmo! (Let’s work together, let’s library): področje umetne inteligence
Tema umetne inteligence je bila pogosto prisotna v programu letošnjega kongresa. Tako se je že na prvem panelnem predavanju Knjižnica za odgovorno inteligenco (=Let’s library for Responsible AI), ki je potekal v organizaciji Svetovalnega odbora za svoboden dostop do informacij in svobodo izražanja (FAIFE), v bistvu dotaknilo dveh posledic rabe umetne inteligence, ki se jo bo v prihodnje uporabljalo čedalje več. Če raba umetne inteligence na eni strani ponuja številne prednosti v smislu dostopa do znanja, na primer z opisovanjem, priporočanjem, povzemanjem in prevajanjem, pa po drugi strani postavlja tudi številne etične izzive, vprašanja glede avtorskih pravic, enakosti dostopa, pristranskost, pomanjkanje razumljivosti in tveganja o zaupnosti, obsežna vprašanja zakonitosti, kot so avtorske pravice, pa tudi delavskih vprašanj. Ta vprašanja neposredno vplivajo na uresničevanje ciljev trajnostnega razvoja, kot so enakost spolov (5. cilj trajnostnega razvoja) in zmanjšanje neenakosti (10. cilj trajnostnega razvoja) ter dostojno delo in gospodarska rast (8. cilj trajnostnega razvoja).
Zaradi same narave umetne inteligence in zaradi nedvomnega globalnega vpliva umetne inteligence na družbo je bila sprejeta Izjava Ifle o knjižnicah in umetni inteligenci (=IFLA Statement on Libraries and Artificial Intelligence), ki jo je sestavil FAIFE. To je ključni dokument, ki izraža pogled knjižnice na etiko umetne inteligence. Ker se narava in družbeni učinki umetne inteligence še naprej razvijajo po vsem svetu, so v tej panelni seji predstavniki SIG AI, FAIFE in Svetovalnega odbora za avtorske pravice in druge pravne zadeve (CLM) razpravljali o aktualnih vprašanjih etike in zakonitosti umetne inteligence.
Ena smer razprav o umetni inteligenci se dotika vprašanja, kako lahko knjižnice prepoznajo etična vprašanja pri uporabi umetne inteligence v knjižničnih storitvah in kakšne smernice obstajajo za gradnjo, izvajanje in vzdrževanje odgovornih aplikacij ter usmerjanje obiskovalcev knjižnic pri njihovi lastni uporabi teh tehnologij. Druga smer gre v to, kako je pojasnjevanje umetne inteligence vse bolj osrednjega pomena za informacijsko pismenost državljanov in kako je povezano s svobodo misli in izražanja. Posledice rabe umetne inteligence se seveda zavedajo tudi področja zaščite avtorskih pravic. V Združenih državah je že več nerešenih tožb v zvezi z umetnostjo umetne inteligence. Možnosti za kršitve avtorskih pravic se recimo začnejo že s zajemanjem digitalnih kopij številnih različnih umetniških reprodukcij z interneta.
Na panelni diskusiji so sodelovali: Andrew Cox, University of Sheffield – Information School, United Kingdom, Fiona Bradley, FAIFE, AI SIG, UNSW Sydney, Australia, Sarah Powell, CLM, Australian Libraries and Archives Copyright Coalition, Australia in naša sodelavka Mojca Rupar Korošec (NUK). (Slika 1).
Torkovo jutro smo začeli z udarnim vprašanjem – Bo generativna umetna inteligenca prijatelj ali sovražnik v prihodnosti knjižničarstva? (Will Generative AI be a friend or foe in the future of librarianship?) – sklop sta organizirali Posebna interesna skupina za digitalno humanistiko in Posebna interesna skupina za umetno inteligenco.
Generativna umetna inteligenca se nanaša na področje umetne inteligence, ki se osredotoča na ustvarjanje inteligentnih sistemov, ki imajo sposobnost ustvarjanja nove in izvirne vsebine, kot so slike, besedilo ali glasba, na podlagi vzorcev in primerov iz obstoječih podatkov ter ponuja najverjetnejši ali najboljši odziv na zahtevo uporabnika. Primer takšnih orodij je podal Bryant v okviru svoje predstavitve (Slika 2).
Generativna umetna inteligenca je tehnologija, ki lahko spremeni prihodnost knjižnic. Tako kot večina novih in rastočih tehnologij so njene posledice lahko tako negativne kot pozitivne. Od oktobra 2022 naprej, ko je v javnost prišla aplikacija ChatGPT, se o generativni umetni inteligenci govori povsod, tudi v knjižnicah. Generativna umetna inteligenca ima ogromen potencial za inovacije v knjižničarskih procesih in nedvomno nosi veliki potencial, pa tudi pasti, za katere pravzaprav še ne vemo.
Ker generativna umetna inteligenca gradi na obstoječih podatkih, novonastali izdelki (podobe, slike, glasba, besedila itd.) lahko v večji ali manjši meri odražajo izvirnike. Zato je pomembno vrpašanje, koliko je novonastali izdelek izviren oziroma ali krši obstoječe avtorske pravice. Za zakonodajalce je to področje novo, kar se odraža tudi v sprejetih različnih zakonskih ureditvah, predvsem če primerjamo evropsko in ameriško. Kot primer je bilo navedeno, da v ZDA stvaritve, ki so v celoti rezultat generativne umetne intelligence, ne more biti avtorsko zaščiteno. V Združenem Kraljestvu pa so dela, ki jih ustvari umetna inteligenca, zaščitena.
V tem panelnem sklopu je tudi sodelovala kolegica Mojca Rupar Korošec, ki se je osredotočila na etično uporabo podatkov in podatkovni pismenost v knjižnicah (= Ethical data literacy in libraries) (Slika 3).
Od Gutemberga do ChatGPT: ali bo umetna inteligenca spremenila poslanstvo akademskih in raziskovalnih knjiznic? (From Gutenberg to ChatGPT: Will AI change the mission of Academic and Research Libraries?) – sklop je organizirala Sekcija za akademske in raziskovalne knjižnice.
Od svojega nastanka so knjižnice spremljale potrebe družbe in sledile tehnološkemu razvoju. Njihov glavni cilj je vedno bil ponuditi uporabniku dostop do verodostojnega in autoritativnega znanja. ChatGPT je spremenil obstoječe interakcije, temelječe na znanju, med človekom in stroji. Vprašanje se postavlja, kako bo nova tehnologija, ki nastaja na osnovi umetne inteligence, vplivala na informacijsko vlogo knjižnic oziroma na verodostojnost informacij, ki jih knjižnice zagovarjajo in ponujajo svojim uporabnikom.
Moderator tega sklopa predavanj, Lorraine Haricombe iz Univerze v Texasu, je predstavila projekcijo razvoja akademskih in raziskovalnih knjižnic v naslednjih 30 let. Po njenem mnenju bo v letu 2053 umetna inteligenca zastarela tehnologija v knjižnicah. Po mnenju Cecilije Adewumi in Adetouna A. Oyeludeja, Univerza Ibadana, Nigerija, bo ChatGPT za knjižničarje pomemben izziv, sa jim omogoča boljše informacijske poizvedbe, bolj poosebljeno svetovanje in učinkovitejše storitve. Satveer Nehra iz Univerze Savitribai Phule Pune, Indija, meni, da obsežni jezikovni modeli odpirajo možnosti za širše delovanje uredništev znanstvenih revij, saj bi omogočili objave v različnih jezikih ter dostop do informacij ne glede na znanje jezikov.
Delajmo skupaj, da razvijemo kritične mislece v dobi ChatGPT (Let’s work together to develop critical thinkers in the ChatGPT era) – sklop je organizirala Sekcija za informacijsko pismenost.
Umetna inteligenca odpira veliko izzivov, predvsem glede na verodostojnost pridobljenih informacij. Zato je ob uporabi umetne inteligence v dobi ChatGPT potrebno izdelati strategije za skupno razvijanje kritičnega mišljenja in informacijskega opismenjevanja. Pri rabi umetne inteligence je potrebno razumeti prednosti in slabosti orodij umetne inteligence, saj se jih lahko samo tako uporablja odgovorno in učinkovito. Recimo, ChatGPT je imel težave pri ustvarjanju izvedljivih potovalnih načrtov, saj je uporabil mešanico resničnih in lažnih informacij. Pozitivne ocene izdelkov, ki jih ustvari ChatGPT, bi lahko negativno vplivale na splošno kakovost informacij, saj niso nujno resnične. Uporabniki morajo razviti kritično mišljenje, da preverijo verodostojnost informacij in razvijejo informacijsko zavest in etiko. Knjižničarji jim bomo pri tem v pomoč.
Nacionalne knjižnice + umetna inteligenca: priložnosti, izzivi in tveganja (National Libraries + AI: Opportunities, Challenges and Risks) – sklop sta organizirali Sekcija za nacionalne knjižnice in Sekcija za informacijsko tehnologijo.
Shira Perlmutter, Urad ZDA za avtorske pravice v okviru svojega predavanja Umetna inteligenca in ustvarjalnost, kultura in avtorske pravice je povedala, da del vprašanj, ki jih umetna inteligenca odpira, se nanaša na zaščito avtorskih pravic: kaj bo z avtorsko zaščitenimi deli; z deli, ki so ustvarjena z orodji umetne inteligence; kaj pomeni zaužitje avtorsko zaščitenih del za namen strojnega učenja umetne inteligence in nenazadnje, kako bo umetna inteligenca vplivala na človeško ustvarjalnost ter preživetje ustvarjalcev. Zastavljajo se tudi vprašanja, kako bo raba umetne inteligence vplivala na obvezne izvode in (digitalne) knjižnične zbirke.
Rosemarie van der Veen-Oei in Dorien Haagsma, Kraljeva knjižnica Nizozemske (Umetna inteligenca z mnogimi perspektivami ali raba umetne inteligence v knjižnicah) meni, da umetna inteligenca ponuja tudi nove možnosti v knjižnicah. Dejstvo je, da z napredkom programiranja s pomočjo umetne inteligence avtomatizirano “pametno” katalogiziranje ni samo možnost, temveč zgolj vprašanje časa. Nizozemska nacionalna knjižnica raziskuje, kako bi bilo mogoče umetno inteligenco uporabiti za izboljšanje njihovih delovnih procesov.
Madireng Monyela, Univerza v Limpopo, JAR. Tudi v Nacionalni knjižnici Južnoafriške Republike raziskujejo, kako bodo orodja umetne inteligence, na osnovi katerih bodo izvajali avotmatsko katalogiacijo, vplivala na delovne procese. Seveda so pred nami tudi izzivi, vezani, na sprejemanje in uporabi umetne inteligence v katalogizaciji.
Hannes Lowagie (Prihodnost katalogizacije v Kraljevi knjižnici Belgije (KBR): Uravnoteženje koristi in tveganj tehnologije umetne inteligence) meni, da (tudi) pri nacionalnih knjižnicah gre pri uporabi umetne inteligence za dvojnost: umetna inteligenca prinaša tako tveganja kot nove priložnosti zbiranje gradiva, po drugi strani pa omogoča avtomatiziranje katalogiziranja. V Kraljevi knjižnici Belgiji je z uporabo umetne inteligence ustvarjanje bibliografskih zapisov in nacionalne bibliografije učinkovitejše, s čimer se izboljša ohranjanje kulturnega pečata Belgije. Seveda se je potrebno zavedati potencialov in tveganj odvisnosti od umetne inteligence za katalogizacijo zbirk. Delati je potrebno na piporočilih za prihodnje raziskave in implementacijo aplikacij umetne inteligence za nacionalne knjižnice.
Kar se tiče del, ki so (so)ustvarjena s pomočjo umetne inteligence, se je v nacionalnih knjižnicah potrebno vprašati:
1. Ali so dela, ki jih ustvari umetna inteligenca, primerna za nacionalno zbirko?
2. Kaj je pravzaprav kulturna dediščina v dobi umetne inteligence?
3. Kako bodo vprašanja, vezana na avtorske pravice del, ki jih proizvede umetna inteligenca, vplivala na nacionalne zbrike v prihodnosti?
Izpostavljene so bile naslednje prednosti, ki jih prinaša uporaba orodij umetne inteligence v delovnih procesih:
1. Izboljšanje učinkovitosti in natančnosti katalogizacije
2. Izboljšano ohranjanje kulturne dediščine
3. večjezično in večpisno prepoznavanje
4. nevtralno predmetno indeksiranje
5. standardizacija bibliografskih zapisov
6. lažje raziskovanje in odkrivanje.
Podatki, ki jih ustvarjajo knjižnice, v svetu strojnega učenja: etika, pristranskost in algoritm (Library data in the world of machine learning: ethics, bias and algorithms) – sklop so organizirali Sekcija za informacijsko tehnologijo, Sekcija za vsebinsko analizo in dostop ter Sekcija za katalogizacijo.
Čeprav se knjižnice spreminjajo v skladu s tehnološkim razvojem, njihovo poslanstvo ostaja nespremenjeno, in sicer omogočanje svobodnega in učinkovitega dostopa do informacij. Razvoj informacijske tehnologije pomembno vpliva na razvoj knjižničarstva. Nastajajo novi sistemi, standardi, modeli delovanja in formati podatkov ter nove spletne tehnologije, ki zahtevajo posodobljene veščine knjižničarjev in zaposlenih v knjižnicah.
Sklop se je osredotočil na izzive in priložnosti vpliva novih tehnologij na knjižnice, na etična vprašanja, ki jih ta razvoj odpira, ter na praktične pristope in tehnološke rešitve, ki se uporabljajo v knjižnicah po vsem svetu.
Haiqing Lin, Univerza v Kaliforniji, ZDA, je predstavil možnost avtomatske ekstrakcije ilustracij iz redkih kitajskih knjig. Avtomatska ekstrakcija slik in podob temelji na strojnem učenju oziroma algoritmu za prepoznavanje objektov v samih ilustracijah v kitajski poljedelski knjigi.
Angela Quiroz Ubierna, Kongresna knjižnica Chilea, je govorila o etičnosti pri uporabi umetne intelligence. Avtomatizacija del lahko privede do učinkovitejše in natančnejše katalogizacije, ampak lahko tudi izključi določeno gradivo oziroma vpliva na marginalizacijo določenih skupin, ki so manj predstavljene, npr. določene etnične skupine v Latinski Ameriki. Večina orodij umetne intelligence se uči na obsežni količini podatkov. Zato je potrebno v fazi izbire podatkov poskrbeti, da bodo ti podatki dovolj uravnoteženi.
Phyllis Tay, Nacionalna knjižnica, Singapure, je predstavil uporabo strojnega učenja pri analizi uporabnikov, njihovo uporabo knjižnice in pogostost uporabe storitev knjižnice.
Marc W. Küster, Urad za publikacije EU, Luxemburg, je predstavil orodje za semantično analizo besedil SeTA@OP, ki ga uporabljajo za polavtomatsko indeksiranje in ki tudi temelji na strojnem učenju.
Najprej utopija, grožnja ali priložnost? Umetna inteligenca in strojno učenje za katalogizacijo (Utopia, threat or opportunity first? Artificial Intelligence and machine learning for cataloguing)– sklop organizirali: Sekcija za katalogizacijo, Sekcija za informacijsko tehnologijo in Sekcija za vsebinsko analizo in dostop.
V iskanju odgovora na vprašanje, ali gre pri umeščanja umetne inteligence in strojnega učenja v metapodatkovne procese za utopijo, grožnjo ali priložnost, smo bili deležni predstavitev štirih primerov pilotnih in realiziranih projektov. Čeprav umetna inteligenca ni še dovolj razvita, da nam pomaga pospešiti postopek katalogizacije, bo pri tem v naslednjih letih igrala kritično vlogo. Trenutno so obstoječa orodja šele v postopku razvoja.
Raziskovalci iz Univerze v Leónu, Španija, so predstavili analizo orodij za generiranje besedil ChatGPT, NotionAI in Writesonic, pri kreiranju zapisov v RDA ali MARC formatu. Omenjena orodja so uporabili za katalogiziranje različnih vrst gradiva (knjig, serijskih publikacij in drugega). Z dobljenimi razultati niso bili povsem zadovoljni, a bil je storjen prvi korak pri rabi teh orodij v katalogizaciji.
V svetovnem katalogu WorldCat, ki ga vzdržujejo v OCLC (Slika 4), uporabljajo metode strojnega učenja za odpravljanje podvojenih bibliografskih zapisov. Axel Kaschte, OCLC EMEA, je predstavil, kako poteka postopek deduplikacije. Sistem prepozna do 20% duplikatov med novimi zapisi. Vendar pa preostalih 10 % do 15 % sistem ne zazna zaradi manjših razlik. Pri tem kombinirajo različne metode: kodirana polja, MinHash, orodja za označevanje (labellin tool) ali Gradient Boosting model.
Hannes Lowagie iz Kraljeve knjižnice Belgije je predstavil preizkuse in prve rezultate na primerih uporabe orodij umetne inteligence in strojnega učenja v procesih katalogizacije in upravljanja metapodatkov. V predstavljenem primeru je bil uporabljen Microsoft Power Automate, ki uporablja tehnologijo OCR in prepoznavanje dokumentov za zaznavanje metapodatkov iz skeniranih dokumentov. Uporaba umetne inteligence bistveno skrajša čas in trud, ki sta potrebna za katalogizacijo, katalogizatorjem pa sprosti čas, da se osredotočijo na druge bistvene naloge. Prav tako izboljša natančnost in doslednost bibliografskih opisov, s čimer se zmanjšajo napake in nedoslednosti v knjižničnih zapisih.
Ali je ChatGPT eksistencialna grožnja ali le slabe sanje? (Kevin Ford, Kongresna knjižnica). V Kongresni knjižnici, ZDA, so šli še korak dalje. Najprej so se takorekoč pohecali, da je potrebno katalogizatorje in informacijske strokovnjake prestrašiti. Umetna inteligenca je zelo napredovala, ko je od oktobra 2022 na voljo ChatGPT. Strojno učenje in možnost skeniranja skupaj z genereativno umetno inteligenco lahko pomeni, da se bo število katalogizatorjev v prihodnjih desetletjih bivstveno zmanjšalo. Vendar bo njihova vloga še vedno pomembna, saj bodo morali preverjati pravilnost strojno tvorjenih bibliografskih zapisov, predvesem glede na napake, ki so jih odkrili v strojno tvorjenih zapisih.
Primerjali so šest orodij umetne inteligence in vsem so dali ukaz tvoriti kataložni zapis tako v RDA kot MARC format. Na splošno rečeno, rezultati (še) niso briljantni, bili pa so več kot zadovoljivi. Še največ napak se je pojavljalo v polju za fizični opis. Navedli so ugotovitve glede vseh šestih orodij (ChatGPT, NotionAI, Writesonic, Rytr.me, Bard in Bing) (Slika 5).
Nobeno od teh orodij ni bilo oblikovano za katalogizacijo. Vsak zahtevek je dal drugačne razultate. Včasih si jim moral dati isto nalogo večkrat, da si dobil uporaben rezultat. Nekatera orodja so si manjkajoče podatke preprosto izmislila, druga so priznala, da podatkov ni. Včasih so orodja celo svetovala, kako skatalogizirati. Večina orodij je uspešno opravila lažje primere katalogizacije, pri težjih se je zataknilo. Še posebej ne dodeljujejo glavnih in dodanih vnosov. Večina orodij ni zmogla RDA katalogizacjie, razen v redkih primeri ChatGPT in NotionAI. Zaključili so, da je NotionAI dosegal najboljše rezultate, ChatGPT, Rytr.me in Bard so na splošno dali zadovoljive rezultete, za katalogizacijo pa so odsvetovali Writesonic in Bing.
Umetna resničnost/navidezna resničnost, metaverz, poglobljene tehnologije – nove metode za trajnostne skupnosti v knjižnicah (Artificial Reality/Virtual Reality, Meta-verse, Immersive technologies – New methods for Sustainable Communities in Libraries) – sklop organizirala Sekcija za informacijsko tehnologijo in Avdiovizualna in multimedijska Sekcija.
Poglobljene tehnologije (angl. immersive technologies) so lahko močno orodje za doseganje več ciljev trajnostnega razvoja na več področjih: izobraževanja, gospodarske rasti, inovacij, trajnostnih mest in skupnosti, odgovorne potrošnje in proizvodnje in podnebnih ukrepov. Omogočajo večje možnosti za vključevanje in raznolikost znostaj različnih skupin uporabnikov. Že zdaj se uporabljajo tako v galerijah, muzeji in knjižnicah.
Na tem panelu je bilo predstavljenih več primerov uporabe poglobljene tehnologije v navezavi z virtualno realnostjo.
V Nacionalni knjižnici Koreje so uporabili poglobljene tehnologije za poizvedovanje in dostop do gradiva (Slika 6).
V Nacionalni knjižnici Singapurja so fizično namenili precej prostora virtualni knjižnici predvsem starejšega gradiva, ki je sestavljena iz ekranov na zidu, ki prikazujejo slike knjige, ter miz z interaktivnimi ekrani. Namenjena je čitalniški uporabi digitaliziranega gradiva, virtualnem pripovedovanju zgodb, za razstave in 3D ogledu knjižnice. Na ta način je omogočena večja angažiranost uporabnikov, izboljšana dostopnost do gradiva, in če ne že boljše, pa predvsem drugačne učne izkušnje. Seveda taka virtualna knjižnica zahteva usposobljeno osebje. Pred odprtjem take knjižnice je potrebno razmisliti tudi o višini stroškov in izbiri programske opreme. V predstavitvi smo lahko videli, da uporabnik na mizi poišče gradivo, ki ga zanima, “vzame” gradivo iz virtualne police na steni, in jo potem podrobno prelista, bodisi na steni bodisi na mizici. Poglobljena tehnologija omogoča interaktivnost tudi znotraj gradiva (npr. animacije, poudarki, zvok).
Zanimiv je bil tudi primer indijske knjižnice Univerze za veterinarstvo in živali Guru Angad Dev, Ludhiana, Indija, ko s pomočjo virtualne realnosti in 3D animacij uspešno predajajo znanje študentom veterine, saj ne rabijo več čakati na “žive” primerke bolezni.
Poročilo je objavljeno v petih vsebinskih sklopih. Povezava na (1/5), (3/5), (4/5), (5/5).