I dag blev Tagger.dk officielt erklæret for åbent. Tagger.dk er udviklet TV2, Ritzau, Børsen, Ingeniøren, DBS, UniMedia & FDB i samarbejde med Center for Sprogteknologi ved Københavns Universitet og bringer det semantiske web til Danmark.
Hvad er det semantiske web?
Computere er drøngode til at processere data, men de er dårlige til at skabe relationer mellem data. Mennesker ved per intuition, at fodbold er en slags sport, som er en slags fritidsbeskæftigelse, en hobby og et mediefænomen. Det semantiske web handler grundlæggende om at tilføre viden, mening og betydning til data. Det vi som art er født med evner indenfor.
Forsøgene har været mange — der er blevet postet millioner og milliarder i kunstig intelligens, og succesen har været begrænset.
Det semantiske web og Googles guldfugl, Applied Semantics
En af de største succeser er nok Googles opkøb af Applied Semantics, der via algoritmisk udnyttelse af WordNet-ontologien (en slags hierarkisk inddeling af datarelationer a la fodbold -> sport -> hobby). Prisen var 102 millioner dollars, men de penge er tjent voldsomt ind igen, for Applied Semantics leverede den sorte boks til Googles fornemste indtjeningsprodukt, nemlig Adwords. Det er semantisk matching, der gjorde det muligt for Google at lancere et reklamenetværk, hvor sideindhold blev matchet til annoncer, der passede til indholdet. Automatisk. Præcist. Og effektfuldt. Google omsatte i 2010 for omkring 28 milliarder dollars, og langt den største del af indtjeningen kommer fra Adwords-prorgammet.
Nu kommer det semantiske web til Danmark, og det er en stærk konstellation, der står bag open source-lanceringen Tagger. Der er tilstrækelligt med data i Informations arkiver til at danne et solidt korpus.
Et projekt, jeg glæder mig til at følge, herunder en eventuel kommercialisering.
Related posts:

Pingback: Fredagslinks uge 25 | Brian Brandt