Microsoft Research oppretter et system som er i stand til å generere "smarte" bildetekster automatisk

Innholdsfortegnelse:
Du har sikkert kommet over en bildetekst som er forvirrende, feil eller sier lite om bildet den refererer til; og det er til og med mulig at hvis du dedikerer deg til å publisere dine egne artikler, finner du det mest kjedelig å fylle ut denne delen. Vel, folket fra Redmond har laget et verktøy som tar sikte på å gjøre ting enklere for deg.
Et verk publisert av Microsoft Research som beskriver seg selv som et "bildetekstgenereringssystem" som er i stand til å etterligne de narrative egenskapene til menneskelig språk, det vil si en teknologi som kan beskrive skjermbilder som om de handler om en av oss, med tilhørende kontekst.Noe som selskaper som Facebook, Microsoft og Google har jobbet med en stund, men denne gangen går det over forventningene.
Hva består den av
På denne måten har systemet muligheten til å fortelle en fullstendig historie fra flere bilder, beskrive den og fortelle den som om det var en bok. Et verktøy som ifølge eksperter kan ende opp med å bli en funksjon som gir et mer menneskelig preg til visse applikasjoner, stemmegjenkjenningsapplikasjoner, automatisk generering av beskrivelser på andre områder og mye mer.
Og faktum er at verktøyet ikke er begrenset til å si, kort, hva det "ser", men snarere gir et bredere konteksten av situasjonen som reflekteres i bildet, og oppnår en "narrativ kontekst og en unik fortellerstil", forklarte Frank Ferraro, en av forfatterne av dette verket.For å sette oss selv i en situasjon gir han oss et tydelig eksempel
Derfor foreslår følgende sak: «La oss tenke oss at vi har et fotoalbum av noen venner som har feiret en bursdag i en Pub. Noen av de første bildene viser folk som bestiller øl og drikker det, mens de siste viser noen som sover på en sofa», kommenterer han.
Et konvensjonelt system "kan rett og slett peke på at det er en person som ligger på en sofa, mens systemet vårt kan inkludere at de sannsynligvis er i den situasjonen fordi de er fulle etter å ha drukket noen drinker". Et tillegg som gir forståelse og en viss følelsesmessig ladning som også gjenspeiles gjennom bildene og bildetekstene som er inkludert i denne artikkelen.
Via | MIT Technology Review
I Xataka Windows | Microsoft lanserer en app som bestemmer hundens rase