Utviklingen av Kinect og den virkelige betydningen av Microsoft Research

Innholdsfortegnelse:
At Kinect er viktig for Microsoft er nesten en sannhet. Redmond-fangstenheten går langt utover en enkel metode for å kontrollere videospillkonsollen og har blitt et viktig element i strategien deres og en referanse for mange av produktene deres. Men det er også et håndgripelig utvalg av hva som kan oppstå fra kombinasjonen av en bedriftsavdeling med ideelaboratoriet for Microsoft Research.
Den første Kinect var allerede et eksempel på dette. Tre år senere er det den samme fagforeningen som har tillatt enheten å utvikle seg til uante grenser for å følge utgivelsen av Xbox One.I alle sine seksjoner representerer Kinect 2.0 en betydelig forbedring i forhold til forgjengeren, og i løpet av denne uken har Microsoft benyttet anledningen til å forklare hvordan det har vært en del av gadgetutviklingsprosessen som er på vei til å bli en grunnleggende brikke i samspillet mellom mennesker og maskiner.
Kinect 1.0
Da Microsoft presenterte Project Natal på E3 i juni 2009, så mange i det et enkelt svar fra Redmond på den utvilsomme suksessen som Nintendo høstet med Wii og kontrollsystemet. Men under det prosjektet med navnet på en brasiliansk by skjulte Kinect, en enhet som viste seg å være en utvilsom bestselger og over tid har endt opp med å bli mye mer enn forventet.
Selv om teknologien bak den første Kinect ble født fra programvareutviklingen til Rare studio og bildefangstteknologien til det israelske selskapet PrimeSense, vil det være kombinasjonen av Xbox-teamet med undersøkelsene til Microsoft Research som gjør det mulig å nå markedet
Den stavformede enheten brukte en infrarød projektor og et kamera som skannet scenen og sendte informasjonen til en mikrobrikke spesielt forberedt for å fange bevegelsen til objekter og mennesker i tre dimensjoner. De fikk selskap av en rad med mikrofoner som var i stand til å gjenkjenne brukerens stemme. Alle disse elementene sammen tillot 3D-bevegelsesfangst sammen med ansikts-, gest- og stemmegjenkjenning.
For en slik oppgave var ikke Kinect-spesifikasjonene noe spesielt. Kameraet hadde VGA-oppløsning og opererte på 640x480 som standard, selv om det var i stand til å jobbe med 1280x1024 piksler på bekostning av en lavere oppdateringsfrekvens. Den medfølgende mikrobrikken utførte kun deler av arbeidet med å behandle informasjonen, og overlot en god del av oppgaven til selve konsollen.
En av nøklene til hele systemet lå i programvaren laget av Microsoft for å tolke all informasjon som samles inn av Kinect-sensorene.Det er her Microsoft Research spilte og fortsetter å spille en viktig rolle, undersøkte de mest forskjellige bruksområdene for Kinect og samarbeidet om SDK-en som Microsoft har gjort tilgjengelig på nettet siden 2011 slik at enhver utvikler integrerer det i sine produkter eller tjenester.
Kinect 2.0
Den store forskjellen mellom nye Kinect og forgjengeren ligger i det nye hovedkameraet. Den andre generasjonen av motion capture-enheten inneholder et høyoppløselig time-of-flight (TOF) kamera som lar den kommende Xbox One Kinect fange flere detaljer med høy presisjon og høyere oppløsning. Den nye dybdemodusen som tilbys av dette TOF-kameraet lar deg gjengi en scene med tre ganger mer nøyaktighet enn den første Kinect.
Dette er ikke den eneste fordelen med å bruke denne typen kamera.Med den oppnås også et 60 % større synsfelt som gjør at større plass kan registreres og gjør det mulig for flere å registreres samtidig og på kortere avstand fra enheten. Med den nye konsollen kan opptil 6 personer dukke opp på scenen, gjenkjenne og skille alle bevegelsene deres. Det er et betydelig fremskritt i forhold til forgjengeren som bare var i stand til å registrere bevegelsen til 2.
Den andre store endringen i den nye generasjonen av Kinect kommer fra hånden til den nye infrarøde sensoren som klarer å gjenkjenne objekter og mennesker under svært dårlige lysforhold. Sensoren er nå så kraftig at den kan identifisere gjenstander i et helt mørkt rom. Presisjonen er slik at den kan gjenkjenne mennesker og registrere kropper selv uten lys synlig for det menneskelige øyet. I dårlig lys gjenkjenner den stillingen til hånden opptil fire meter unna, og skiller hver av fingrene med presisjon.
Kinect 2.0 skiller brukerens komplette skjelett, orienteringen til lemmene, kroppens muskler og til og med hjerterytmen.
Kombinasjonen av de nye elementene gjør det mulig å registrere ikke bare brukerens silhuett, men også å skille hele skjelettet, orienteringen av lemmene, musklene i kroppen med kraft- og vektfordelingen utøvd på dem, og til og med hjerteslag. Ansiktsgjenkjenningen er også betydelig forbedret, og oppdager selv den minste detalj og gest og muliggjør mer presis identifikasjon. For å få en ide om hva alt dette betyr, bare ta en titt på følgende video.
All denne nye teknologien har også en forbedring i Kinect-prosessoren som gjør at den kan takle den enorme mengden informasjon som alle de nye sensorene får. Opptil 2 gigabit data per sekund samles inn av enheten for å lese miljøetAll denne informasjonen må behandles og tolkes raskt, og for dette har en åpenbar forbedring av maskinspesifikasjonene vært nødvendig.
Men å bytte komponentene har ikke vært nok. Den kraftige skanneren som Kinect har blitt, krever programvare som er i stand til å tolke alt den ser, og for dette har det vært nødvendig å gjennomføre en viktig evolusjon i koden som kjører den. Det er her erfaringen og kunnskapen til Microsoft Research har blitt viktigere enn noen gang, og hjelper Xbox-teamet der problemer oppsto og gir de riktige løsningene til rett tid. rask og effektiv. Kinect 2.0 ble dermed produktet av et samarbeid hvis historie viser potensialet som Microsoft skjuler i sitt laboratorium av ideer.
Evolusjonsprosessen
The Evolution of Kinect er historien om hvordan et team av ingeniører prøvde å bringe et TOF-kamera til Xbox One.Denne typen kameraer sender ut lyssignaler som spretter av objekter og samles tilbake ved å måle tiden det tar å reise avstanden. For at de skal fungere ordentlig, og skille refleksjoner fra gjenstander i et rom og fra miljøet, er en nøyaktighet på opptil 1/10 milliard sekunder nødvendig. Et slikt nøyaktighetsnivå er den eneste måten å gi nok informasjon til at formene og konturene til objekter kan beregnes tilstrekkelig.
Høres komplisert ut, og problemet er at det er så vanskelig som det ser ut til å nå disse nivåene med et forbrukerprodukt. Under utviklingsprosessen av den nye Kinect, måtte alle slags problemer håndteres som måtte løses på en begrenset tid. Kinect 2.0 skal være klar til å følge utgivelsen av Xbox One, planlagt til slutten av 2013.
Det er under disse omstendighetene Microsoft har et ess i ermet: Microsoft Research, din tenketankTeamet bak Kinect brukte den enorme kunnskapen og tekniske erfaringen til Microsoft Research-medlemmer til å løse de ulike problemene som dukket opp med den nye teknologien integrert i enheten. Det var her årene med investeringer i forskning og utvikling begynte å bære frukter takket være samarbeidet mellom de ulike avdelingene i selskapet.
Utfordringen var ikke lett. Å skille forgrunnsobjekter fra bakgrunnen og minimere kamerauskarphet er en skremmende oppgave. For det første måtte små objekter måles nøyaktig i alle slags scenarier og med alle slags lysforhold. Det var nødvendig å jobbe til det var mulig å skille fingrene på hendene, slik at de ikke ble forvekslet med miljøet. Som et resultat av dette arbeidet er den nye Kinect i stand til å oppdage objekter så små som 2,5 centimeter, sammenlignet med 7,5 centimeter fra forgjengeren. Problemet med uskarphet krevde litt mer arbeid og programvareoptimalisering, men over tid klarte Microsofts ingeniører å redusere bevegelsesuskarphet fra 65 millisekunder på original Kinect til 14 millisekunder på etterfølgeren.
Alle disse oppgavene krever behandling av en enorm mengde informasjon. Data som fanges opp av Kinect-kameraer er per piksel-basis, noe som betyr at hver av de 220 000 piksler som støttes av Kinect-sensoren samler data uavhengigTil dette må vi legge til mye mer informasjon samlet inn av resten av sensorene. Det kompliserte problemet er å klare å identifisere og tolke all denne informasjonen, separere elementene og dybden de finnes på og eliminere støyen fra bildet.
Med Kinect må Xbox One behandle 6,5 millioner piksler per sekund
"Xbox One trenger å behandle 6,5 millioner piksler per sekund og bare en liten del av konsollens datakraft kan dedikeres til oppgaven med å tolke informasjonen siden mest kraft må reserveres til spill, skjelett sporing, eller ansikts- eller lydgjenkjenning. Svært lite beregning var nødvendig per piksel, som krever opprydding>Uten den uvurderlige hjelpen fra Microsoft Research, ville Kinect-teamet aldri ha nådd målet sitt i tide"
Den effektive betydningen av Microsoft Research
Det kombinerte arbeidet til Kinect-teamet med folkene i Microsoft Research har ikke vært et rent rådgivende forhold. Microsoft-forskere tok på seg mye av arbeidet og bygde en hel infrastruktur og programvare for å løse problemene med å håndtere utviklingen av enheten. Kunnskapen til de to lagene på sine respektive områder gjorde det mulig å avansere raskere enn hver for seg.
Nøkkelen var hastigheten de integrerte med og evnen til å tilby løsninger på kort tid. Men alt det arbeidet er ikke begrenset til å få et produkt ut for salg. Den ekstra fordelen er at fremskritt gjort av Redmond-ingeniører er tilgjengelige for utviklere, noe som gir flere visningsmoduser å jobbe med og mye renere data.
Kinect avslører alt potensialet som Microsoft skjuler som et selskap og som avsløres når avdelingene arbeider på en integrert måte.Flere Microsoft Research-forskere har vært aktive i utviklingen av Kinect 2.0, og jobbet med et prosjekt som vil ha umiddelbar innvirkning på markedet. For de av oss som har krevd en større deltagelse av Microsoft Research i Redmond-produkter, er dette gode nyheter.
Kinect er også den håndgripelige demonstrasjonen av at Microsoft Research er mye mer enn et laboratorium av ideer, det er en grunnleggende kapital for fremtiden til Microsoft .
Via | Den offisielle Microsoft-bloggen | TechCrunch