Forstå 'Form' Af Data Til Form Vores Verden

{h1}

Ved at kigge på datasæt som mønstre først, inden der stilles spørgsmål, kan samfundet indhente den massive informationsoverbelastning, der nu opstår - og finde svar, der ikke er påvirket af bias, argumenterer gurjeet singh.

Gurjeet Singh er medstifter og administrerende direktør for dataanalyseselskabet Ayasdi. Han tjente sin Ph.D. fra Stanford i beregningsmatematik, og før han blev grundlagt Ayasdi arbejdede han hos Texas Instruments og Google. Denne Op-Ed er en del af en serie leveret af World Economic Forum Technology Pioneers, klasse 2015. Singh har bidraget med denne artikel til WordsSideKick.com's Ekspert stemmer: Op-Ed & Insights.

Vi lever i en ekstraordinær tid. Kapaciteten til at generere og gemme data har nået svimlende proportioner. Hvad der ligger inden for disse data repræsenterer chancen for denne generation til at løse sine mest presserende problemer - fra sygdom og klimaforandringer til sundhedspleje og kundeforståelse. Størrelsen af ​​muligheden er defineret af størrelsen af ​​de oprettede data - og det er forbløffende.

Verdens internetpopulation er vokset med mere end 750 procent i de seneste 15 år til mere end 3 mia. Og vil passere 50 procent penetrationsmærket i den nærmeste fremtid. Denne befolkning deler mere end 2,5 millioner indholdstyper på Facebook, tweets mere end 300.000 gange og sender mere end 204 millioner tekstbeskeder - hvert minut.

Desuden vil accelerationen i datavækst stige dramatisk i de kommende år, da tingets internet tager fat, og forbinder 20 til 30 mia. "Ting" inden 2020. Disse enheder vil transmittere data om alt fra status for din babys ble til hovedtraume oplevet af NFL-spillere, til helbredelsen af ​​din kvægbesætning. [Money Drives Vejrdata, men hvad med klima? (Op-Ed)]

Underbygning af denne eksplosion er ekstraordinære fremskridt inden for datalagringsteknologi og arkitektur. Kvalitetsjusterede priser for datalagringsudstyr faldt med en gennemsnitlig årlig sats på næsten 30 procent fra 2002 til 2014. Med en stigende pris til at gemme data effektivt til nul har institutionerne reageret ved at indhente alt muligt og acceptere den forudsætning, at hvad der ligger indenfor vil producere meningsfuld værdi for virksomheden.

Se ud over tallene

På trods af de tekniske fremskridt inden for indsamling og opbevaring ligner videnproduktion. Dette er en funktion af, hvordan organisationer nærmer deres data, hvordan de udfører analyser og hvordan de automatiserer læring gennem maskinens intelligens.

I hjertet er det et matematisk problem. For ethvert datasæt er det samlede antal mulige hypoteser / forespørgsler en eksponentiel en, i forhold til datastørrelsen. Eksponentielle funktioner er vanskelige nok til at forstå mennesker; For yderligere at komplicere sager vokser datamængden i sig selv eksponentielt og er ved at ramme et andet bøjningspunkt, da tingets internet begynder.

Hvad det betyder er, at vi står over for dobbelt eksponentiel vækst i antallet af spørgsmål, som vi kan spørge om vores data. Hvis vi vælger de samme tilgange, der har tjent os over tid - iterativt stiller spørgsmål om dataene, indtil vi får det rigtige svar - vi vil have mistet muligheden for at forstå vores generationsmulighed. [Dit liv og din fremtid, forudsagt af data]

Der er ikke og vil aldrig være nok datavidenskabere i verden til at lykkes i denne tilgang, og forskere kan heller ikke få nok borgerdataforskere med ny software til at opfylde dette behov. Software, der gør spørgsmålet om at spørge eller hypotesere udvikling mere tilgængelig eller mere effektiv, undlader at løse et kritisk problem: De vil kun falde længere bagud, da nye data bliver tilgængelige hver millisekund.

Tørring ud af form af data

For samfundet at virkelig låse op for den værdi, der ligger inden for vores data, er vi nødt til at henlede opmærksomheden på dataene, idet vi sætter spørgsmålene til side for senere.

Også dette viser sig at være et matematisk problem. Data viser sig at have form. Denne form har betydning. Dataformen fortæller dig alt, hvad du behøver at vide om dine data, fra dets oplagte funktioner til sine bedst bevarede hemmeligheder:

  • Regression producerer linjer
  • Kundesegmentering producerer grupper
  • Økonomisk vækst og renter har en cyklisk karakter (sygdomme som malaria har også denne form)

Ved at kende formen og hvor en analyse er inden for denne form, forbedrer vi vores forståelse af, hvor vi er, hvor vi har været - og måske endnu vigtigere - hvad der kan ske næste gang. Når vi forstår dataformen, forstår vi alle data i datasættet, så vi hurtigt forstår hvad der er vigtigt, hvilket reducerer antallet af spørgsmål, der skal stilles og accelerere opdagelsesprocessen.

Ved at ændre vores tænkning - og begynder med dataformen, ikke en række spørgsmål (som ofte kommer med betydelige forspændinger) - kan vi udtrække viden fra disse hurtigt voksende, massive og komplekse datasæt.

Den viden, der ligger i elektroniske journaler, fakturaer og kliniske optegnelser, er nok til at forandre, hvordan vi leverer sundhedsydelser og hvordan vi behandler sygdomme.

Hvis du er en aktuel ekspert - forsker, virksomhedsleder, forfatter eller innovatør - og gerne vil bidrage med et op-ed-stykke, mail os her.

Hvis du er en aktuel ekspert - forsker, virksomhedsleder, forfatter eller innovatør - og gerne vil bidrage med et op-ed-stykke, mail os her.

Kendskabet til de massive datalagre i regeringer, universiteter og andre institutioner vil belyse samtalen om klimaændringer og pege på svar på, hvad vi skal gøre for at beskytte planeten til fremtidige generationer.

Den viden, der er skjult af web, transaktion, CRM, sociale og andre data, vil informere et klarere og mere meningsfuldt billede af kunden og vil igen definere den optimale måde at interagere på.

Dette er en mulighed for vores generation at omdanne data til viden. At komme derhen kræver en anden tilgang, men en med evnen til at påvirke hele menneskeheden.

Læs mere fra Technology Pioneers på deres WordsSideKick.com destinationsside. Følg alle spørgsmålene og debatterne fra Expert Voices - og blive en del af diskussionen - på Facebook, Twitter og Google+. Synspunkterne er de af forfatteren og afspejler ikke nødvendigvis udgiverens synspunkter. Denne version af artiklen blev oprindeligt udgivet på WordsSideKick.com.


Video Supplement: Why all world maps are wrong.




DA.WordsSideKick.com
All Rights Reserved!
Reproduktion Af Materialer Tilladt Kun Prostanovkoy Aktivt Link Til Webstedet DA.WordsSideKick.com

© 2005–2019 DA.WordsSideKick.com