Domme data

HAL9000Van kleitablet naar papyrusrol naar perkament naar papier: voor het schrift is een ondergrond nodig en ook geschiedschrijving kan naast taal en tekens niet goed functioneren zonder drager. In de ICT ging het vooral om ponskaarten, tapes en schijven. Dragers waarbij – in tegenstelling tot het handschrift, waarbij vooral de pen beweegt – het medium beweegt en de informatie sequentieel wordt aangebracht. Ook bij de schrijfmachine is het papier dat onder de letters door beweegt.

Nu lijkt de omgeving waarin data worden vastgelegd tot stilstand te zijn gekomen. Daarmee is het verschil met onze hersenen tot een minimum gereduceerd, want ook daar zien we niet veel bewegende onderdelen. Toch is ons brein een stuk dynamischer dan het meest statische geheugen dat op dit moment bestaat: het solid state memory.

Die verandering in datadragers (informatie is toch echt wat anders) biedt ook weer nieuwe hoop voor de liefhebbers van science fiction. Het zou een hele uitdaging worden om een ponsbandlezer of tapestreamer in ons lijf in te bouwen. Of een diskette- of CD-RW-station. Al die technische oplossingen nemen ruimte in, moeten gevoed worden, produceren warmte en maken lawaai. Voor toegang tot het nieuwste geheugen is USB voldoende. Hoe kleiner, hoe onopvallender, dus we weten niet of er al mensen rondlopen met een mini-USB-poort.

In verschillende onderzoekscentra wordt gewerkt aan mens-machine-interactie in de engste zin van het woord. Aan de ene kant van dat onderzoekscontinuüm wordt geprobeerd computers te besturen met denkkracht. En aan de andere kant van het spectrum probeert men ons lichaam te leren luisteren naar computers – bijvoorbeeld door spieren te besturen met software. Tussen deze twee extremen in bevindt zich een enorm gebied waar computers en mensen de hele dag met elkaar bezig zijn. Op dit moment zijn het vooral mensen die zich hiervan bewust zijn en die een opvatting hebben over het eenzijdige karakter van die activiteit, maar het is niet uit te sluiten dat computers ooit zelf bewustzijn opbouwen. HAL 9000 (bedacht door Arthur C. Clarke, auteur van 2010, A Space Odyssey) is hiervan een fraai voorbeeld, maar Watson (IBM) bestaat echt.

Jeroen Tas (CIO Philips) speelt spelletje Jeopardy tegen Watson
Jeroen Tas (CIO Philips) speelt spelletje Jeopardy tegen Watson

Waar HAL slechts de fantasie prikkelt, dwingt Watson ons na te denken over intelligentie. Een belangrijk deel van onze huidige bepaling van intelligentie is gebaseerd op snelheid. Watson wint allerlei intelligentietestjes en quizzen van mensen, omdat het systeem beschikt over heel veel informatie en bovendien in staat is deze razendsnel te verwerken. Daarbij gaat het om algoritmen, om waarschijnlijkheid en om context die aan data is toegevoegd door mensen – metadata. Metadata is informatie over informatie. Ook een computer kan leren om fruit dat aan een boom hangt, te herkennen als fruit. Dat is een kwestie van eigenschappen van het verschijnsel fruit beschrijven. Op het moment dat we nalaten aan te geven dat een grijze appel van beton geen fruit is, kan een computer alleen maar vaststellen dat het om beton in plaats van fruit gaat, als er ook kennis over beton (kleur, gewicht, textuur) aanwezig is.

Mensen, zo is de veronderstelling tot nu toe, leren zelf onwaarschijnlijke combinaties en verbanden te interpreteren. Wij zijn goed in het (veelal onbewust) opslaan en benutten van metadata. Als we peuters laten oefenen op dierenplaatjes en geluiden, zijn we al bijna halverwege.

Om succesvol de strijd aan te gaan met mensen zouden computers meer tijd moeten hebben om zelf non stop metadata te genereren, verzamelen, rubriceren, opslaan en combineren. Ook zou aan enkele andere voorwaarden moeten worden voldaan. Zo moeten computers beter en meer kunnen waarnemen: niet alleen kijken en luisteren, maar ook voelen, ruiken en proeven en dat allemaal simultaan. De informatie die dat oplevert moet gecombineerd kunnen worden gebruikt. Met de nodige snelheid zouden ze dan wellicht met een betekenisvolle respons kunnen komen. Maar om de strijd echt te kunnen winnen moeten computers waarde en betekenis kunnen toekennen aan ideeën en waarnemingen. Om dat te kunnen, moeten ze over zowel een wil als een geweten beschikken. HAL was daarin vergevorderd, maar het betekende ook zijn einde. IBM’s Watson heeft nog een lange weg te gaan en blijft tot die tijd toch echt een zeer snelle rekenmachine.

 

Big Data – data created every minute

Data never sleeps. Every minute massive amounts of it are being generated from every phone, website and application across the Internet. Just how much data is being created and where does it come from? Published by Josh James, CEO of DOMO.

DatainOneMinute


Niets nieuws onder de zon

Accenture telt een flink rijtje bloggers. ‘Data geek’ Rene Meijers doet op zijn blogpagina een poging te betekenis van Big Data te duiden. Allereerst beschrijft hij het verschijnsel:

“In a relatively short time the concept of data is changing dramatically. Not just in volumes, which become bigger and bigger, but also in the number and type of sources this data is coming from. In todays world, most machines, tools, cars, websites, buildings etc.  store and even transmit data. And, to add to the complexity, this data is not by definition formatted in a way most of us are used to. In summary, we face higher volumes of data, coming from a higher number of sources both in a structured and unstructured way.”

Een eindje verderop vertaalt hij de betekenis van Big Data naar hoe data een rol spelen in zijn eigen leven. Eigenlijk draait hij het om: als het om data gaat, zit Meijers zelf aan het stuur. Het gaat dan om de data die zijn GPS-horloge produceert als hij aan het hardlopen is. Meijers dicht zichzelf vier rollen toe; dezelfde als in de periode toen Big Data als concept nog moest worden bedacht:

“- In my role as data owner I still decide which data I want to use to support my running.

– In my role as data sponsor, I have freed up the budget to buy the right watch, that captured the data that I, as data owner, needed to manage my running performance.

– In my role as data steward I have done a comparison between the different options offered by different watches and finally choose the one that best fitted my budget and requirements.

– And, as data steward I am still maintaining the data and determining the standards for the, for me, relevant parts of the data that are captured.

Based on this very simple example, I might conclude that, from a data governance viewpoint, Big Data is not bringing that much news.”

Afgaand op Meijers voorbeeld is er inderdaad geen nieuws. Maar hij komt niet voor niets met een simpel voorbeeld. Data-management is vanuit een technisch standpunt wellicht prima te organiseren. Toenemende complexiteit vraagt misschien om meer beheer, andere tools en om meer opslagcapaciteit en rekenkracht.

Het echte nieuws bij Big Data zit ‘m in de mate waarin mensen straks beslissingen gaan nemen over geautomatiseerde data-communicatie van objecten. Mensen moeten in de toekomst niet alleen hun eigen data managen, maar naast die enkele smartphone of tablet ook een groot aantal andere dataproducerende apparaten en voorwerpen – het gedrag van die voorwerpen inclusief hun output. De koelkast is straks niet alleen een gesloten object met een deur waardoor koude lucht naar buiten kan, maar ook een machine met een eigen datastroom die in de toekomst wellicht een relatie heeft met onze bankrekening. En wie bepaalt hoe en waarover onze auto communiceert met de dealer? De onderdelen – remblokken, een accu – communiceren in de toekomst zelf met het onderhoudsbedrijf. Met of zonder tussenkomst van de autobezitter?

Lees meer: http://www.accenture-blogpodium.nl/latest-post/big-data-what-news-does-it-bring/