De data spreken voor zichzelf

Discussies over big data beginnen steeds meer te lijken op de discussie over de opwarming van de aarde. Dat de aarde geleidelijk opwarmt, mag als een feit worden beschouwd, bij het nadenken over mogelijke gevolgen zijn we afhankelijk van de betrouwbaarheid van scenario’s – het is immers een vraagstuk over de toekomst. Ook aan de kant van big data wordt de groei van het datavolume niet ontkend, maar wordt het lastiger als je de aandacht op de gevolgen wil vestigen.

DatainOneMinuteDe feiten rondom big data zijn helder. Het datavolume groeit snel en op veel gebieden (denk aan de zorg) explosief. De toekomst biedt weliswaar geen feitelijke zekerheden, maar dat de groei sterk zal doorzetten valt niet te betwijfelen. Alleen al het mobiele dataverkeer neemt tot 2019 met 45 procent toe, aldus het laatste Mobility Report van Ericsson. Wereldwijd zijn er nu twee miljard mobiele breedbandabonnementen, in 2019 zullen dat er 8 miljard zijn. Rond die tijd zal ook het aantal tablets, mobile pc’s en mobile routers meer dan verdubbeld zijn. De exacte impact is niet duidelijk, maar dat vrijwel alle grote brands bezig zijn met het internet der dingen maakt in elk geval duidelijk dat het IoT de komende vijf jaar een enorme ontwikkeling zal doormaken.

Niet alle bedrijven zullen in 2019 (dat is over vijf jaar, de iPad is op dit moment nog maar drie jaar oud!) gelijktijdig in staat zijn met deze databubble om te gaan. Big data staat vooral bij IT-dienstverleners hoog op de agenda en daarnaast zijn er steeds meer CIO’s die inzien dat het tij niet te keren is. Steeds vaker gaat de CIO met de business in gesprek om te bezien wat de kansen, maar ook de uitdagingen zijn bij het aan de slag gaan met big data.

 

hollandse brug tekening - webIn veel gevallen moet de business echter nog tot het inzicht komen dat big data geen hype is. De early adopters van het big data fenomeen hebben nu dus al een voorsprong. Voor de late majority wordt de achterstand straks op twee manieren een probleem: er is minder tijd om een inhaalslag te maken, maar de transformatie naar de cloud zal sneller moeten. Tegen de tijd dat de late majority tot het inzicht komt dat er een begin moet worden gemaakt, wordt de jacht op data-analisten geopend en zullen prijs en beschikbaarheid verder uiteen gaan lopen. Kortom, veel organisaties zullen niet tijdig toegerust zijn – ook op boardroom niveau – om op het vlak van technologie, personeel en processen aan de slag te kunnen met big data. Niet nadenken over big data is dus ernstiger dan alleen uitstel van executie.

Waar te beginnen met big data? – live webcast

Op dinsdag 19 november organiseert Computerworld een live webcast met T-Systems en IDC, met als invalshoek: waar te beginnen met big data?

Tijdens de webcast wordt ingegaan op vraagstukken rondom security; besluitvorming en algoritmes; waarde en ROI van big data en de rol van technologieoplossingen waaronder cloudcomputing.

  • Datum: 19 november 2013
  • Aanvangstijd: 4.00 p.m. CET
  • Deelname is kosteloos
  • Aanmelden kan hier.

 

Deze post is tot stand gekomen in samenwerking met de Zero Distance community en T-Systems


De snelste computers hebben wielen

DSC_4112Nu ministers niet alleen in elektrische, maar ook in (deels) zelfsturende auto’s stappen, is er geen weg meer terug. Het goede voorbeeld is gegeven. Op steeds meer plekken doemen demo’s op van ‘driverless cars’ van Google, Volvo, Toyota of de nieuwe Mercedes S-klasse.

Het ontwikkelen van een nieuwe geheel nieuw automodel kost ongeveer een miljard dollar, maar het ontwikkelen of upgraden van software is aanzienlijk goedkoper. Daarmee ontstaat voor de auto-industrie nieuwe verdienmodellen. Bij de auto van de toekomst – zowel bij dure als bij goedkope merken en types – gaat het om het verkopen van aanvullende diensten, waarvoor de auto’s volgestopt worden met software en sensoren. De zelfrijdende auto is maar één facet. Hoewel duidelijk is wie straks verantwoordelijk is voor de software en de sensors in de auto – dat is de fabrikant – is één vraagstuk nog steeds niet beantwoord: welke data produceert de auto en wie bepaalt wat er met die data gebeurt?

Datagestuurd rijden

Het aantal sensors in de auto neemt toe. Naast GPS en ABS-systemen horen ook gyroscopen, radarsystemen en stereocamera’s tot de standaarduitrusting. Auto’s kunnen straks communiceren met zowel de 121029.1_S-Klasse_Radarsystemeopenbare infrastructuur als met andere auto’s. Het betekent dat er drie enorme datastromen op gang gaan komen: de eerste voor het besturen (de zelfsturende auto), de tweede voor het onderhoud (‘management’) en de derde voor aanvullende (commerciële) diensten. Voor het zelf rijden is een flinke hoeveelheid ‘sentrollers´ nodig – sensoren die kunnen waarnemen en signalen kunnen afgeven. Bij het zelfsturende auto is het niet zo zeer de motoriek van de automobilist, maar de menselijke waarneming die geëvenaard moet worden.

Auto wordt gemotoriseerde tablet

Alle data uit de auto zeggen iets over rijgedrag, voorkeuren en bestemmingen. Data over je volgende bestemming kunnen bijvoorbeeld gebruikt worden om je elektrische auto slim – namelijk wel of niet volledig – op te laden. Of om een gunstige aanbieding te doen: de zelfsturende auto kan een voorstel doen om de eerstvolgende afslag richting de MacDrive te nemen. De auto kan je selectief helpen herinneren aan het tanken bij een bepaald brandstofmerk, ook als je nog gemakkelijk de voordeliger pomp een paar kilometer verderop kunt halen. Dat de auto als softwarepakket-op-wielen een zekere waarde vertegenwoordigt, blijkt alleen al uit het feit dat de auto zelf kwetsbaar is. Wanneer je over de gegevens van de eigenaar beschikt kan je gemakkelijk andermans auto ‘lenen’. Met alle datastromen wordt de auto vergelijkbaar met onze laptop, tablet en smartphone: het wordt een platform met verschillende gebruiksdoelen waarbij derden graag ‘meerijden’.

Meeliften op de datastroom

Een van die ‘derden’ is RDC, de instantie die de automotive sector voorziet van betrouwbare informatie, waaronder de Nationale Autopas. Er zijn in Nederland ruim 12 miljoen gekentekende voertuigen (en circa 16 miljoen fietsen). RDC heeft de afgelopen jaren de hoeveelheid data waarmee de organisatie werkt, zien exploderen, zo blijkt uit een publicatie van Giarte: zeven jaar geleden stond er 30 TB aan data geparkeerd, nu is dat al meer dan 120 TB. Die groei is alleen toe te schrijven aan het minder weg gooien van bestaande gegevens, de groei zal dus nog sterker toenemen wanneer auto’s nog meer data gaan produceren. Zaken als het internet of things en de connected car zijn voor RDC dan ook ‘serious business’. Er wordt gewerkt aan standaarden en het optuigen van een ‘clearing house’ voor alle informatie die straks uit auto’s komt. Ook RDC voorziet hierbij een belangrijk vraagstuk: onder welke voorwaarden mogen gegevens gebruikt worden en door wie?

Is the Google-car making us stupid?

Eén keerzijde van meer kunstmatige intelligentie in de auto is dat we een stap verder gaan in onze afhankelijkheid van technologie. Met auto’s die veranderen in rijdende softwarepakketten, worden we kwetsbaarder voor cybercrime. Om iemand in een ravijn te laten eindigen hoef je straks niet meer te knoeien met de remleidingen.  Een ander nadeel van de toegenomen afhankelijkheid is dat de bestuurder verleert om adequaat te handelen in noodsituaties. Nicholas Carr beschreef half begin november in NRC Handelsblad hoe dit fenomeen zichtbaar is geworden in de luchtvaart. Wanneer je opgedane kennis en vaardigheden nog maar zelden hoeft toe te passen, verdwijnen de juiste routines geleidelijk. Wordt de winst in gemak, efficiency en veiligheid straks teniet gedaan door risico’s en kwetsbaarheden?

Deze post is tot stand gekomen in samenwerking met de Zero Distance community en T-Systems


Uitdagingen in multichannel klantcontact (2): Amsterdam

Welke keuzen kan je maken wanneer je kiest voor multichannel klantcontact? In een miniserie van vier blogs komen vier verschillende partijen – Adidas, Amsterdam Marketing, T-Mobile en KPN aan bod. Er zijn duidelijke verschillen, zowel in ervaring als in visie en aanpak. Deel 2: De stad Amsterdam.

 

2. Amsterdam: toeristen genereren big data

DSC_6661 1000-288Stichting Amsterdam Marketing doet met 130 medewerkers zijn uiterste best om Amsterdam aantrekkelijk te maken voor toeristen, bewoners en bedrijven. De stichting is in 2013 gestart met onderzoek en is een samenwerkingsverband van verschillende partijen zoals het congresbureau en het Uitburo. De marktonderzoekers willen zicht (en soms ook: vat) krijgen op het gedrag van toeristen. Op die manier kan er goed gebenchmarked en geconcurreerd worden met andere steden. Amsterdam richt zich op het vergaren van informatie over het verblijf van de ‘klant’ van de stad. Een van de instrumenten die hierbij heeft geholpen is de City Card, die na aankoop zonder verdere kosten toegang biedt tot verschillende attracties in de stad en recht geeft op gratis openbaar vervoer voor 24, 48 of 72 uur. Gebruikers van de kaart genereren data, omdat de kaart voorzien is van een barcode; bij ieder gebruik wordt de barcode gescand. De stad heeft tevens geïnvesteerd in analyse tools en focust daarbij op het visueel presenteren van de data voor

beeld van gogh

 

 

 

 

 

 

 

alle afnemers (zoals de gemeente en de attracties) van de informatie. Zo is bijvoorbeeld duidelijk geworden op welke dagen en tijdstippen er sprake is van de grootste drukte bij musea.

Ook heeft de stad een beter zicht op patronen in de herkomst, voorkeuren en tijdsbesteding van toeristen. Amsterdam denkt na over het verder uitbouwen van de interactie met toeristen via de I amsterdam City Card app.

 

Op 29 oktober vond voor de vierde maal de Klantbelevingsconferentie plaats, georganiseerd door IBM, Olympia Uitzendbureau, SNT en Teleperformance. Thema: waarde voor en door de klant in een multichannel omgeving. De impressies zijn gebaseerd op presentaties van de volgende personen:
  • Adidas: Bob van der Beek, Global e-commerce CRM Marketing manager
  • Stichting Amsterdam Marketing: Olivier Ponti, manager research
  • T-Mobile: Hans van der Plas, directeur Customer Contact Center
  • KPN: Mark van der Vlies, manager channelmanagement

Deze post is tot stand gekomen in samenwerking met de Zero Distance community en T-Systems


Het internet van onzichtbaarheden

Het zal niet lang meer duren voordat we Google Glass-dragers in real life op straat tegenkomen. Een goed geïnformeerd mens met een scherpe blik zal deze vorm van wearable computing opmerken. Het internet of everything is een stuk minder zichtbaar.

IT-consumerization heeft zo zijn voordelen: ons leven is een stuk gemakkelijker geworden. Met een app als  Buienradar weten we wanneer het gaat regenen in onze directe omgeving; het gemak van die kennis is vele malen groter dan het nadeel van het delen van onze locatie. Dergelijke gemaksdiensten betalen we met meestal met data als valuta. Data kan je in een zeker opzicht met echt geld vergelijken: het is fijn als je er over kunt beschikken en het is vervelend als het tussen je vingers weg glipt of gestolen wordt.

Privacy is (op)rekbaar begrip

Burgers verwachten van hun overheid steeds meer transparantie, maar hebben er vreemd genoeg steeds minder moeite mee allerlei data af te staan of te delen. Grosso modo wordt er lauw gereageerd op pogingen van derden om informatie te ontfutselen, ongeacht of het nu om de overheid of over bedrijven gaat. In veel gevallen praten we de datahonger goed met argumenten die gaan over winst in kwaliteit en efficiency (denk aan de zorgsector) of tegen winst op veiligheidsgebied (denk aan openbare veiligheid). Dat laatste is overigens opmerkelijk: er is nog nooit aangetoond dat het veiliger wordt wanneer we meer weten. In tegendeel, meer data vergroot de kans op nieuwe ongelukken.

Een overheid of onderneming die echt iets wil weten van consument of burger moet vooral enig geduld opbrengen: de grenzen van burgers en consumenten zijn uiterst rekbaar als het gaat om privacy.

Millennials zijn de CxO’s van morgen

Ook millennials, de grootverbruikers van de open samenleving, maken zich weinig tot geen zorgen over hun privacy – dat is een begrip uit de 20e eeuw – en over waar hun data staan. Als ze er maar bij kunnen en tot nu toe gaat dat goed. Millennials gaan om met data zoals babyboomers omgaan met automatische incasso’s. Millennials vertrouwen wellicht nog op een emotioneel overschrijfbaar digitaal bestaan: nieuwe feiten zijn belangrijker dan oude feiten; oude feiten vergelen net als oude foto’s.

Die millennials zijn de politici, CEO’s en CIO’s van morgen. Als gretige gebruikers zorgen ze voor een voedingsbodem voor het internet of things (IoT) en later zullen ze het wellicht uitbouwen.

Vier eigenschappen

Waarmee moeten we nog meer rekening houden, als we ons binnenkort vergapen aan het internet of things?

1. Het internet of things is, net als internet zelf, een disruptive technology. Het internet heeft niet alleen complete industrieen getransformeerd (reissector, retail, muziekindustrie en de uitgeverij) maar ook een aantal maatschappelijke standaarden onderuit gehaald, onder meer op het vlak van bescherming van persoonlijke privacy, identiteit en data. Snel na de doorbraak van internet werd duidelijk dat verschillende soorten wetgeving niet meer voldeed.

2. Het internet is als dataverschijnsel een onomkeerbaar proces. Het internet of things zorgt voor een explosieve datagroei. Gelukkig is het digitale geheugen kolossaal en functioneert over het algemeen erg goed; data liggen aan de basis van steeds meer processen. Afhankelijkheid van data leidt echter ook tot kwetsbaarheid van die processen. En de onomkeerbaarheid heeft ook betrekking op privacy: wat we daarvan inleveren, krijgen we nooit meer terug.

3. Het internet of things is onderhevig aan proliferatie. De eerste internetfunctionaliteit beperkte zich tot computernetwerken; vooral het aantal IP-adressen is daarbij toegenomen. Met de komst van tablets en smartphones lijkt het alsof internet ‘overal’ is, de volumes worden echter pas echt groot wanneer voorwerpen connected worden. De proliferatie strekt zich niet alleen uit tot datgene waar we controle over denken te hebben. Het internet of things zit straks ook in de publieke infrastructuur: in de vorm van sensors in wegen, bruggen, parken, openbaar vervoer. Die sensors verzamelen data over onze interactie met die infrastructuur. Dat vraagt om een andere benadering van overheden hoe zij met informatiearchitectuur, data en informatie omgaan. Aleecia M. McDonald, als director of privacy verbonden aan het Center for Internet and Society van Stanford Law School, stelt het als volgt: “We have learned the hard way that we cannot trust companies or governments to show restraint in collecting our data.”

4. Het IoT gaat leiden tot onvoorziene, nieuwe business concepten. IoT als geheel kan alleen een succes worden als de ‘schuld’ die is ontstaan in de relatie tussen data en technologie enerzijds en privacy, security en safety anderzijds wordt ingelost. Voor zo ver dat nog mogelijk is, vergt het een enorme inhaalslag waarvoor de basis moet worden gelegd in het onderwijs van nu, ook op het vlak van bewustzijn.

Normen en standaarden

Het Institute of Electrical and Electronics Engineers Standards Association, afgekort IEEE-SA of kortweg triple-E werkt al enkele jaren aan de ontwikkelingen van verschillende standaarden die relevant zijn voor het Internet of Things. De standaards zijn nodig om ontwikkelaars en innovators een algemeen platform te bieden zodat ‘compatibiliteit’ gegarandeerd is.

Maar ook voor het minder zichtbare zullen standaarden moeten worden ontwikkeld. Zaken als wearable computing, goedkope sensoren en permanente connectiviteit in combinatie met de inzet van big data analytics roepen nieuwe vragen op, op het moment dat de verschijnselen zich openbaren.

Of zoals het NYT-redactioneel het verwoordt: “A camera that lets you check on your sleeping baby? Very cool. A camera that lets hackers broadcast live video of your sleeping baby? Less cool.”

Deze post is tot stand gekomen in samenwerking met de Zero Distance community en T-Systems


Big data voor burgers

Als overheden meer publieke data beschikbaar stellen, leidt dat wellicht tot meer zelfredzame burgers. In New York koppelen ze Open Data echter aan hi tech business.

Onze overheid verzamelt veel data – soms meer dan we willen weten of goed vinden. Een deel daarvan komt terug in de vorm van diensten waar we wat aan hebben, een ander deel houdt de overheid voor zichzelf. Open data is data uit openbare bronnen, die vrij gebruikt of hergebruikt kunnen worden. Bijvoorbeeld door ondernemers die er nieuwe business mee genereren. De economische waarde van open data in de EU wordt geschat op meerdere tientallen miljarden euro’s. De Association for Competitive Technology (ACT), één van de belangrijkste brancheclubs op het gebied van mobiele app ontwikkelaars toonde met een onderzoek aan dat de ‘app economy’ in de afgelopen vijf jaar 800.000 banen in de EU heeft opgeleverd. Open data is ook waardevol voor de (Rijks)overheid zelf, omdat het kan bijdragen aan de efficiëntie van de overheid of de samenleving.

Amsterdam

DSC_6365In 2011 is Apps for Amsterdam opgestart naar het voorbeeld van Apps for Democracy, een wedstrijd die in Washington werd georganiseerd. Daarbij konden deelnemers prijzen winnen voor toepassingen waarbij data op een zinvolle wijze beschikbaar werden gesteld aan een groter publiek. Apps for Amsterdam is een project van de Amsterdamse Economische Raad, Waag Society en Economische Zaken van Gemeente Amsterdam. In 2011 werden bijna vijftig ideeën ingediend, bij de tweede ronde in 2012 werden 20 apps ingezonden. In 2013 werd daarom de aandacht verlegd naar het ondersteunen van ontwikkelaars in het vertalen van apps naar duurzame business modellen. Verder is er een portal voor Open Data in Amsterdam opgezet, waar onder meer een catalogus van alle beschikbare Open Data in de regio Amsterdam is te vinden. Ook is daar een overzicht van ontwikkelde apps beschikbaar.

Mobiliteit en infrastructuur

DSC_4101Veel Open Data hebben betrekking op de openbare infrastructuur. Ze kunnen een belangrijke rol spelen bij het inrichten en gebruiken van die infrastructuur, maar ook effect hebben op veranderend gedrag of nieuwe business modellen. Elektrisch rijden heeft bijvoorbeeld alleen een kans van slagen krijgt als er een uitgebreide infrastructuur voor wordt aangelegd (reden waarom de city council van Palo Alto, California in oktober besloot dat alle nieuw te bouwen huizen vanaf nu een aansluiting moeten hebben voor het opladen van elektrische voertuigen).

In Amsterdam wordt het vlak van mobiliteit samengewerkt met Economische Zaken en de Dienst Infrastructuur Verkeer en Vervoer. Via CitySDK moeten de data van de stad straks realtime ontsloten worden via een API. Samen met de G4 wordt er de komende maanden nieuwe data rondom mobiliteit vrijgegeven; begin 2014 organiseren Waag Society en de Dienst Infrastructuur Verkeer en Vervoer een dag in het kader van mobiliteit. In de Amsterdamse datastore kan je bijvoorbeeld een maandelijkse update vindt van alle oplaadpunten voor elektrisch vervoer.

Het wil echter niet zo vlotten met concrete toepassingen op het vlak van Open Data. Opgedroogde data, onrealistische verwachtingen en het ontbreken van een verdienmodel zijn de voornaamste oorzaken van de hoge kindersterfte onder apps. Enkele Amsterdamse apps die de eindstreep hebben gehaald zijn Bike like a local en Voradius (een app die de mogelijkheid biedt om zicht te krijgen op voorraden van winkels ‘om de hoek’).

New York: Big City, Big Data

DSC_9209open data NUC beeld 2

In de VS hebben de stad en Staat New York uitgebreide portals opgezet. De data-store van de stad New York biedt meer dan 1.100 datasets, waarvan alleen al meer dan 182 datasets op het gebied van mobiliteit. Die datasets variëren qua inhoud van adresgegevens van alle metrostations tot aan data over alle taxi’s. De data over de yellow cabs bijvoorbeeld hebben betrekking op zo’n 14.000 voertuigen die op basis van een medallion werken (een vergunning met een waarde van enkele tonnen). Er zijn gegevens over bijvoorbeeld het bouwjaar (de taxi’s moeten, ongeacht de technische staat, na zes jaar verplicht vervangen worden) maar ook over identificatiegegevens zoals eigenaar en kenteken. Het is niet ondenkbaar dat over een tijdje real time zichtbaar is waar in NYC lege taxi’s rijden. Er is een zekere mate van kritieke massa nodig om datagedreven businessmodellen te laten werken. In Amsterdam denk ik dan aan een realtime overzicht van beschikbare parkeerplaatsen.

Let’s talk business

Ook in de stad New York was het enthousiasme voor Open Data in het begin niet zo heel groot, reden waarom het stadsbestuur Open Data heeft gekoppeld aan het promoten van de eigen hi tech industrie. Niet voor niets heeft één van de tien techtrends van Gartner voor 2014 betrekking op het Internet of Everything. Daarbij geeft Gartner aan dat de meeste bedrijven en technologieleveranciers totaal niet zijn voorbereid op dat IoE. Eén van de aandachtspunten: Monetizing Open Data.

Open data NYC beeld 1Het databeleid van de stad moet bijdragen aan meer bedrijvigheid, reden waarom New York in maart 2012 tevens een Open Data wet aannam, waarin onder meer is vastgelegd dat alle 80 overheidsdiensten in de stad uiterlijk per september 2013 moesten beschikken over een Open Data plan. Dat plan moet zodanig zijn opgezet dat het in 2018 geeffectueerd kan zijn. De komende jaren komen er dus grote hoeveelheden data beschikbaar. In combinatie met actieve ondersteuning van de technologiesector valt te verwachten dat er veel nieuwe toepassingen tot stand komen. Een stad om in de gaten te houden dus.

Deze post is tot stand gekomen in samenwerking met de Zero Distance community en T-Systems


Data-scepticisme

Wat vertellen data wel, en wat zeggen ze niet?  Stellen we data-analyses en visualisaties wel genoeg ter discussie, of zijn we een dergelijke manier van denken over data nog niet gewend?

logo_2_rgbjpgWe vertrouwen graag op de kracht van data. Data maken dingen inzichtelijk en overtuigen veelal beter dan verhalen.  En met de opkomst van goedkope sensor-technologie is er over steeds meer dingen data beschikbaar. Hoewel ik ook graag een verhaal kracht bij zet met mooie gegevens en gek ben op visualisaties, vraag ik me ook af waar data hun autoriteit vandaan halen. En of we er soms niet te makkelijk op vertrouwen. Daarom wil ik er hier een kritisch verhaal over te vertellen, want data zelf vertellen niet altijd het hele verhaal. Lees verder op het blog Data denkers – van Jelte Timmer en Linda Kool (Rathenau Instituut)

Big data is geen bullshit

Verschijnselen die nadrukkelijk op de agenda worden gezet, verdienen het ook om gerelativeerd te worden. Big Data is volgens Gartner al over de piek van ‘inflated expectations’ heen: hoewel er successen mee zijn geboekt, wordt nu ook afgerekend met hooggespannen verwachtingen.

Big data is bullshit, aldus Nassim N. Taleb, publicist en professor verbonden aan het Polytechnic Institute van New York University. In Wired legt hij uit: “With big data, researchers have brought cherry-picking to an industrial level.”

Hype-Cycle-for-Big-Data-2012Het lijkt erop dat Taleb zich zorgen maakt: big data mag beslist niet met wetenschap geassocieerd worden. Bij enorme hoeveelheden data zouden wetenschappers de omgekeerde weg kunnen gaan bewandelen: niet volgens de route hypothese-onderzoek-data-toetsing-conclusie, maar volgens de route data-conclusie-hypothese. Big-data onderzoekers zouden volgens Taleb kunnen stoppen met hun onderzoek op het moment dat ze het juiste resultaat hebben gevonden, bijvoorbeeld in de vorm van een patroon. Of nog erger: onderzoekers kunnen een hypothese formuleren na het vinden van een patroon.

Taleb zegt op zijn blog op Wired dat iedereen met big data analyses statistische relaties kan vinden. Hoe meer variabelen er worden bekeken, hoe meer correlaties er gevonden kunnen worden. Taleb legt de relatie met observationele studies, waarbij een onderzoeker datasets analyseert, zonder dat er sprake is van een experiment, een interventie en een controlegroep ‘zonder interventie’. Taleb vindt het een fundamentele fout te denken dat we alles kunnen doorgronden als we maar genoeg gegevens analyseren. Taleb pleit er voor de afstand tussen big data en wetenschap groot te houden. Daar is niks mis mee.

Gouden bergen

Het is de vraag of echte wetenschappers zich aangesproken zullen voelen. Ik denk dat Talebs uitspraak vooral pijnlijk is voor bedrijven die in hun marketingcommunicatie gouden bergen beloven: met big data kom je verder. Goede wetenschappers weten dat onderzoek betrouwbaar en valide moet zijn. Betrouwbaarheid van onderzoek verwijst daarbij naar herhaalbaarheid: je onderzoeksuitkomst is alleen betrouwbaar als je bij een herhaald onderzoek op dezelfde resultaten uitkomt. Dat herhaalonderzoek is alleen mogelijk als de volledige onderzoeksmethode goed is beschreven zodat het onderzoek reproduceerbaar is door derden. Terecht wijst Taleb er op dat herhaalonderzoek zelden wordt uitgevoerd – wetenschappers winnen weinig met het doen van onderzoek dat de uitkomsten van eerder onderzoek onderschrijft en dientengevolge is er meestal geen of weinig geld voor beschikbaar.

Big data is geen wetenschap

Taleb maakt met zijn hele betoog echter ook een fout. Hij brengt een relatie aan tussen big data en wetenschap die hij vervolgens zelf probeert te ontkrachten. Inderdaad, big data is geen wetenschap, maar een aanduiding voor het verschijnsel dat er veel data beschikbaar is. Datasets worden steeds groter en complexer; ze worden opgebouwd uit verschillende informatiesoorten en -bronnen. De tijdsfactor – real time – gaat een steeds belangrijkere rol spelen en het verzamelen van data zal in toenemende mate geautomatiseerd geschieden. In De big data revolutie zeggen schrijvers Mayer-Schonberger en Cukier dat er geen exacte definitie van big data bestaat: “De term ‘big data’ verwijst naar dingen die je op een grote schaal kunt doen en op kleinere schaal niet mogelijk zijn, en waarmee je nieuwe inzichten verkrijgt of nieuwe vormen van economische waarde creëert op een manier die invloed heeft op (…) markten, organisaties en de relatie tussen burgers en overheden.”

Groeiende databrij

Big data sec heeft weinig met wetenschap te maken. Maar het heeft weinig zin om big data bullshit te noemen. Allereerst ontken je daarmee het verschijnsel dat we al vreselijk veel data verzameld hebben; dat we dagelijks nieuwe data vastleggen; en dat die databrij in rap tempo gaat groeien omdat het Internet of Things straks miljarden apparaten omvat die allemaal data gaan produceren. Dat brengt belangrijke vragen met zich mee over dataopslag, databeveiliging, data governance en de inzet van business intelligence. Vragen die aan relevantie winnen omdat ze bijvoorbeeld te maken hebben met privacy.  En op de tweede plaats, niet minder belangrijk, heeft de inzet van big data – of hoe je het ook wil noemen – al lang zijn nut bewezen.

 

Deze post is tot stand gekomen in samenwerking met de Zero Distance community en T-Systems


Monitoring, tracking en tracing

waarbenjijnuSoms wordt er nog wat lacherig verwezen naar Chriet Titulaer, maar het Internet of Things rukt op. Volgens Berg Insight, een onderzoeksbureau, zijn er in 2012 wereldwijd 5,3 miljoen machine-to-machine-apparaten (M2M) met mobiele connectiviteit verscheept. In de komende vier jaar loopt dat op naar 13,8 miljoen mobiele devices in 2017. Daarbij gaat het niet om tablets of smartphones, maar om nieuwe soorten devices. Een belangrijk aandeel hiervan is gericht op services die ons leven gemakkelijker en veiliger moeten maken.

Jaarlijks overlijden 1,3 miljoen mensen als gevolg van verkeersongevallen en raken er 50 miljoen ernstig gewond. Verkeersongevallen kosten landen naar schatting 1 tot drie procent van het BNP: het gaat dan om medische kosten en kosten als gevolg van productiviteitsverlies. Het is relatief eenvoudig om het aantal verkeersslachtoffers te reduceren. Japan wist het aantal verkeersongevallen met dodelijke afloop tussen 1970 en 2008 terug te dringen met een kwart door verbeteringen door te voeren op het gebied van straatverlichting, trottoirs en verkeerslichten. Het land heeft nu interesse getoond in het pan-Europese eCall initiatief.  Dat moet in 2015 de eerste zichtbare resultaten gaan opleveren door een effectiever gebruik van het zogenaamde ‘gouden uur’. De EU hoopt zo op jaarbasis 2.500 mensenlevens te kunnen redden. eCall komt pas in actie wanneer de auto in een noodsituatie belandt – hiervoor worden nu criteria ontwikkeld. Het systeem geeft dan verschillende gegevens door aan een meldkamer, waaronder de precieze locatie van de auto. Het integreren van eCall in nieuwe auto’s kost nog geen 100 euro per auto.

M2M-communicatie wordt ook op steeds grotere schaal ingevoerd door overheden, bijvoorbeeld om de infrastructuur te bewaken. Het gaat dan niet om camera’s waarvan de beelden worden gemonitord door mensen, maar om sensoren die data doorgeven over bijvoorbeeld de onderhoudsstaat van een object. Sinds 2008 worden bij de Hollandse Brug op de A6 via 145 sensoren dagelijks zo’n 11 gigabyte aan data vastgelegd. Die sensoren bestaan onder meer uit camera’s, weerstations, telsystemen en vibratiesensoren, die zowel brug als voertuigen op allerlei punten in de gaten houden. Het systeem genereert op basis van al deze data informatie over wanneer, waar en welk onderhoud nodig is. De data worden sinds 2008 verzameld en sinds 2009 worden ze op geïntegreerde wijze geanalyseerd via het InfraWatch project.

hollandse brug tekening - web

Onder de noemer ‘personal tracking’ worden ook systemen ontwikkeld voor mensen. Het traceren van auto’s of pakketjes heeft zo zijn voordelen, maar personen real time ‘volgen’ ligt gevoeliger. Hoewel het al lange tijd technisch mogelijk is personen op te sporen via de mobiele telefoon (via zendmasten of via de GPS-functionaliteit), mag deze functie niet zonder gerechtelijk tussenkomst worden gebruikt. Wel kan iedereen zijn eigen mobiele telefoon traceren, bijvoorbeeld via een toepassing als Android Apparaat beheer.

android apparaatbeheer

De markt lijkt echter wel klaar voor gps-trackers, specifiek bedoeld voor personen die daar zelf toestemming voor geven, bijvoorbeeld als waarschuwingssysteem bij noodgevallen. Fabrikanten wijzen op de mogelijkheden om ouderen, dieren en kinderen te volgen. Een ideale doelgroep voor het creëren van early adopters, zodat de marketing en sales niet te veel dwars wordt gezeten door moeizame discussies over privacy. Het gaat hierbij steeds om toepassingen waarbij het ene apparaat via een mobiel netwerk een signaal afgeeft aan een ander apparaat, aangeduid als real-time locating systems – voor communicatie van mens tot mens hebben we immers al de mobiele telefoon.

Ook op medisch vlak ontstaat er een markt, gericht op zelfzorg en monitoring, zoals Personal Emergency Response Systems. Philips heeft bijvoorbeeld sinds enige tijd het Lifeline Medical Alert System op de markt, een draagbaar systeem dat zelfs detecteert of er sprake is van een val – jaarlijks vallen er 13,5 miljoen mensen van ouder dan 65 jaar, aldus het bedrijf.

Naast de toepassing voor noodgevallen kan M2M-technologie ook worden ingezet rondom zelfzorg en monitoring. AiQ is een leverancier van slim textiel: kleding (zoals een T-shirt) met ingebouwde sensoren die hartslag, transpiratie en huidtemperatuur monitoren, maar een EEG of EMG behoren ook tot de mogelijkheden. Nuubo neemt het medische, draadloze platform als uitgangspunt, waarbij op afstand ECG-monitoring plaatsvindt. TmG-BMC levert een sensor met een omvang van 5 mm, waarmee spierbelasting (per spier) kan worden gemeten. De sensor meet de snelheid van spiersamentrekking en ontspanning en de geproduceerde kracht. Ideaal voor topsporters die niet alleen bij de sportarts, maar ook tijdens de wedstrijd precies willen weten hoe hun energie wordt omgezet in medailles.


Data driven drivers

In 2015 moeten in Europa alle nieuwe auto’s voorzien zijn van een eCall systeem. Voordat het zo ver is staan er nog wat vragen open. Mag de auto alleen zelfstandig communiceren met een meldkamer? Of mag de bestuurder ook zelf een ‘noodknop’ indrukken? Moeten meldkamers zich in dat geval voorbereiden op massale meldingen als ergens een ongeval heeft plaatsgevonden? Moet de auto een noodsignaal afgeven als de airbag afgaat of moet ook gekeken worden naar de impact van het event?

DSC_4120Een bezoekje aan iMobility Challenge op 11 september 2013 maakte duidelijk dat de techniek nog altijd ver vooruit loopt op de praktische realisatie. iMobility is een programma gericht op schonere, veiliger en meer efficiënte mobiliteit. Die verbeteringen kunnen voor een groot deel worden voortgebracht door systemen die data produceren; een ander deel van de verbeteringen zit ‘m in het slimmer gebruik van bestaande en nieuwe data. Maar het succes van verbeterprogramma’s hangt dus ook af van besluitvorming.

Een KLPD’er, die voor een demonstratie van eCall bij iMobility aanwezig was, bevestigde dat evenmin duidelijk is hoe de eCall meldingen moeten worden afgehandeld. Op dit moment gaan de meldingen nog naar de alarmcentrale van het betreffende automerk. Die koppen een serieuze melding door aan de meldkamer van… zegt u het maar. De ANWB? De meldkamers van 112? De KLPD? Rijkswaterstaat? Daarover is nog geen besluit genomen. Een ding is wel duidelijk: de communicatielijnen en de data vertegenwoordigen geld en machtsposities.

Een vergelijkbaar probleem doet zich voor bij het gebruik van open data. Althans, data waarvan betwist wordt of ze wel open zijn. Als het gaat om het beter regisseren van de mobiliteitsbehoefte, dan ziet TNO kansen in big data. Het combineren van allerlei gegevens, waaronder die van sociale media. TNO zou wel willen dat ook de reizigersdata van TLS (de club die de OV chipkaart in Nederland exploiteert) ‘open’ worden, zodat ook anderen er mee aan de slag kunnen. Een TNO-onderzoeker vermoedt dat het een kwestie van jaren is: daarna zijn de OV chipkaart data vrij. Maar voor de details verwijst hij ons door naar het ministerie van Infrastructuur en Milieu. Daar vinden ze wenselijk dat die data vrijkomen, maar lastig om dat hardop te beweren.

verizon-delphiOok op een ander vlak wordt gestreden om data. Delphi (foto) is een van de leveranciers van een (2G of 3G)dongel-gebaseerd systeem dat via de OBD-II connector voertuigdata in de cloud zet. Normaal wordt die OBD-connector gebruikt door het onderhoudsbedrijf om de autogegevens uit te lezen, dus met een diagnostisch doel. Via de dongel worden digital-keydata real time beschikbaar via een mobiele app en een web-applicatie. Die data hebben betrekking op waar de auto zich bevindt, maar ook op wat de actuele snelheid en het toerental is. Omdat er tweewegverkeer mogelijk is, kan je de auto ook bedienen via een app. Dus openen of inschakelen, maar ook bijvoorbeeld geografische grenzen aangeven waarbinnen de auto moet blijven.

Zonder autobezitter geen auto en dus geen data. Met de combinatie Verizon (voor de connectiviteit) en Delphi (voor de software) ontstaat een berg data die in de Delphi cloud terechtkomt, maar de data zijn van degene die het Delphi product afneemt. Dat kan ook dus een leasemaatschappij zijn. Of een huisvader die precies wil weten of zoon en dochter zich aan de maximum snelheid houden.

DSC_4101Hoe lang zitten we zelf nog achter het stuur? Dat auto’s intelligenter worden, staat vast. Omdat auto’s en IT langzaamaan versmelten, komen twee processen nu echt op gang. Het eerste proces is gericht op de auto als vervoermiddel in het verkeer: zuiniger, veiliger, beter inspelend om omgevingsfactoren en omstandigheden. Een tweede aspect heeft te maken met de auto als verdienmodel. De auto zelf draagt steeds minder bij aan het resultaat van fabrikanten. Het verdienmodel verschuift in de richting van aanvullende diensten (infotainment, onderhoud, service). Daarnaast gaat de auto terrein verliezen. De dominante positie moet straks gedeeld worden met andere mobiliteitsoplossingen.

Video: TNO over Open Data en Mercedes Benz over Distronic technologie
 

DSC_4188Een belangrijk deel van iMobility was gericht op IT en data, een ander deel van de aandacht ging uit naar elektrisch rijden. Tesla had twee exemplaren van het model S beschikbaar gesteld, die in nog geen uur werden leeggereden door hongerige autojournalisten. Er waren ook Twizy’s en Zoe’s van Renault en slimme limo’s van Mercedes. Ford liet zelfs een busje rondrijden met het opschrift ‘Zero Emission’. Alsof het ontwerpen, bouwen en onderhouden van windmolens volledig kan worden gerealiseerd met… windenergie.


CRM voor gevorderden

contactcenterSoftware voor customer relationship management bestaat al jaren. Enkele decennia geleden werd het met dozen tegelijk verscheept en  geïmplementeerd, meestal als kant-en-klare pakketten. Integratie met klantcontactsoftware, financiële systemen en logistieke systemen was vaak problematisch, terwijl callcenters en customer service omgevingen in veel gevallen toch de plek vormden waar informatie over al die processen bij elkaar moest komen. Hoe kan je anders een klant helpen, wanneer je wel weet hoe hij heet, maar niet wat de status van zijn bestelling of betaling is? Er zijn aardig wat van deze miljoenenprojecten uitgevoerd – en vastgelopen: 70 procent van de CRM-implementaties is mislukt, zo is een veel gehoorde inschatting.

 

Toch blijven de voorspellingen over de omvang van de wereldwijde CRM-markt opmerkelijk. Volgens Gartner heeft die markt in 2017 nog steeds een omvang van zo’n 37 miljard dollar. Je zou verwachten dat bedrijven die afhankelijk zijn van klanten, de fase van hangmappen, Excel-sheets en sticky notes wel hebben doorgemaakt – of failliet zijn. Maar nee, Forrester beweert zelfs dat uit een onderzoek binnen een groep van 556 grote bedrijven blijkt dat slechts de helft een CRM-oplossing voor marketing, sales, of customer service heeft geïmplementeerd. Een kwart zou overwegen om binnen 12 en 24 maanden een CRM-oplossing aan te schaffen. De cijfers komen weliswaar uit 2011, maar gezien de crisis denk ik niet dat er in de tussentijd veel is veranderd. Belangrijkste conclusie: de CRM-markt is nog lang niet verzadigd.

 

In tegendeel. Waar de ene groep bedrijven blijkbaar nog moet beginnen met CRM, zullen de meer ervaren CRM-gebruikers zich moeten voorbereiden op fundamentele vernieuwing van hun CRM-platform. De bedrijven die ik de afgelopen maanden heb gesproken, hebben vrijwel allemaal te maken met een data-explosie. Dat komt niet alleen door dat ze actief aan de slag gaan met kanalen als Twitter en Facebook. Bedrijven en instellingen beginnen in te zien dat de inzet van Big Data nieuwe kansen biedt. En dat Big Data veel verder gaat dan alleen de gegevens die op dit moment binnen het bedrijf bestaan (zoals data over klanten en hun gedrag, producten, financiën en transacties).

 

Nieuwe data komen niet alleen uit social media, maar vooral uit ‘nieuwe’ en externe bronnen, waarbij nieuwe en intelligente toepassingen ontstaan door combinaties van verschillende soorten informatie. Een voorbeeld. In de automotive sector heeft men op basis van verschillende soorten data inmiddels een goed inzicht in welke plaats een bepaalde occasion (merk, kleur, bouwjaar, uitrusting) tegen de hoogste prijs kan worden verkocht. Dat betekent: data analyseren en vervolgens de auto verplaatsen (of misschien wel exporteren). Dit is een recht-toe-recht-aan retail model; garagebedrijven kunnen straks inspelen op passerende automobilisten: “wij kunnen uw versleten remblokje vervangen”.

 

CRM-gebruikers zullen dus hun systemen moeten openzetten voor verschillende soorten externe data, al dan niet voorgekookt in een BI-tool. Een extra reden hiervoor is dat consumenten nu achter Facebook en Twitter aan rennen, maar dat over drie of vijf jaar wellicht een heel nieuw platform de toon zet. Bovendien staan er verschillende andere gegevensbronnen in de startblokken: denk aan het internet of things, mobiel betalen en locatie-gebonden diensten. Stuk voor stuk volkomen onontgonnen gebieden, die straks goed zijn voor vele petabytes aan data.

 

Ook al wordt de overgang van 3G naar 4G als weinig revolutionair gezien en ook al is connectiviteit een commodity, de infrastructuur wordt alleen maar beter. Dat maakt de kans groot dat we in de nabije toekomst vrijwel altijd en overal online zullen zijn. Al is het maar om er voor te zorgen dat al onze verschillende apparaten (tablet, laptop en smartphone en straks ook onze camera’s, horloges en sensoren) via de cloud gesynchroniseerd blijven. Always online, een goede bandbreedte en steeds meer apparaten die permanent gegevens gaan produceren en uitwisselen, dat is genoeg om een data explosie te creëren.

 

Een ding is de afgelopen paar jaar duidelijk geworden: succesvolle apps zijn data-gedreven. Succesvolle apps nemen waar of ‘meten’ (= data verzamelen), zijn in staat om gebruikers te bereiken en vervolgens waarde te creëren of toe te voegen. Het verdienmodel kan zitten in ‘de gebruiker aan het werk’ zoals bij Roamler, waarbij de baten worden verdeeld, maar ook in compleet nieuwe gegevensstromen. Daarbij zijn bestaande apps steeds vaker ook een inspiratiebron voor nieuwe apps. Wekelijks komen er voorbeelden bij. Denk aan platte toepassingen (http://www.thetileapp.com/) of aan local social discovery apps, die je helpen kiezen wat je met je vrije tijd kunt doen op basis van je gedragspatroon, je vrienden en je voorkeuren.

 

“Het internet der dingen levert bedrijven pas waarde op wanneer het netwerk integreert met de zogeheten systems of engagement, zoals crm-systemen of analysesystemen voor big data.” Aldus Forrester-analist Sarah Rotman Epps. Het duurt misschien nog even, maar alles wijst er op dat CRM en het internet of things straks in één huis moeten gaan wonen. Microsoft liet eind juni in ieder geval zien niet te gaan zitten afwachten.