Worm op de sensor Wat gebeurt er als de IoT-gegevens slecht zijn?

Bedrijven die het internet van dingen proberen te gebruiken, worden al geconfronteerd met een stortvloed aan gegevens en een duizelingwekkende reeks manieren om het te analyseren. Maar wat gebeurt er als de informatie onjuist is?

Slechte gegevens komen vaak voor bij IoT, en hoewel het moeilijk is om een ​​schatting te krijgen van hoeveel informatie van aangesloten apparaten niet kan worden gebruikt, denken veel mensen na over het probleem.

Ongeveer 40 procent van alle gegevens van de randen van IoT-netwerken is 'vals', zegt Harel Kodesh, vice-president van GE's Predix-softwarebedrijf en CTO van GE Digital. Veel van die gegevens zijn niet verkeerd, maar nutteloos: dubbele informatie die werknemers per ongeluk twee keer hebben geüpload, of herhaalde berichten die inactieve machines automatisch verzenden. 

Bovendien kan het bouwen van een nieuw IoT-platform bovenop oude industriële rapportagesystemen problemen veroorzaken omdat de legacy-tools gegevens op hun eigen manier formatteren, zei Kodesh. 'U neemt niet de echte, elementaire gegevens, u maakt daar een vertaling van.'

Maar soms genereren apparaten gewoon dingen die vals of misleidend zijn.

Het verkeerde meten

Als een worm bijvoorbeeld over een temperatuur- en vochtigheidssensor in een veld kruipt, krijgt de boer een lezing over hoe warm en vochtig de worm is, wat niet helpt om een ​​boerderij te runnen. Als een sensor wordt bedekt met vuil of fabrieksvuil, of als deze wordt beschadigd door vandalen, kan dat de gegevens die het produceert ook aanpassen..

Hoe zwaarder de omgevingsomstandigheden en hoe meer het apparaat geïsoleerd is, des te erger is het probleem met slechte gegevens. Naast de landbouw worden industrieën zoals olie en gas en energiedistributie hiermee geconfronteerd. Maar het zijn niet alleen verre sensoren die problemen hebben. Zelfs in een ziekenhuis kan een bloedzuurstofsensor die op de vinger van een patiënt is geklemd, slechte gegevens gaan geven als deze in de verkeerde positie wordt gestoten.

Bovendien werken sommige IoT-apparaten zelfstandig en beginnen ze slechte gegevens te verspreiden of stoppen ze helemaal met rapporteren. In veel andere gevallen is menselijke fout de boosdoener: de verkeerde instellingen verknoeien wat het apparaat genereert.

Een manier om slechte gegevens te verminderen, is door ervoor te zorgen dat de versnelling correct is ingesteld.

John Deere rust zijn gigantische landbouwwerktuigen uit met sensoren die detecteren of de machines goed werken. De ExactEmerge-planter van het bedrijf, die achter een tractor rolt die zaden over een veld plant, heeft drie sensoren per rij gewassen om te detecteren hoeveel zaden er worden geplant en in welk tempo. Minstens één keer per jaar, vóór het planten, zal de boer of een Deere-dealer die sensoren handmatig kalibreren zodat ze nauwkeurig zijn, aldus Lane Arthur, de directeur van digitale oplossingen van Deere..

Meer is beter

Maar veel IoT-sensoren zijn te moeilijk te bereiken voor regelmatige kalibratie en onderhoud. In die gevallen is redundantie misschien het antwoord, hoewel het geen wondermiddel is.

Duplicaten van dezelfde sensor op een machine, in een mijn of in een veld genereren meer invoer, wat op zichzelf nuttig kan zijn. Weather Underground, onderdeel van de Weather Company-activiteiten van IBM, maakt haar rapporten gedeeltelijk met gegevens van niet-gekalibreerde, goedkope sensoren in de achtertuin van consumenten. Voor niet veel geld geven ze Weather Underground meer datapunten, maar kwaliteit is een groot probleem. Eén sensor werkt mogelijk niet goed en meldt enkele centimeters regen, terwijl de sensor er geen waarneemt, zei John Cohn, de IBM Fellow voor Watson IoT.

"Het mooie is dat als je voldoende dichtheid van dit soort sensoren hebt, je ... wiskundig de uitschieters kunt vinden en de reden daarvoor dat er werk nodig is," zei Cohn.

Bedrijven kunnen ook verschillende detectieapparaten gebruiken, met name camera's, om sensoren te controleren die mogelijk problemen hebben. Een videocamera in combinatie met beeldanalysesoftware kan detecteren of een extern apparaat vuil, beschadigd of vernield is geraakt, zegt Doug Bellin, senior manager van de wereldwijde private sector bij Cisco Systems. Soms kunnen beveiligingscamera's die er al zijn voor iets anders dit werk.

Een techniek om verschillende soorten sensoren tegen elkaar te verifiëren, wordt sensorfusie genoemd. Het weegt input van twee of meer sensoren om tot een conclusie te komen.

Sensorfusie wordt nu geïmplementeerd in ziekenhuizen, waar vals alarm heerst, zegt Stan Schneider, president en CEO van IoT-softwarebedrijf Real-Time Innovations (RTI). In plaats van bijvoorbeeld een alarm te laten afgaan elke keer dat de bloedzuurstofsensor op de vinger van een patiënt weinig zuurstof vertoonde, zou een sensorfusiesysteem die meting constant vergelijken met die van andere sensoren bij de patiënt, zoals ademhalings- en hartslagmonitors.

De fantoomsensor

Andere bronnen kunnen ook in de plaats komen van een sensor die er niet eens meer is. GE test elke straalmotor die uit zijn fabrieken komt op uitlaatgastemperatuur, een cijfer dat de efficiëntie weerspiegelt, zei Kodesh. GE plaatst één sensor precies in het pad van de uitlaat, hoewel deze na een paar minuten altijd zal opbranden. Ondertussen verzamelen sensoren op veiligere plekken rond de motor tegelijkertijd gegevens en door hun metingen te vergelijken met wat het gedoemde apparaat heeft geregistreerd voordat het werd vernietigd, kan GE de directe sensor recreëren als een virtuele - een wiskundige functie.

Het trekken van conclusies uit meerdere informatiestromen brengt het datakwaliteitsprobleem naar het domein van machine learning. Dat is waar de meest interessante dingen gebeuren, zegt IBM's Cohn.

IBM gebruikt bijvoorbeeld zijn Watson-analyseplatform om het energieverbruik van IBM-faciliteiten in Ierland te begrijpen. Watson kan niet alleen een discrepantie signaleren als een airconditioner zegt dat hij uit is, maar het totale stroomverbruik is daarvoor te hoog om waar te zijn, maar na verloop van tijd kan hij leren om de specifieke manier te identificeren waarop die airconditioner stroom trekt wanneer hij komt op. Met die kennis kan een systeem dat zegt dat het niet aanstaat op heterdaad worden betrapt.

Als controle op foutieve gegevens heeft machine learning tijd nodig om op snelheid te komen, in tegenstelling tot toegevoegde sensoren of camera's.

'Hoe meer het draait, hoe slimmer het wordt. De eerste keer dat het draait, zou ik het niet vertrouwen, 'zei Bellin van Cisco. 'De duizendste keer dat het draait, is het ... waarschijnlijk slimmer dan ik.'

Hoe kritischer het IoT-systeem is, des te belangrijker is het omgaan met slechte gegevens. Sensorfusie is bijvoorbeeld nodig voor zaken als de gezondheid van patiënten en raketdetectie, omdat betrouwbaarheid een groot probleem is wanneer de inzet zo hoog is, zei Schneider van RTI.

Maar sommige vormen van IoT kunnen waarschijnlijk zonder dat het meerdere gegevensbronnen bevat, zei hij. 'Dat heb je niet nodig in de thermostaat in je huis.'

Word lid van de Network World-gemeenschappen op Facebook en LinkedIn om commentaar te geven op onderwerpen die voorop staan.