Als je ooit bezig bent geweest met machine learning-gebaseerde systemen, weet je al voldoende over getrainde data. Data moet in het correcte formaat geleverd worden en nauwkeurig zijn voor je het in een AI-model giet om het model te trainen.
Stel, je maakt een fraudedetectie-engine die een populair machine learning-systeem in een publieke cloud gebruikt. Je maakt als eerste een dataset om het model te trainen: in dit geval miljoen transactionele records met de frauduleuze transacties gelabeld als zodanig. Daarmee leert het model welke transacties een hoge kans hebben om frauduleus te zijn en welke niet.
(Er zijn natuurlijk verschillende types trainingsdata, gelabeld of niet.) Eenmaal getraind kan het model doorgaan te leren door ervaring op te doen. Als je er de tijd voor zou hebben, zou het model zichzelf kunnen trainen om transacties te monitoren die anderszins door mensen of andere systemen als frauduleus zouden worden opgemerkt.
AI als mentor
Wat opvalt over deze aanpak om AI te trainen is dat je een heel goede set aan trainingsdata moet hebben. Soms kun je die ophalen van open of propriëtaire databrokers. Maar was nou als we het ene getrainde model het andere model zouden kunnen trainen?
Dat is geen nieuw idee, al sinds de opkomst van AI hebben we gekeken naar plannen om het ene systeem het andere iets bij te brengen door ofwel gegevens te delen of zelfs de ervaringen onderling en geautomatiseerde te delen. Als de ene AI een mentor zou kunnen zijn voor de andere, wordt het model nog waardevoller en effectiever.
Dat is gemakkelijker gezegd dan gedaan. Machine learning-algoritmes praten in de regel niet met elkaar, zelfs als ze dezelfde software gebruiken. Ze zijn van de grond af aan opgebouwd om stand-alone leerlingen te zijn en praten alleen met non-AI of mensen. Maar inter-AI traning staat wel reeds op de radar van de meeste leveranciers.
De laatste tijd zie ik twee belangrijke trends die dit tijdperk zouden kunnen inluiden:
- Het gebruik van SaaS-gebaseerde AI-engines die communiceren met andere AI-engines in een publieke cloud of on-premises. Je kunt deze zien als SaaS-clouds die zich specialiseren in het leren van andere AI-engines van een specifieke set vaardigheden, alles van het herkennen van frauduleuze transacties tot medische diagnoses en machineonderhoud, en meer.
- AI-engines zijn in staat om te combineren met je eerder geleerde modellen, waardoor je een soort super-AI krijgt, die niet alleen ervaringen van de eigen trainingsdata gebruikt, maar ook globale lessen kan toepassen.
Dit is een trend die je in de gaten moet houden als je meer waarde wilt creëren met behulp van AI, zoals machine learning en deep learning. Daarnaast komen veel bedrijven het issue tegen dat ze niet genoeg trainingsdata hebben om machine learning functioneel te maken. Dit zou een goede oplossing zijn voor beide uitdagingen.
David S. Linthicum is Chief Cloud Strategy Officer bij Deloitte Consulting en is een internationaal erkende industrie-deskundige en thought leader. Hij schrijft geregeld over zijn visie op de sector op Computerworld.
Reageer
Preview