Andrew Feldman van Cerebras Systems besprak op Bloomberg Tech 2026 de uitdagingen en kansen van AI-inferentie op schaal. Ontdek hoe de juiste infrastructuur kosten verlaagt en prestaties verbetert voor Nederlandse professionals.
Andrew Feldman, medeoprichter en CEO van Cerebras Systems, gaf onlangs een fascinerend interview op Bloomberg Tech 2026 in San Francisco. Samen met Tom Giles van Bloomberg dook hij in de wereld van AI-infrastructuur en de economie van inferentie. Het was een gesprek dat bol stond van inzichten over hoe we AI op grote schaal kunnen laten werken, en wat dat betekent voor bedrijven en ontwikkelaars.
### Wat is AI-inferentie precies?
Voordat we dieper duiken, is het goed om even stil te staan bij wat inferentie eigenlijk is. Simpel gezegd: het is het moment waarop een getraind AI-model daadwerkelijk wordt gebruikt om voorspellingen te doen of beslissingen te nemen. Denk aan een chatbot die je vraag beantwoordt, of een systeem dat frauduleuze transacties herkent. Training is het leren, inferentie is het toepassen. En dat toepassen moet snel, efficiënt en betaalbaar gebeuren.
Feldman legde uit dat de focus vaak ligt op het trainen van enorme modellen, maar dat de echte uitdaging zit in het draaien van die modellen in de praktijk. "Het is één ding om een model te trainen met miljarden parameters," zei hij, "maar het is een heel ander verhaal om dat model real-time te laten werken voor duizenden gebruikers tegelijk."
### De economie van inferentie
Een van de meest interessante punten die Feldman aansneed, was de economie achter inferentie. Het draait niet alleen om snelheid, maar ook om kosten. Traditionele hardware, zoals GPU's, kan duur zijn in gebruik. Cerebras heeft een andere aanpak gekozen met hun gespecialiseerde chips, die zijn ontworpen om inferentie efficiënter te maken.
- **Lagere kosten per voorspelling**: Door de hardware te optimaliseren, kunnen bedrijven hun operationele kosten verlagen.
- **Minder energieverbruik**: Efficiëntere chips betekenen ook een kleinere ecologische voetafdruk.
- **Schaalbaarheid**: Systemen die makkelijk kunnen meegroeien met de vraag.
Feldman benadrukte dat dit niet alleen technische voordelen zijn, maar dat ze direct invloed hebben op de businesscase van AI-projecten. Als je inferentie goedkoper kunt maken, worden toepassingen toegankelijker voor een bredere groep bedrijven.
### De rol van infrastructuur
Infrastructuur is het fundament waarop AI draait. Zonder de juiste hardware en software blijven de mooiste modellen steken in de ontwikkelfase. Cerebras richt zich op het bouwen van systemen die niet alleen krachtig zijn, maar ook eenvoudig te integreren in bestaande workflows.
Feldman gaf een voorbeeld van een klant die miljoenen voorspellingen per dag moest verwerken. Met traditionele hardware had dat uren geduurd en veel geld gekost. Na de overstap naar Cerebras' oplossing werd dezelfde taak in minuten voltooid, tegen een fractie van de kosten. Dat soort resultaten, zei hij, is waar het om draait.
### Wat betekent dit voor Nederland?
Voor professionals in Nederland die werken met AI, zijn deze ontwikkelingen cruciaal. Of je nu een startup runt of bij een groot bedrijf werkt, de keuze van je inferentieplatform kan het verschil maken tussen een project dat succesvol is en een dat blijft hangen in de pilotfase.
- **Snelheid**: Klanten verwachten snelle reacties. Inferentie op schaal maakt dat mogelijk.
- **Betrouwbaarheid**: Systemen moeten 24/7 draaien zonder haperingen.
- **Kostenbeheersing**: Met de juiste infrastructuur blijf je binnen budget.
Feldman sloot af met een optimistische noot: de technologie staat nog aan het begin. De komende jaren zullen we enorme stappen zien in hoe we AI inzetten, en de infrastructuur zal daarin een sleutelrol spelen.
Dit interview was een herinnering dat AI niet alleen draait om algoritmes, maar ook om de praktische kant van implementatie. Voor wie serieus aan de slag wil met AI, is het de moeite waard om eens te kijken naar de nieuwste ontwikkelingen op het gebied van inferentie-hardware.