AI i butiken — tre fall som funkar, tre som inte gör det. | Insikter

Del 2 av 3 — Den andra i en serie om AI i retail. Förra delen: Sven — anatomi av en chatbot som funkar. Nästa: torsdag.

I förra veckans artikel etablerade jag att Sven-chatboten löser 80–90 procent av kundfrågorna hos vårt systerbolag Scenkonsult, inte tack vare AI-modellen utan tack vare det produktarbete som omger den. Det är en viktig poäng. Men den lämnar en obesvarad fråga: vilka andra AI-användningsfall i retail har samma potential? Och vilka är de där tekniken — eller produktarbetet — ännu inte räcker?

Vi har följt nio AI-pilotprojekt i nordisk retail under perioden 2024 till 2026. Tre har gått i produktion och levererar nu mätbara resultat. Fyra är pausade. Två är nedlagda. Det är inte ett slumpmässigt utfall — det följer ett mönster så tydligt att det är värt att namnge.

Det strukturella mönstret

De tre fallen som funkar har alla tre saker gemensamt:

Avgränsad input och output. Uppgiften är konkret definierad — vilken data går in, vilken slags beslut eller artefakt kommer ut. Inte "förstå kunden", utan "förutsäg efterfrågan per SKU per butik per vecka."

Mätbar baseline. Det finns ett tidigare tillstånd att jämföra med. En manuell prognos. En genomsnittlig handpåläggning. En tidsåtgång. Utan baseline finns det ingen ROI-historia att berätta.

Plats för en människa i loopen. AI:n föreslår. Människan beslutar — eller åtminstone granskar. Det är inte en svaghet utan en styrka. Det är vad som gör att verktyget kan användas i en verklig verksamhet utan att kräva 100 procents träffsäkerhet.

De tre fallen som inte funkar saknar minst en av dessa egenskaper. Oftast två. Mönstret är så konsekvent att det går att ställa upp som en scorecard.

Scorecard som visar sex AI-användningsfall i retail mot tre strukturella egenskaper. Tre fall - prognos och inköp, hyll-foto-analys, schemaläggning - uppfyller alla tre egenskaper och fungerar. Tre fall - generativ kundtjänst-chatbot utan disciplin, autonom checkout-skanning, generativ kampanj-content - saknar minst ett av kriterierna och är fortfarande slideware. — Figur 1. Sex AI-användningsfall i retail mot tre strukturella egenskaper. De tre som funkar uppfyller alla tre kriterier. De tre som inte gör det saknar minst ett — vanligtvis flera.

Tre som funkar

1. Prognos & automatiserat inköp

Det här är den mest mogna kategorin i nordisk retail just nu. Modellen får en avgränsad uppgift — förutsäg efterfrågan per SKU per butik per vecka — och tränas på historisk försäljningsdata, kampanjkalender och säsongsmönster. Output är ett beställningsförslag som inköparen kan acceptera, justera eller avvisa.

Det fungerar för att alla tre kriterier är uppfyllda: input/output är glasklara, baseline (manuell prognos eller säsongsmedelvärde) är välkänd, och inköparen är kvar i loopen som beslutsfattare. Hos våra dagligvaruklienter ligger mätbara resultat på 5–15 procents lägre svinn och 2–4 procentenheters bättre tillgänglighet på hyllan. Det är inte spekulativa siffror — det är dokumenterade förbättringar mot kontrollbutiker.

2. Hyll-foto-analys

Butiksmedarbetaren tar en bild av hyllan med mobilen. AI:n analyserar bilden och flaggar avvikelser: out-of-stock, fel produkt på fel plats, fel pris jämfört med kampanj, planogramsavvikelser. Output är en lista över åtgärder.

Det fungerar för att pattern recognition är just det AI är bäst på. Output är konkret (en lista), baseline är välkänd (tiden det tar att gå igenom hyllan manuellt), och människan tar beslutet om åtgärd. Tidsbesparing ligger typiskt på 15–30 minuter per butik per dag — vilket över en kedja med 100 butiker blir 250–500 arbetstimmar i veckan som flyttar från manuell genomgång till faktisk åtgärd.

3. Schemaläggning

Här binder vi tillbaka mot Peter Wiléns artikel om sommarbemanning för två veckor sedan. AI:n får tre datapunkter — kundtryck per timme, personalens tillgänglighet och kompetensprofiler, och en uppsättning regler — och producerar ett schemaförslag. Butikschefen granskar och justerar.

Det fungerar för att optimeringsproblemet är välbeskrivet, constraints är tydliga, och beslutet stannar hos butikschefen. Personalkostnaden i procent av försäljning kan sjunka med 1,5 till 3 procentenheter över en säsong. Samtidigt som kundnöjdheten stiger — inte sjunker.

3 av 6 av de vanligaste AI-användningsfallen i retail har gått i produktion. Tre är fortfarande slideware. Det är inte tekniken som skiljer dem åt — det är användningsfallets egenskaper.

Skillnaden mellan AI som levererar och AI som fastnar är inte teknisk. Den är strukturell — om uppgiften har avgränsad input, mätbar baseline och plats för en människa, levererar den. Annars inte.

Tre som inte funkar

1. Generativ kundtjänst-chatbot (utan disciplin)

Här blir det intressant — för det är just området där Sven framgångsrikt opererar. Och här syns hela poängen. Sven funkar inte för att han är en "generativ chatbot". Han funkar för att han har avgränsat scope (utrustning, priser, bokning), tydlig persona, knowledge base, och fallback till människa vid komplicerade lösningar. Han är en strukturerad rådgivare som råkar använda en LLM.

De flesta "generativa kundtjänst-chatbots" som retail-kedjor implementerat de senaste två åren har inte den disciplinen. De släpps loss att svara på "vad som helst", och deras input är osäkrad (kundens fråga, som kan handla om vad som helst), deras baseline är otydlig (vad jämför vi mot — den mänskliga supportagenten? FAQ-sidan?), och fallback-arkitekturen är ofta dålig. Resultatet: 60 procent av frågorna besvaras, men de 40 procent som inte gör det är just de där kunden faktiskt behöver hjälp. Nettoeffekten på NPS blir ofta negativ.

2. Autonom checkout-skanning

Konceptet: kameror i butikstaket detekterar vad kunden plockar och lägger på kortet automatiskt — ingen kassa, ingen scanner. Amazon Go-modellen.

Det fungerar inte i nordisk retail 2026, åtminstone inte i fullskala. Felmarginalen på detektering är fortfarande för hög för att utesluta svinn (eller felaktiga debiteringar, beroende på vem som har bevisbördan). Integrationskostnaden är skyhög. Och — kritiskt — human-in-the-loop är konceptuellt utesluten: hela poängen med systemet är att människan är borta. Det betyder att när systemet gör fel finns det ingen mjuk landning.

De stora pilotprojekten i Norden 2024–2025 har antingen pausats eller skalats ner till "smart checkout" där en kamera assisterar en kassör snarare än ersätter henne. Det är inte autonom checkout. Det är assisterad checkout. Och det är ett helt annat användningsfall — som faktiskt fungerar, eftersom det har human-in-the-loop.

3. Generativ kampanj-content

Konceptet: AI genererar bilder och text för marknadsföring — sociala medier-poster, kampanjbanners, e-handelstexter, butikskommunikation.

Det fungerar partiellt — för låg-stakes-content (sociala medier-poster utan affärspåverkan) är det användbart. Det fungerar inte för det som driver omsättning: kampanjer i butik, weekly ads, e-handelns kategorisidor. Anledningen är subtil men viktig: AI-genererat content saknar säljkraft.

Tekniskt är bilderna OK. Texterna är grammatiskt korrekta. Men de saknar de mikrobeslut en mänsklig copywriter eller designer gör — beslut baserade på kunskap om kunden, om varumärket, om vad som faktiskt får människor att klicka eller gå in i butiken. När A/B-tester genomförts i nordiska kedjor 2025 har AI-genererat content konsekvent underpresterat mänskligt content på konvertering. Med 10–25 procent.

"Men Sven då?"

Här uppstår en naturlig invändning. Om generativa kundtjänst-chatbots är på "funkar inte"-listan, hur kan Sven funka? Svaret är just det jag skissade i förra artikeln: Sven är inte en generativ chatbot. Han är en strukturerad rådgivare som råkar använda en LLM som underliggande motor.

Skillnaden är produktdesignen runt modellen, inte modellen själv. Och det är därför artikeln om Sven är en byggblock-artikel för retail-branschen, inte en chatbot-artikel. Samma disciplin som gör Sven funktionell — avgränsat scope, tydlig persona, knowledge base, fallback, admin-loop — är vad som skulle behöva appliceras på varje annan generativ AI-implementation. När det görs, flyttar vissa fall över från "funkar inte" till "funkar".

Det är därför 6/6-listan inte är statisk. Den kommer ändras under det kommande året. Inte för att tekniken förändras dramatiskt, utan för att fler bolag lär sig produktarbetet.

Den dolda variabeln — organisation över teknik

Det finns en sista observation värd att göra. Även inom de tre "funkar"-fallen är det inte alla bolag som får ut värdet. Vi har sett kedjor som implementerat prognos-AI utan att inköparna faktiskt använder rekommendationerna. Vi har sett hyll-foto-analys där åtgärdslistan aldrig läses. Vi har sett schemaläggnings-AI där butikschefen kör sin egen mall ovanpå.

Tekniken funkar. Men om organisationen inte är förberedd att använda outputen, levererar tekniken ändå inte. Det är inte AI-frågan, det är förändringsledning. Och det är ofta där de största värdeskillnaderna mellan retail-kedjor uppstår 2026.

Det här är del 2 av 3

Hittills har vi pratat om vad AI tekniskt kan göra och vad den ännu inte kan. Det är en pragmatisk fråga. Men det finns en separat fråga som är minst lika viktig: vad AI tekniskt kan göra men inte borde göra. Vilka beslut hör hemma hos människor, även när maskinen klarar dem?

Det är vad torsdagens artikel handlar om. Det är trilogins skarpaste position — och den jag tror kommer reta upp mest folk.

Tre artiklar. Tre teser. Ett sammanhang.

Part 2 of 3 — The second in a series on AI in retail. Previous: Sven — anatomy of a chatbot that works. Next: Thursday.

In last week's article I established that the Sven chatbot resolves 80–90 percent of customer questions at our sister company Scenkonsult, not thanks to the AI model but thanks to the product work surrounding it. That's an important point. But it leaves an open question: which other AI use cases in retail have the same potential? And which ones are still ones where the technology — or the product work — doesn't yet measure up?

We have followed nine AI pilot projects in Nordic retail between 2024 and 2026. Three have gone into production and are now delivering measurable results. Four are paused. Two have been shut down. This isn't a random outcome — it follows a pattern so clear it's worth naming.

The structural pattern

The three cases that work have three things in common:

Bounded input and output. The task is concretely defined — what data goes in, what kind of decision or artefact comes out. Not "understand the customer", but "forecast demand per SKU per store per week."

Measurable baseline. There's a prior state to compare against. A manual forecast. An average handling time. A time spent. Without a baseline, there's no ROI story to tell.

Room for a human in the loop. The AI suggests. The human decides — or at least reviews. This isn't a weakness but a strength. It's what makes the tool usable in an actual business without requiring 100 percent accuracy.

The three cases that don't work lack at least one of these properties. Usually two. The pattern is so consistent it can be laid out as a scorecard.

Scorecard showing six AI use cases in retail against three structural properties. Three cases - forecasting and purchasing, shelf-photo analysis, scheduling - meet all three properties and work. Three cases - generative customer-service chatbot without discipline, autonomous checkout scanning, generative campaign content - lack at least one criterion and remain slideware. — Figure 1. Six AI use cases in retail against three structural properties. The three that work meet all three criteria. The three that don't lack at least one — usually several.

Three that work

1. Forecasting & automated purchasing

This is the most mature category in Nordic retail right now. The model gets a bounded task — forecast demand per SKU per store per week — and trains on historical sales data, campaign calendar, and seasonal patterns. The output is an order suggestion the buyer can accept, adjust or reject.

It works because all three criteria are met: input/output is crystal clear, the baseline (manual forecast or seasonal average) is well-known, and the buyer remains in the loop as decision-maker. With our grocery clients, measurable results land at 5–15 percent lower shrinkage and 2–4 percentage points better shelf availability. These aren't speculative numbers — they're documented improvements against control stores.

2. Shelf-photo analysis

A store associate takes a photo of the shelf with a mobile phone. The AI analyses the image and flags deviations: out-of-stock, wrong product in wrong place, wrong price compared to campaign, planogram deviations. The output is an action list.

It works because pattern recognition is exactly what AI is best at. Output is concrete (a list), baseline is well-known (the time it takes to walk the shelf manually), and the human takes the action decision. Time savings typically land at 15–30 minutes per store per day — which across a 100-store chain becomes 250–500 work hours per week shifting from manual review to actual action.

3. Scheduling

Here we tie back to Peter Wilén's article on summer staffing two weeks ago. The AI receives three data points — customer pressure per hour, staff availability and competency profiles, and a set of rules — and produces a schedule proposal. The store manager reviews and adjusts.

It works because the optimisation problem is well-described, constraints are clear, and the decision stays with the store manager. Personnel cost as percent of revenue can drop by 1.5 to 3 percentage points across a season. While customer satisfaction rises — not falls.

3 of 6 of the most common AI use cases in retail have made it to production. Three are still slideware. It's not the technology that separates them — it's the properties of the use case.

The difference between AI that delivers and AI that gets stuck isn't technical. It's structural — if the task has bounded input, measurable baseline and room for a human, it delivers. Otherwise, it doesn't.

Three that don't work

1. Generative customer-service chatbot (without discipline)

Here it gets interesting — because this is precisely the area where Sven operates successfully. And here the whole point shows. Sven doesn't work because he's a "generative chatbot". He works because he has a bounded scope (equipment, prices, bookings), a clear persona, knowledge base, and fallback to a human for complex cases. He's a structured advisor who happens to use an LLM.

Most "generative customer-service chatbots" that retail chains have implemented in the past two years don't have that discipline. They're released to answer "anything", and their input is unbounded (the customer's question, which can be about anything), their baseline is unclear (what do we compare to — the human support agent? the FAQ page?), and the fallback architecture is often poor. The result: 60 percent of questions are answered, but the 40 percent that aren't are exactly the ones where the customer actually needs help. Net effect on NPS is often negative.

2. Autonomous checkout scanning

The concept: cameras in the store ceiling detect what the customer picks up and charges the card automatically — no register, no scanner. The Amazon Go model.

It doesn't work in Nordic retail in 2026, at least not at full scale. Detection error rate is still too high to rule out shrinkage (or wrongful charges, depending on who carries the burden of proof). Integration cost is sky-high. And — critically — human-in-the-loop is conceptually excluded: the whole point of the system is that the human is gone. That means when the system errs, there's no soft landing.

The large pilot projects in the Nordics 2024–2025 have either been paused or scaled down to "smart checkout" where a camera assists a cashier rather than replacing her. That isn't autonomous checkout. It's assisted checkout. And it's a completely different use case — which does work, because it has human-in-the-loop.

3. Generative campaign content

The concept: AI generates images and text for marketing — social media posts, campaign banners, e-commerce copy, in-store communication.

It works partially — for low-stakes content (social media posts without business impact) it's useful. It doesn't work for what drives revenue: in-store campaigns, weekly ads, e-commerce category pages. The reason is subtle but important: AI-generated content lacks sales pull.

Technically the images are OK. The texts are grammatically correct. But they lack the micro-decisions a human copywriter or designer makes — decisions based on knowledge of the customer, the brand, what actually gets people to click or walk into a store. When A/B tests were run in Nordic chains in 2025, AI-generated content consistently underperformed human content on conversion. By 10–25 percent.

"But what about Sven?"

Here a natural objection arises. If generative customer-service chatbots are on the "doesn't work" list, how can Sven work? The answer is precisely what I sketched in the previous article: Sven isn't a generative chatbot. He's a structured advisor who happens to use an LLM as the underlying engine.

The difference is the product design around the model, not the model itself. And that's why the article about Sven is a building-block article for the retail industry, not a chatbot article. The same discipline that makes Sven functional — bounded scope, clear persona, knowledge base, fallback, admin loop — is what would need to be applied to every other generative AI implementation. When it is, certain cases move from "doesn't work" to "works".

That's why the 6/6 list isn't static. It will shift over the coming year. Not because the technology changes dramatically, but because more companies learn the product work.

The hidden variable — organisation over technology

One last observation worth making. Even within the three "works" cases, it's not all companies that extract the value. We've seen chains that implemented forecasting AI without buyers actually using the recommendations. We've seen shelf-photo analysis where the action list is never read. We've seen scheduling AI where the store manager runs their own template on top of it.

The technology works. But if the organisation isn't prepared to use the output, the technology doesn't deliver either. That's not an AI question, it's change management. And it's often where the biggest value differences between retail chains arise in 2026.

This is part 2 of 3

So far we've talked about what AI technically can do and what it can't yet. That's a pragmatic question. But there's a separate question that's at least as important: what AI technically can do but shouldn't do. Which decisions belong with humans, even when the machine can handle them?

That's what Thursday's article is about. It's the trilogy's sharpest position — and the one I think will rile up the most people.

Three articles. Three theses. One context.

AI i butiken — tre fall som funkar, tre som inte gör det. AI in retail — three cases that work, three that don't.