RAG arhitektura: kako AI chatbot odgovarja na podlagi vaše dokumentacije
Ko implementiramo AI chatbot za podjetje, stranke pogosto vprašajo: »Ampak ali bo chatbot poznal naše specifične produkte, postopke in pravila?« Odgovor je: da — če je zgrajen na RAG arhitekturi.
RAG (Retrieval-Augmented Generation) je danes standard za poslovne AI chatbote. V tem članku razložimo, kako deluje in zakaj je boljši od alternativ.
Problem s splošnimi AI modeli
ChatGPT, Claude, Gemini so izjemno sposobni — a imajo eno ključno omejitev za poslovno rabo: ne poznajo vaše dokumentacije.
Vprašajte ChatGPT: »Kakšna je naša garancijska politika za produkt X?« — odgovora ne bo. Ali pa bo izmislil odgovor (halucinacija), kar je še huje.
Splošni AI modeli so naučeni na javno dostopnih podatkih. Vaše interne politike, cenik, postopki, tehnična dokumentacija — tega ne poznajo.
Kaj je RAG
RAG rešuje ta problem v dveh korakih:
Korak 1: Retrieve (Poišči)
Ko gost postavi vprašanje, sistem najprej preišče vašo dokumentacijo in poišče relevantne odlomke. To je podobno, kot da ima izkušen zaposleni pred seboj iskalnik po vseh internih dokumentih.
Korak 2: Generate (Generiraj)
Najdene relevantne odlomke sistem pošlje skupaj z vprašanjem v AI model (npr. Claude ali GPT-4). Model jih prebere in sestavi koherenten, točen odgovor — v naravnem jeziku, v slovenščini, v tonu vašega podjetja.
Rezultat: chatbot odgovori na podlagi vaše dejanske dokumentacije, ne splošnega znanja.
Vizualni prikaz delovanja
Gost: "Kakšen je rok dostave za naročilo nad 100 €?"
↓
[Vektorska baza] ← Hrani vašo dokumentacijo kot vektorje
↓ išče podobne odlomke
[Najdeni odlomki]: "Dostava je brezplačna pri naročilih nad 75 €.
Rok dostave: 2–3 delovne dni."
↓
[AI model] ← prejme vprašanje + najdene odlomke
↓
Chatbot: "Za naročila nad 100 € je dostava brezplačna in
traja 2–3 delovne dni."
Tehnične komponente (brez žargona)
Vektorska baza (Vector database)
Vaša dokumentacija se pretvori v matematične vektorje — numerične reprezentacije pomena besedila. Ko pride vprašanje, sistem poišče vektorje z najpodobnejšim pomenom.
Primer: vprašanje »garancija za sesalnik« bo našlo dokumente z besedami »jamstvo«, »warranty«, »popravilo«, »zamenjava« — ker imajo podoben pomen, ne samo enake besede.
Priljubljene vektorske baze: Pinecone, Weaviate, ChromaDB, pgvector (PostgreSQL razširitev).
Embedding model
Pretvori besedilo v vektorje. Vsak odstavek vaše dokumentacije se pretvori v seznam števil, ki opisuje pomen besedila.
LLM (Large Language Model)
Generira odgovor na podlagi vprašanja in najdenih odlomkov. Claude Sonnet, GPT-4o, Llama 3 — odvisno od zahtev (oblak ali on-premise).
Chunking strategija
Dokumentacija se razdeli na manjše kose (chunke) — tipično 200–500 besed z overlappom. Kakovost chunking strategije bistveno vpliva na kakovost odgovorov.
Zakaj je RAG boljši od alternativ
Alternativa 1: Fine-tuning modela
Fine-tuning pomeni, da model dodatno naučite na vaših podatkih. Drago (tisoče EUR), počasno, in ko se dokumentacija posodobi — morate model znova naučiti.
RAG vs fine-tuning: RAG je cenejši, hitrejši za posodobitev in boljši za faktografske odgovore.
Alternativa 2: Kontekstno okno (context stuffing)
Pošljete vso dokumentacijo v vsako zahtevo. Problem: drago (vsaka zahteva stane glede na dolžino), počasno, in modeli imajo limite (Claude: 200k tokenov, GPT-4: 128k tokenov — za obsežno dokumentacijo ni dovolj).
RAG vs context stuffing: RAG je drastično cenejši in hitrejši.
Alternativa 3: Preprosti FAQ chatboti
Ključni ujemanci (keyword matching) — odgovorijo samo na točno ujemanje. »Garancija« ≠ »jamstvo«. Pogosto frustrirajo stranke.
RAG vs FAQ: RAG razume pomen, ne samo besede.
Kdaj RAG deluje odlično
✅ Strukturirana dokumentacija: Dobro organizirani PDF-ji, navodila, FAQ, politike podjetja
✅ Pogosta ponavljajoča se vprašanja: Ko stranke vedno sprašujejo ista vprašanja o istih stvareh
✅ Visoka specifičnost: Ko morajo odgovori temeljiti na vaših točnih specifikacijah, ne splošnem znanju
✅ Večjezičnost: RAG deluje odlično med jeziki — dokumentacija v slovenščini, vprašanje v angleščini, odgovor v angleščini
Kdaj RAG ni idealna rešitev
❌ Zelo nestrukturirana dokumentacija: Skenirani papirji brez OCR, neurejena zbirka dokumentov
❌ Kompleksno sklepanje: Ko odgovor zahteva kompleksno analizo ali primerjavo med 10+ dokumenti
❌ Realnočasovni podatki: Cene delnic, trenutni status logistike — za to je potrebna integracija z živo bazo, ne RAG
❌ Primarno kreativne naloge: Pisanje marketinških besedil, kreativno razmišljanje — splošni modeli so boljši
Kakovost RAG sistema je odvisna od dokumentacije
Najpogostejša napaka pri implementaciji: slaba dokumentacijska baza.
Znano načelo: Garbage in, garbage out. Če je vaša dokumentacija:
- Zastarela (informacije iz leta 2019)
- Nestrukturirana (skenirani dokumenti brez OCR)
- Protislovna (stara in nova politika v istem dokumentu)
...bo chatbot odgovarjal slabo, ne glede na kakovost AI modela.
Priporočilo pred implementacijo:
- Revidirajte obstoječo dokumentacijo
- Posodobite zastarele informacije
- Strukturirajte v jasne, ločene dokumente po temah
- Dodajte metapodatke (datum, kategorija, oddelek)
Varnost in zasebnost pri RAG
Oblačni RAG
Dokumentacija se shrani v oblačni vektorski bazi (Pinecone, Weaviate cloud). Vprašanja se posredujejo oblačnemu AI modelu. Primerno za dokumentacijo brez zaupnih podatkov.
On-premise RAG
Vsa komponenta tečejo na vaši infrastrukturi:
- Lokalni embedding model
- Lokalna vektorska baza (ChromaDB, pgvector)
- Lokalni LLM (Llama 3, Mistral, DeepSeek)
Nobeni podatki ne zapustijo vašega omrežja. Primerno za zdravstvo, pravo, finance, javni sektor.
Cena implementacije RAG chatbota
| Obseg | Opis | Cena |
|---|---|---|
| Osnovni RAG | Do 500 dokumentov, oblak, 1 jezik | 3.500–5.000 € |
| Srednji RAG | 500–5.000 dokumentov, oblak, 3+ jeziki | 5.000–8.000 € |
| Enterprise RAG | 5.000+ dokumentov, integracije | 8.000–15.000 € |
| On-premise RAG | Lokalna infrastruktura, NDA podatki | 12.000–35.000 € |
Mesečno vzdrževanje: 150–400 €/mes (posodabljanje dokumentacije, monitoring).
Povzetek
RAG je danes de facto standard za poslovne AI chatbote. Omogoča, da AI model odgovarja na podlagi vaše dejanske dokumentacije — natančno, v slovenščini, 24/7.
Ključni pogoj za uspeh: kakovostna in ažurna dokumentacijska baza.
Za brezplačen pregled, ali je vaša dokumentacija primerna za RAG chatbot, nas kontaktirajte.