RAG arhitektura: kako AI chatbot odgovarja na podlagi vaše dokumentacije

17. junij 20265 min branja

Avtor: Matej Spevan / CreateAI. Članek temelji na praktičnih SEO, GEO in AI implementacijah za slovenska podjetja.

Ko implementiramo AI chatbot za podjetje, stranke pogosto vprašajo: »Ampak ali bo chatbot poznal naše specifične produkte, postopke in pravila?« Odgovor je: da — če je zgrajen na RAG arhitekturi.

RAG (Retrieval-Augmented Generation) je danes standard za poslovne AI chatbote. V tem članku razložimo, kako deluje in zakaj je boljši od alternativ.

Problem s splošnimi AI modeli

ChatGPT, Claude, Gemini so izjemno sposobni — a imajo eno ključno omejitev za poslovno rabo: ne poznajo vaše dokumentacije.

Vprašajte ChatGPT: »Kakšna je naša garancijska politika za produkt X?« — odgovora ne bo. Ali pa bo izmislil odgovor (halucinacija), kar je še huje.

Splošni AI modeli so naučeni na javno dostopnih podatkih. Vaše interne politike, cenik, postopki, tehnična dokumentacija — tega ne poznajo.

Kaj je RAG

RAG rešuje ta problem v dveh korakih:

Korak 1: Retrieve (Poišči)

Ko gost postavi vprašanje, sistem najprej preišče vašo dokumentacijo in poišče relevantne odlomke. To je podobno, kot da ima izkušen zaposleni pred seboj iskalnik po vseh internih dokumentih.

Korak 2: Generate (Generiraj)

Najdene relevantne odlomke sistem pošlje skupaj z vprašanjem v AI model (npr. Claude ali GPT-4). Model jih prebere in sestavi koherenten, točen odgovor — v naravnem jeziku, v slovenščini, v tonu vašega podjetja.

Rezultat: chatbot odgovori na podlagi vaše dejanske dokumentacije, ne splošnega znanja.

Vizualni prikaz delovanja

Gost: "Kakšen je rok dostave za naročilo nad 100 €?"
         ↓
[Vektorska baza] ← Hrani vašo dokumentacijo kot vektorje
         ↓ išče podobne odlomke
[Najdeni odlomki]: "Dostava je brezplačna pri naročilih nad 75 €. 
                    Rok dostave: 2–3 delovne dni."
         ↓
[AI model] ← prejme vprašanje + najdene odlomke
         ↓
Chatbot: "Za naročila nad 100 € je dostava brezplačna in 
          traja 2–3 delovne dni."

Tehnične komponente (brez žargona)

Vektorska baza (Vector database)

Vaša dokumentacija se pretvori v matematične vektorje — numerične reprezentacije pomena besedila. Ko pride vprašanje, sistem poišče vektorje z najpodobnejšim pomenom.

Primer: vprašanje »garancija za sesalnik« bo našlo dokumente z besedami »jamstvo«, »warranty«, »popravilo«, »zamenjava« — ker imajo podoben pomen, ne samo enake besede.

Priljubljene vektorske baze: Pinecone, Weaviate, ChromaDB, pgvector (PostgreSQL razširitev).

Embedding model

Pretvori besedilo v vektorje. Vsak odstavek vaše dokumentacije se pretvori v seznam števil, ki opisuje pomen besedila.

LLM (Large Language Model)

Generira odgovor na podlagi vprašanja in najdenih odlomkov. Claude Sonnet, GPT-4o, Llama 3 — odvisno od zahtev (oblak ali on-premise).

Chunking strategija

Dokumentacija se razdeli na manjše kose (chunke) — tipično 200–500 besed z overlappom. Kakovost chunking strategije bistveno vpliva na kakovost odgovorov.

Zakaj je RAG boljši od alternativ

Alternativa 1: Fine-tuning modela

Fine-tuning pomeni, da model dodatno naučite na vaših podatkih. Drago (tisoče EUR), počasno, in ko se dokumentacija posodobi — morate model znova naučiti.

RAG vs fine-tuning: RAG je cenejši, hitrejši za posodobitev in boljši za faktografske odgovore.

Alternativa 2: Kontekstno okno (context stuffing)

Pošljete vso dokumentacijo v vsako zahtevo. Problem: drago (vsaka zahteva stane glede na dolžino), počasno, in modeli imajo limite (Claude: 200k tokenov, GPT-4: 128k tokenov — za obsežno dokumentacijo ni dovolj).

RAG vs context stuffing: RAG je drastično cenejši in hitrejši.

Alternativa 3: Preprosti FAQ chatboti

Ključni ujemanci (keyword matching) — odgovorijo samo na točno ujemanje. »Garancija« ≠ »jamstvo«. Pogosto frustrirajo stranke.

RAG vs FAQ: RAG razume pomen, ne samo besede.

Kdaj RAG deluje odlično

✅ Strukturirana dokumentacija: Dobro organizirani PDF-ji, navodila, FAQ, politike podjetja

✅ Pogosta ponavljajoča se vprašanja: Ko stranke vedno sprašujejo ista vprašanja o istih stvareh

✅ Visoka specifičnost: Ko morajo odgovori temeljiti na vaših točnih specifikacijah, ne splošnem znanju

✅ Večjezičnost: RAG deluje odlično med jeziki — dokumentacija v slovenščini, vprašanje v angleščini, odgovor v angleščini

Kdaj RAG ni idealna rešitev

❌ Zelo nestrukturirana dokumentacija: Skenirani papirji brez OCR, neurejena zbirka dokumentov

❌ Kompleksno sklepanje: Ko odgovor zahteva kompleksno analizo ali primerjavo med 10+ dokumenti

❌ Realnočasovni podatki: Cene delnic, trenutni status logistike — za to je potrebna integracija z živo bazo, ne RAG

❌ Primarno kreativne naloge: Pisanje marketinških besedil, kreativno razmišljanje — splošni modeli so boljši

Kakovost RAG sistema je odvisna od dokumentacije

Najpogostejša napaka pri implementaciji: slaba dokumentacijska baza.

Znano načelo: Garbage in, garbage out. Če je vaša dokumentacija:

Zastarela (informacije iz leta 2019)
Nestrukturirana (skenirani dokumenti brez OCR)
Protislovna (stara in nova politika v istem dokumentu)

...bo chatbot odgovarjal slabo, ne glede na kakovost AI modela.

Priporočilo pred implementacijo:

Revidirajte obstoječo dokumentacijo
Posodobite zastarele informacije
Strukturirajte v jasne, ločene dokumente po temah
Dodajte metapodatke (datum, kategorija, oddelek)

Varnost in zasebnost pri RAG

Oblačni RAG

Dokumentacija se shrani v oblačni vektorski bazi (Pinecone, Weaviate cloud). Vprašanja se posredujejo oblačnemu AI modelu. Primerno za dokumentacijo brez zaupnih podatkov.

On-premise RAG

Vsa komponenta tečejo na vaši infrastrukturi:

Lokalni embedding model
Lokalna vektorska baza (ChromaDB, pgvector)
Lokalni LLM (Llama 3, Mistral, DeepSeek)

Nobeni podatki ne zapustijo vašega omrežja. Primerno za zdravstvo, pravo, finance, javni sektor.

Cena implementacije RAG chatbota

Obseg	Opis	Cena
Osnovni RAG	Do 500 dokumentov, oblak, 1 jezik	3.500–5.000 €
Srednji RAG	500–5.000 dokumentov, oblak, 3+ jeziki	5.000–8.000 €
Enterprise RAG	5.000+ dokumentov, integracije	8.000–15.000 €
On-premise RAG	Lokalna infrastruktura, NDA podatki	12.000–35.000 €

Mesečno vzdrževanje: 150–400 €/mes (posodabljanje dokumentacije, monitoring).

Povzetek

RAG je danes de facto standard za poslovne AI chatbote. Omogoča, da AI model odgovarja na podlagi vaše dejanske dokumentacije — natančno, v slovenščini, 24/7.

Ključni pogoj za uspeh: kakovostna in ažurna dokumentacijska baza.

Za brezplačen pregled, ali je vaša dokumentacija primerna za RAG chatbot, nas kontaktirajte.

Sorodni članki

Potrebujete pomoč pri implementaciji?

Brezplačen 30-minutni posvet z našo ekipo.

Brezplačen posvet →