← Vsi članki
AI

RAG arhitektura: kako AI chatbot odgovarja na podlagi vaše dokumentacije

17. junij 20265 min branja
Avtor: Matej Spevan / CreateAI. Članek temelji na praktičnih SEO, GEO in AI implementacijah za slovenska podjetja.

Ko implementiramo AI chatbot za podjetje, stranke pogosto vprašajo: »Ampak ali bo chatbot poznal naše specifične produkte, postopke in pravila?« Odgovor je: da — če je zgrajen na RAG arhitekturi.

RAG (Retrieval-Augmented Generation) je danes standard za poslovne AI chatbote. V tem članku razložimo, kako deluje in zakaj je boljši od alternativ.

Problem s splošnimi AI modeli

ChatGPT, Claude, Gemini so izjemno sposobni — a imajo eno ključno omejitev za poslovno rabo: ne poznajo vaše dokumentacije.

Vprašajte ChatGPT: »Kakšna je naša garancijska politika za produkt X?« — odgovora ne bo. Ali pa bo izmislil odgovor (halucinacija), kar je še huje.

Splošni AI modeli so naučeni na javno dostopnih podatkih. Vaše interne politike, cenik, postopki, tehnična dokumentacija — tega ne poznajo.

Kaj je RAG

RAG rešuje ta problem v dveh korakih:

Korak 1: Retrieve (Poišči)

Ko gost postavi vprašanje, sistem najprej preišče vašo dokumentacijo in poišče relevantne odlomke. To je podobno, kot da ima izkušen zaposleni pred seboj iskalnik po vseh internih dokumentih.

Korak 2: Generate (Generiraj)

Najdene relevantne odlomke sistem pošlje skupaj z vprašanjem v AI model (npr. Claude ali GPT-4). Model jih prebere in sestavi koherenten, točen odgovor — v naravnem jeziku, v slovenščini, v tonu vašega podjetja.

Rezultat: chatbot odgovori na podlagi vaše dejanske dokumentacije, ne splošnega znanja.

Vizualni prikaz delovanja

Gost: "Kakšen je rok dostave za naročilo nad 100 €?"
         ↓
[Vektorska baza] ← Hrani vašo dokumentacijo kot vektorje
         ↓ išče podobne odlomke
[Najdeni odlomki]: "Dostava je brezplačna pri naročilih nad 75 €. 
                    Rok dostave: 2–3 delovne dni."
         ↓
[AI model] ← prejme vprašanje + najdene odlomke
         ↓
Chatbot: "Za naročila nad 100 € je dostava brezplačna in 
          traja 2–3 delovne dni."

Tehnične komponente (brez žargona)

Vektorska baza (Vector database)

Vaša dokumentacija se pretvori v matematične vektorje — numerične reprezentacije pomena besedila. Ko pride vprašanje, sistem poišče vektorje z najpodobnejšim pomenom.

Primer: vprašanje »garancija za sesalnik« bo našlo dokumente z besedami »jamstvo«, »warranty«, »popravilo«, »zamenjava« — ker imajo podoben pomen, ne samo enake besede.

Priljubljene vektorske baze: Pinecone, Weaviate, ChromaDB, pgvector (PostgreSQL razširitev).

Embedding model

Pretvori besedilo v vektorje. Vsak odstavek vaše dokumentacije se pretvori v seznam števil, ki opisuje pomen besedila.

LLM (Large Language Model)

Generira odgovor na podlagi vprašanja in najdenih odlomkov. Claude Sonnet, GPT-4o, Llama 3 — odvisno od zahtev (oblak ali on-premise).

Chunking strategija

Dokumentacija se razdeli na manjše kose (chunke) — tipično 200–500 besed z overlappom. Kakovost chunking strategije bistveno vpliva na kakovost odgovorov.

Zakaj je RAG boljši od alternativ

Alternativa 1: Fine-tuning modela

Fine-tuning pomeni, da model dodatno naučite na vaših podatkih. Drago (tisoče EUR), počasno, in ko se dokumentacija posodobi — morate model znova naučiti.

RAG vs fine-tuning: RAG je cenejši, hitrejši za posodobitev in boljši za faktografske odgovore.

Alternativa 2: Kontekstno okno (context stuffing)

Pošljete vso dokumentacijo v vsako zahtevo. Problem: drago (vsaka zahteva stane glede na dolžino), počasno, in modeli imajo limite (Claude: 200k tokenov, GPT-4: 128k tokenov — za obsežno dokumentacijo ni dovolj).

RAG vs context stuffing: RAG je drastično cenejši in hitrejši.

Alternativa 3: Preprosti FAQ chatboti

Ključni ujemanci (keyword matching) — odgovorijo samo na točno ujemanje. »Garancija« ≠ »jamstvo«. Pogosto frustrirajo stranke.

RAG vs FAQ: RAG razume pomen, ne samo besede.

Kdaj RAG deluje odlično

Strukturirana dokumentacija: Dobro organizirani PDF-ji, navodila, FAQ, politike podjetja

Pogosta ponavljajoča se vprašanja: Ko stranke vedno sprašujejo ista vprašanja o istih stvareh

Visoka specifičnost: Ko morajo odgovori temeljiti na vaših točnih specifikacijah, ne splošnem znanju

Večjezičnost: RAG deluje odlično med jeziki — dokumentacija v slovenščini, vprašanje v angleščini, odgovor v angleščini

Kdaj RAG ni idealna rešitev

Zelo nestrukturirana dokumentacija: Skenirani papirji brez OCR, neurejena zbirka dokumentov

Kompleksno sklepanje: Ko odgovor zahteva kompleksno analizo ali primerjavo med 10+ dokumenti

Realnočasovni podatki: Cene delnic, trenutni status logistike — za to je potrebna integracija z živo bazo, ne RAG

Primarno kreativne naloge: Pisanje marketinških besedil, kreativno razmišljanje — splošni modeli so boljši

Kakovost RAG sistema je odvisna od dokumentacije

Najpogostejša napaka pri implementaciji: slaba dokumentacijska baza.

Znano načelo: Garbage in, garbage out. Če je vaša dokumentacija:

  • Zastarela (informacije iz leta 2019)
  • Nestrukturirana (skenirani dokumenti brez OCR)
  • Protislovna (stara in nova politika v istem dokumentu)

...bo chatbot odgovarjal slabo, ne glede na kakovost AI modela.

Priporočilo pred implementacijo:

  1. Revidirajte obstoječo dokumentacijo
  2. Posodobite zastarele informacije
  3. Strukturirajte v jasne, ločene dokumente po temah
  4. Dodajte metapodatke (datum, kategorija, oddelek)

Varnost in zasebnost pri RAG

Oblačni RAG

Dokumentacija se shrani v oblačni vektorski bazi (Pinecone, Weaviate cloud). Vprašanja se posredujejo oblačnemu AI modelu. Primerno za dokumentacijo brez zaupnih podatkov.

On-premise RAG

Vsa komponenta tečejo na vaši infrastrukturi:

  • Lokalni embedding model
  • Lokalna vektorska baza (ChromaDB, pgvector)
  • Lokalni LLM (Llama 3, Mistral, DeepSeek)

Nobeni podatki ne zapustijo vašega omrežja. Primerno za zdravstvo, pravo, finance, javni sektor.

Cena implementacije RAG chatbota

Obseg Opis Cena
Osnovni RAG Do 500 dokumentov, oblak, 1 jezik 3.500–5.000 €
Srednji RAG 500–5.000 dokumentov, oblak, 3+ jeziki 5.000–8.000 €
Enterprise RAG 5.000+ dokumentov, integracije 8.000–15.000 €
On-premise RAG Lokalna infrastruktura, NDA podatki 12.000–35.000 €

Mesečno vzdrževanje: 150–400 €/mes (posodabljanje dokumentacije, monitoring).

Povzetek

RAG je danes de facto standard za poslovne AI chatbote. Omogoča, da AI model odgovarja na podlagi vaše dejanske dokumentacije — natančno, v slovenščini, 24/7.

Ključni pogoj za uspeh: kakovostna in ažurna dokumentacijska baza.

Za brezplačen pregled, ali je vaša dokumentacija primerna za RAG chatbot, nas kontaktirajte.

Sorodni članki

AI
AI chatbot za hotel: vodič za gostinstvo 2026
Kako AI chatbot poveča direktne rezervacije hotela, zmanjša obremenitev recepcije in odgovarja gostom 24/7. Konkretni primeri in ROI za slovenska gostinska podjetja.
AI
Koliko stane AI chatbot za podjetje v Sloveniji (2026)
Realni cenovni razponi za AI chatbot za slovenska podjetja 2026. Od 3.500 € do 18.000 €. Kaj vpliva na ceno in kdaj se investicija povrne.
AI
AI za socialna omrežja: LinkedIn, Instagram, Meta Ads (vodič 2026)
Kako AI pomaga pri vsebinah, A/B testih in oglasih na LinkedIn, Instagram in Meta. Praktični vodič za slovenske B2B in B2C ekipe.

Potrebujete pomoč pri implementaciji?

Brezplačen 30-minutni posvet z našo ekipo.

Brezplačen posvet →