Učenje iz prekinitev: Kako naš AI zapomni vaše preference (ne da bi bil čudaški)
Vsakič, ko odobrite ali zavrnete AI-jevo akcijo, se uči. Po 5 odobritvah se ta akcija zgodi samodejno.
Problem Human-in-the-Loop
AI agenti potrebujejo nadzor. Lahko:
- Izvedejo napačni ukaz
- Predlagajo nevarne operacije
- Naredijo drage API klice
- Dostopajo do občutljivih podatkov
Torej dodamo prekinitve:
Ampak to ustvarja trenje. Vsaka akcija potrebuje odobritev. AI se zdi počasen.
Rešitev? Učiti se iz prekinitev.
Kako deluje Interrupt Memory
Korak 1: Zabeleži odločitev
Ko odobrite ali zavrnete:
To ustvari InterruptRecord:
Korak 2: Posodobi Tool Preference
Vsaka odločitev posodobi vaše ToolApprovalPreference:
Algoritem učenja:
Korak 3: Samodejno odobri prihodnje akcije
Naslednjič ko AI želi uporabiti ta tool:
Primer iz resničnega sveta
Teden 1: Nov uporabnik, vse prekinja
| Akcija | Odločitev | Števec |
|---|---|---|
Izvedi ls | ✅ Odobreno | 1/0 |
Izvedi cat file.txt | ✅ Odobreno | 2/0 |
Izvedi rm temp.txt | ✅ Odobreno | 3/0 |
Izvedi git status | ✅ Odobreno | 4/0 |
Izvedi git commit | ✅ Odobreno | 5/0 |
Teden 2: Vzorec se pojavi
| Akcija | Odločitev | Statistika |
|---|---|---|
Izvedi ls | ✅ Samodejno odobreno | 6/0 (100%) |
Izvedi cat | ✅ Samodejno odobreno | 4/0 (100%) |
Izvedi rm | ⛔ Prekinja | 3/2 (60%) |
Izvedi npm publish | ⛔ Prekinja | 1/3 (25%) |
Rezultat:
- Varni, pogosti ukazi se izvedejo takoj
- Destruktivne operacije še vedno potrebujejo odobritev
- Akcije z visokimi vložki vedno prekinjajo
Zasebnost in nadzor
Uporabniški nadzor
Uporabniki lahko:
- Ogledajo vse zabeležene odločitve
- Izbrišejo zgodovino prekinitev
- Onemogočijo samodejno odobritev globalno
- Zahtevajo odobritev za specifične toole
Kaj shranjujemo
✅ Shranjujemo:
- Imena toolov (execute, persist, call-service)
- Odločitev (approved/rejected)
- Timestamp
- Anonimizirane vzorce
❌ Ne shranjujemo:
- Občutljive vrednosti argumentov
- Vsebino datotek
- API odzive
- Gesla ali skrivnosti
Transparentnost
Vsaka samodejno odobrena akcija je zabeležena:
Krivulja učenja
Različni tooli se učijo z različnimi hitrostmi:
| Tool | Hitrost učenja | Zakaj |
|---|---|---|
read_file | Hitro | Nizko tveganje, konsistentno |
write_file | Srednje | Srednje tveganje |
execute | Počasi | Visoko tveganje, kontekstno odvisno |
call_service | Nikoli | Vedno zahteva odobritev |
Pragi zaupanja
Primer kode: Celoten potek
Primerjava iz resničnega sveta: Pametni domači asistent
Mislite nanj kot na pameten dom:
Teden 1:
- Vi: "Ugasi luči"
- Asistent: "Ali naj ugasnem vse luči?" [Da] [Ne]
- Vi: [Da]
Teden 2:
- Vi: "Ugasi luči"
- Asistent: Ugasi luči (se je naučil, da vedno rečete da)
Ampak:
- Vi: "Odkleni vhodna vrata"
- Asistent: "Potrdi odklepanje?" [Da] [Ne]
- Vedno vpraša, ker varnost > udobje
Asistent se uči vzorcev, a spoštuje meje.
Koristi
Za uporabnike
- ✅ Manj trenja sčasoma
- ✅ Še vedno pod nadzorom
- ✅ Transparentno učenje
- ✅ Spoštovanje zasebnosti
Za AI agente
- ✅ Hitrejše izvajanje
- ✅ Boljša uporabniška izkušnja
- ✅ Kontekstualno razumevanje
- ✅ Varno privzeto
Za ekipe
- ✅ Konsistentni vzorci med uporabniki
- ✅ Sled odločitev za audit
- ✅ Identifikacija tveganega tool usage
Spoznanje
Prekinitve ne morajo biti nadležne. Lahko so priložnosti za učenje.
Vsaka odobritev uči AI:
- Kaj štejete za varno
- Vaše preferirane workflowe
- Katere akcije potrebujejo skrbni pregled
Sčasoma AI postane razširitev vašega namena — hiter, ko mora biti hiter, previden, ko mora biti previden.
To ni samo avtomatizacija. To je sodelovanje.
Več o Orbital Memory.
