Odkar je Anthropicu na internet
ušel znaten del Claudove izvorne kode, se na internetu vrstijo njene analize ter
odkrivanje zanimivih in uporabnih podrobnosti. Med drugim Claude
izrecno spremlja, ali uporabniki kolnejo oziroma kako drugače izražajo frustracijo. Ni povsem jasno, zakaj to počne.
V kodi so odkrili regularne izraze (regex), ki iščejo sočne izraze (npr.
WTF, dammit, OMG, awful in podobno). Razlogov za to početje bi lahko bilo več, izpostaviti pa velja dva. Na tak način lahko Anthropic zelo učinkovito spremlja, ali so novi modeli in nadgradnje učinkoviti ali ne, ali spravljajo uporabnike v obup in ob živce ali ne.
Po drugi strani pa se lahko model začne odzivati drugače, na primer bolj empatično in pomirjujoče, če pri uporabniku zazna frustracije. Anthropic ni pojasnil, katera teorija drži - lahko jih drži tudi več - vemo pa, da ta funkcionalnost v kodi obstaja.
Regex seveda ni nič novega, temveč več desetletij stara tehnologija. Umetna inteligenca bi frustracije in kletvice lahko iskala tudi z jezikovnimi modeli, a to stane. Preprost regex je bil očitno povsem zadovoljiva rešitev, da polovijo najhujše frustracije.
[st.slika 76284][st.slika 76285]