Alapfogalmak közérthetően, röviden

AI Gy.I.K, azaz a mesterséges intelligencia mögötti alapfogalmak, hogy egy ötödikes is megértse. Tehát, mi is az a…?

AI alapfogalmak

  • AGI: Az AGI (Artificial General Intelligence, javaslatom magyar fordításra: Általános Gépi Intelligencia) egy olyan mesterséges intelligencia típus, amely képes bármely intellektuális feladatot megtanulni és elvégezni, amelyet az emberek. Célja, hogy egyetemes mesterséges intelligenciaként bármilyen ember által elvégezhető feladatra alkalmas legyen.
  • API (Application Programming Interface, alkalmazásprogramozási interfész): Szabályok és protokollok összessége, mely lehetővé teszi szoftveralkalmazások közötti kommunikációt és adatmegosztást, különféle szolgáltatások, mint például mesterséges intelligencia-szolgáltatások integrálásához.
  • Autonóm ügynökök: Az autonóm ügynökök képesek komplex feladatokat végrehajtani: tervezt készítenek, feladatokat hoznak létre maguknak maguknak, elvégezik őket, memóriát és eszközöket használhatnak. Az AutoGPT és a BabyAGI jelenleg az autonóm ügynökök legjobb példái. (Bár a BabyAGI használja az “AGI” kifejezést, ez egy kicsit nagyra törő cím az autonóm ügynök számára, mivel egyelőre nem közelíti meg azt, amit AGI-nak nevezhetnénk.)
  • Chatbot: Olyan szoftveralkalmazás, amely mesterséges intelligenciát használ a felhasználókkal folytatott emberhez hasonló beszélgetések szimulálására, gyakran ügyfélszolgálati vagy értékesítési célokra. Erre példákat itt is találsz.
  • Mesterséges intelligencia (MI, angolul artificial intelligence, AI): Olyan számítógépes program, amely képes tanulni és döntéseket hozni, az emberi intelligenciát utánozva önállóan gondolkodást szimulálni. Alapvetően statisztikai alapon működik.
  • Generatív AI: Mesterséges intelligencia típus, amely képes új, korábban nem létező adatokat generálni, mint például szövegeket, képeket, vagy zenét, kreatív és önálló módon.
  • Gépi tanulás (ML, machine learning): A mesterséges intelligencia egy alcsoportja, ahol az algoritmusok adatokból tanulnak anélkül, hogy kifejezetten minden lehetséges forgatókönyvre beprogramoznák őket.
  • Gépi látás: A mesterséges intelligencia azon területe, amely lehetővé teszi a számítógépek számára, hogy feldolgozzák (értelmezzék és megértsék) a világ vizuális információit, például a képeket vagy videókat.
  • GPT (Generative Pre-trained Transformer): A nagyméretű neurális hálózat architektúrájának egy típusa, amelyet természetes nyelvfeldolgozási feladatokra, például szöveggenerálásra és fordításra terveztek. A GPT modelleket hatalmas mennyiségű adaton előre betanítják, és finomhangolhatók az adott feladatokhoz, így lehetővé teszik számukra, hogy kiváló minőségű, emberhez hasonló szöveget generáljanak.
  • Grounding (megalapozott utalás, hivatkozás): A mesterséges intelligencia képessége, hogy az általa generált koncepciókat valós világi objektumokhoz, eseményekhez vagy jelentésekhez kapcsolja, így növelve a kommunikáció relevanciáját és értelmezhetőségét. Lásd még: hallucináció.
  • Hallucináció: Amikor egy AI modell, például egy nyelvi modell, irreleváns vagy valótlan információkat generál, amelyek nem tükrözik pontosan a bemeneti adatokat vagy a valóságot. Lásd még: Grounding.
  • LLM (Large Language Model, nagy nyelvi modell): A mesterséges intelligenciamodell egy olyan típusa, amely gyakran a transzformátor architektúrán alapul, és amelyet hatalmas mennyiségű szöveges adaton képeznek ki. Az LLM-ek képesek emberhez hasonló szöveget generálni, kérdésekre válaszolni és különböző NLP-feladatokat nagy pontossággal elvégezni. Az AI chatbotok, pl. ChatGPT is erre épül.
  • Mélytanulás (deep learning): Az ML egy olyan részterülete, amely neurális hálózatokat használ arra, hogy nagy mennyiségű adatból összetett mintákat és reprezentációkat tanuljon.
  • Modell: A mesterséges intelligencia kontextusában a modell egy valós folyamat matematikai reprezentációját jelenti, amelyet egy algoritmus tanul meg a képzési adatokból. A modelleket előrejelzések készítésére, adatok osztályozására vagy más feladatok elvégzésére használják a megtanult minták alapján.
  • Multimodális: Mesterséges intelligenciák, amelyek képesek egyszerre több típusú adatot, például szöveget, képet, hangot feldolgozni, integrálva a különböző adatforrásokból származó információkat.

Kicsit mélyebb víz

  • Beágyazás (embedding): A gépi tanulásban alkalmazott technika, amely összetett adatokat, például szavakat vagy képeket, tömör, de informatív vektortérbe helyez, megkönnyítve az algoritmusok számára az információk közötti kapcsolatok megértését.
  • Context window („Munkamemória”): A mesterséges intelligencia, különösen a nyelvi modellek kontextusának meghatározására szolgáló mechanizmus, amely meghatározza, hogy a modell mennyi és milyen korábbi információt képes figyelembe venni a döntések meghozatalakor vagy a szöveg generálásakor.
  • Corpus: Szöveges adathalmaz, amelyet nyelvi modellek képzésére vagy tesztelésére használnak. A corpusok lehetnek specifikus témájúak vagy általános felhasználásúak, és az adatok minősége alapvetően befolyásolja a modellek teljesítményét.
  • Érzelemelemzés (sentiment analysis): Olyan mesterséges intelligencia-alapú technika, amely meghatározza a szövegben kifejezett érzelmi hangnemet vagy hozzáállást, gyakran használják a közösségi média megfigyeléséhez és az ügyfelek visszajelzéseinek elemzéséhez.
  • Eszköz (OpenAPI specifikációnak megfelelő API hívás): Szabványos módszer API-k dokumentálására és interakciójára, amely lehetővé teszi a fejlesztők számára, hogy meghatározott interfészeken keresztül kommunikáljanak szoftveralkalmazásokkal.
  • Finomhangolás (fine tuning): Már betanított MI-modell adott feladathoz vagy adathalmazhoz való igazításának folyamata, lehetővé téve a specifikus feladatok finomított elvégzését. A finomhangolás gyakran úgy történik, hogy a modellt további feladatspecifikus adatokon képzik, ami lehetővé teszi a modell számára, hogy jobban válaszoljon anélkül, hogy elveszítené az előzetes képzés során megszerzett általános tudást. Adott feladatokon illetve kontextusban jobb eredmény érhető el akár kisebb modellel is finomhangolás után.
  • GAN (Generative Adversarial Network): A mélytanulási modell egy típusa, amely két neurális hálózatból, egy generátorból és egy diszkriminátorból áll, amelyek egymással versenyeznek. A generátor adatokat hoz létre, a diszkriminátor pedig értékeli, hogy az adatok valódiságát, így ösztökélve minél jobb minőségű kimenet generálására. A GAN-okat gyakran használják olyan feladatokra, mint például képek generálása vagy alacsony felbontású képek javítása.
  • Inference (Következtetés): Az a folyamat, amelynél egy betanított mesterséges intelligencia modell képes előrejelzéseket, döntéseket hozni, vagy adatokat értelmezni, anélkül, hogy további képzést igényelne. A generatív AI generálási folyamatára is hivatkozhatunk így.
  • Neurális hálózat (neural network): Az emberi agy szerkezete és működése által inspirált számítási modell. A neurális hálózatok egymással összekapcsolt csomópontokból vagy neuronokból állnak, amelyek együttműködve tanulnak az adatokból és előrejelzéseket készítenek. Általában a mélytanulásban és különböző mesterséges intelligencia alkalmazásokban használják őket.
  • „Needle in the haystack” teszt: Egy olyan kihívás vagy probléma, amelyben egy adott, rendkívül specifikus információt kell megtalálni egy hatalmas és összetett adathalmazban. AI modellek visszaidézéseinek pontosságát mérik hasonló tesztekkel.
  • Természetes nyelvfeldolgozás (NLP, natural language processing): A mesterséges intelligencia egyik ága, amely az emberi nyelv megértésére és generálására összpontosít, lehetővé téve az emberek és a számítógépek közötti kommunikációt.
  • Token: Az információ egysége a természetes nyelvi feldolgozásban, amely gyakran egy szót, részszót vagy karaktert jelöl. Staitsztikai alapon milyen részelemekre érdemes bontani az írásos bemenetet. A tokeneket a nyelvi modellek és más NLP-algoritmusok bemenetként használják a szöveg feldolgozásához és megértéséhez.
  • Tokenizálás: A szöveg feldarabolása kisebb egységekre, például szavakra, kifejezésekre vagy karakterekre, amit a természetes nyelvfeldolgozó rendszerek használnak az adatok előfeldolgozására.
  • Vektor adatbázis: Adatbázis-típus, amely a gépi tanulási modellek által generált beágyazásokat (embeddingeket) tárolja és kezeli, lehetővé téve gyors lekérdezéseket és az adatok hatékony használatát.

Határterületek

  • Adatbányászat (data mining): A nagy adathalmazokból mesterséges intelligencia és statisztikai módszerek segítségével hasznos minták és meglátások felfedezésének folyamata.
  • Big Data: Nagy és összetett adathalmazok, amelyeket a hagyományos adatkezelési eszközökkel nehéz feldolgozni, és amelyek gyakran mesterséges intelligenciát és fejlett elemzési technikákat igényelnek.
  • Knowledge graph (Tudásgrafikon): Adatstruktúra, amely entitásokat (például személyek, helyek, dolgok) és azok közötti kapcsolatokat reprezentál grafikon formájában, segítve az összetett összefüggések és jelentések megértését.
  • Robotizált folyamatautomatizálás (RPA, robotic process automation): AI-alapú (vagy determinisztikusan leprogramozott) szoftverrobotok használata az ismétlődő feladatok és folyamatok automatizálására, a hatékonyság növelésére és az emberi hibák csökkentésére.
  • Üzleti intelligencia (BI, business intelligence): A mesterséges intelligencia, az adatelemzés és a vizualizációs eszközök használata az üzleti adatok elemzésére és megjelenítésére, ami segíti a vállalatokat a megalapozott döntéshozatalban.