Ez a robot megtanult járni II.

Régen írtam az AI és a robotika kapcsolatáról, mely folyamatosan intenzívebbé és mélyebbé válik, sokak szerint 2024 a robotika éve lehet.

Már 2022-ben programozás helyett tanították a robotokat járni, melyről itt írtam. Néhány hónapja az NVidia számolt be arról, hogy a GPT4 (fizetős ChatGPT) által finomhangolt virtuális környezetben (párhuzamosan akár több százban) tanítottak ceruza pörgetést egy robot kéznek. Az Eureka kutatásnak ez csak minta terméke (ez már velem is megesett, hogy csak az ügynök seregem fejlesztése miatt fejlesztek :)), a cél a virtuális robot kiképzőterek fejlesztési eljárásának kialakítása. Egy olyan keretrendszeré, ahol a robotokat már megépülésük előtt, több ezer szimulált világban párhuzamosan taníthatják, például így tanul a Zürich környékén az alábbi kerekes (de talpra állni tudó, dobozokat válogató, ajtót nyitó stb.) ANYmal nevű robot is.

Advanced Skills through Multiple Adversarial Motion Priors in Reinforcement Learning

Az ezekhez hasonló keretrendszerek és a robotokat tanító mesterséges intelligencia exponenciális gyorsulása erre a területre is hatással lesz. Az AI így nem marad a bitek világába zárva, néhány éven belül kitörhet fizikai valóságunkba is.

Az idei év biztosan izgalmas lesz, mert a kutató laboratóriumok mellett egyre több cég dolgozik humanoid robotokon, az alábbi ábra alapján már 15-20 fele is jár ezek száma – fele részben Kínából.

Decemberben már megépítették az első humanoid robotok készítésére épített gyárat (ahol a gyakorlatilag a gyártósor végén kipottyant robotok rögtön fel is vehetik a munkát…). Idei évre azon bejelentéseket várom záporozni, hogy mely multicégek kezdtek áramvérű kollégákat alkalmazni (lásd pl. BMW, Amazon stb.), és az hogyan vált (vagy nem vált) be.

ChatGPT irányítja számítógépem

ChatGPT irányítja számítógépem. Nem kattintásvadászat, tényleg ezt csináltam meg! Ez az amit a Cortana alig, a jelenlegi Windows Copilot pedig már Microsoft környezetben (ahol elérhető) részben támogat. De mit tehetünk addig is?

Míg vannak módszerek, amelyek helyben (például az Open Interpreter vagy a PowerShellAI), vagy távoli homokozóban (mint pl. a ClubGPT-Sandbox)  futtatva lehetőséget biztosítanak természetes nyelvi parancsok futtatására, ez az eszköz egyedülálló megközelítést kínál a természetes nyelvű parancsvégrehajtáshoz az egyik legegyszerűbbnek tűnő felületen: a ChatGPT oldalon közvetlenül.

A GPT4 képes külső interfészeket használni szabványos protokollon keresztül, így a feladat tulajdonképpen annyi volt, hogy (megfelelő biztonsági szűrőkön keresztül) lehetővé tegyem parancsok távoli futtatását egy kis kapu nyitásával. Így most természetes nyelven megfogalmazva tudok pl.:

  • elindítani alkalmazásokat
  • lekérdezni a számítógépem beállításait, módosítani pl. az energiatakarékossági funkciókat
  • megnézni mely alkalmazások terhelik leginkább a processzort
  • megkeresni és lejátszani zenét
  • rendet rakni a mappáimban (mappákat létrehozni, fájlokat mozgatni) stb.

Főbb jellemzők

  • Az alkalmazás OpenAPI alapú interfészt biztosít parancsok végrehajtásához (PowerShell/CMD/Shell/Bash/Python stb.)
  • API kulcsot használ (akár több szinten is) a hitelesítéshez, amely lehet fix vagy minden sessionre generált, így biztosítva, hogy a gépünk ne legye hosszú távon veszélynek kitéve
  • Tartalmaz egy külön végpontot az alapvető rendszerinformációk lekérdezéséhez (/system_info).
  • Kínál egy Bridge módot a kérések továbbításához egy másik gépre – ha a gépünk hálózati szempontból nem érhető el közvetlenül a ChatGPT szerveréről.

Valami ehhez hasonló lesz az LLM OS

A ChatGPT képes a felhasználói interakciók során hibakeresésre és problémamegoldásra is. Ha hibaüzenetet kap egy parancs után, megpróbálja megoldani, újrapróbálkozik, vagy legalább javaslatokat adni a megoldásra. Ennek ellenére nem mindenható, jelenleg nem tud például csak adminisztrátorként végrehajtható parancsokat futtatni.

Tán egyelőre jobb is: mert ez csak egy demó, nem árt az óvatosság több szempontból sem. Nem csak hálózatbiztonsági szempontból kell körültekintőnek lenni, de tudatában kell lenni annak, hogy a nyelvi modell hibázhat a parancsok kiadásánál. Forráskód elérhető itt, futtatás csak saját felelősségre!

Windows Copilot

Megfelelően friss Windows 11 verzióval a Copilot is kipróbálható ingyenesen, ha futtatjuk a következő parancsot a Windows+R billentyűkombináció lenyomása után felugró kis ablakban:

„microsoft-edge://?ux=copilot&tcp=1&source=taskbar”

Mesterséges intelligencia a parancssorban (pontosabban PowerShell-ben, cross-platform)

Régi, de csak most találtam rá, ahogy rájöttem, hogy már a Microsoft Paint-ben is van AI (nyilván a Dall-E 3)… és olyan nagyszerű különösen IT-soknak, hogy megér egy bejegyzést: ChatGPT modul mely beépül a PowerShell-be. Nem csak beszélgethetsz vele, hanem képes például:

  • Több lépcsős komplex utasításokban közreműködni:
    ai "list of planets only names as json" | ai 'convert to xml' | ai 'convert to powershell'
  • Strukturált válaszokat adni:
    ai "list of planets only names as json"
  • Értelmezni a legutóbbi hibaüzenetet:
    Invoke-AIErrorHelper

… és akár egy Excel állományt is létrehoz. További videók a fenti linken:

PowerShell AI - copilot at the command line

Egy másik nagyon hasonló megoldás az OpenInterpreter. Utóbbi előnye, hogy open source nyelvi modellel, teljesen lokálisan is futtatható!

Ágensek avagy autonóm ügynökök: AutoGPT, BabyAGI és a társaik

Most kell elkezdeni kapaszkodni! A ChatGPT megtanulta, hogy a legmegfelelőbb (AI) eszközt válassza ki egy adott feladat végrehajtására.

Eljutottunk az „eszközhasználó” korszakig AI léptékben: mesterséges intelligencia, mely külső eszközöket (akár mas AI-t) használ, újakat lehet megtanítani neki.
Kíváncsi leszek a pattintott kőkorszak megfelelőjére, amikor az AI eszközt készít magának egy feladat megvalósítására – és ez a küszöbön kopogtat (lásd AutoGPT / BabyGPT alkalmazások). Ezek az autonóm MI ügynökök képesek feladatokat létrehozni maguknak, elvégezni őket, új feladatokat létrehozni és akár prioritizálni is a feladatlistájukat. Az AutoGPT és a BabyAGI jelenleg az autonóm ügynökök legjobb példái. Bár a BabyAGI használja az “AGI” kifejezést, ez egy kicsit nagyra törő cím az autonóm ügynök számára, mivel nem közelíti meg azt, amit AGI-nak nevezhetnénk.

Az újdonságokkal kiegészítettem a tudástárban a fogalomtárat és az eszköztárat is.

Mesterséges intelligenciával életre keltett mikrosütő

Ez a srác (Lucas Rizzotto) elképesztően jó és érdekes videót készített, melyben bemutatja az AI technológiák lehetőségeit és veszélyeit. Gyermekkori képzeletbeli barátja egy mikrosütő volt, melyet ezúttal valóban életre keltett (GPT3 nyelvi modellre építve). A mikrosütőt ráadásul személyiséggel is felruházta, de ez nem éppen úgy sült el, ahogyan tervezte: a konyhai eszközt bizony megviselte az a néhány év amíg nem szóltak hozzá…

I gave my microwave a soul with AI and it tried to kill me

Ez a robot megtanult járni

MIT négylábú robotja

Ezt a négylábú robotot az MIT PhD diákja nem beégetett programkódokkal tanította meg járni, hanem gyakorlás utján. A próbálkozások egy szimulációban történtek, így néhány óra leforgása alatt a robot extrém terepeken is begyakorolhatta a helyváltoztatást, hogy rájohessen annak leghatékonyabb módjára. Az eredmény? Rekord sebesség! Szinte bármilyen terepen…

MIT's Mini Cheetah robot runs faster than ever

A titok az volt, hogy hagyták, hogy a robot próbálgatás és hiba útján találja ki a futás módját, ahelyett, hogy emberi mérnökökre bízták volna a robot programozását.

Ahogy Gabriel Margolis, az MIT PhD-hallgatója és Ge Yang, az IAIFI posztdoktorandusza egy nemrégiben adott interjúban kifejtette, a robotika hagyományos paradigmája szerint az ember mondja meg a robotnak, hogy mit és hogyan tegyen. A probléma ezzel a megközelítéssel az, hogy nem skálázható, mivel rengeteg emberi munkaórára van szükség ahhoz, hogy egy robotot manuálisan beprogramozzanak, hogy sok különböző környezetben működjön.

Ezt a korlátozást a szimuláció és a mesterséges intelligencia/gépi tanulás segítségével lehet felgyorsítani.

A robot sprintelés közben elérte a 3,9 méter/másodperces, azaz nagyjából 14 km/órás csúcssebességet. Még lenyűgözőbb, ahogyan az olyan nehéz terepeken – mint a jeges vagy kavicsos talaj – viselkedik. Az ember által tervezett szoftverrel a robot nehezen halad át a kavicson, sőt, amikor a járdára próbál átmenni, még meg is botlik és elesik. A gépi tanulással

Forrás: TechSport