OpenChatKit: nyílt forrású, tanítható ChatGPT alternatíva

A hét a Google AI Workspace és a Microsoft Copilot 365 bejelentésektől volt hangos – azt gondolom megalapozottan, kíváncsian várom a tesztelési lehetőséget én is! Azonban bejelentésre került egy új, már tesztelhető, viszont teljesen nyílt forráskódú, kipróbálható betanított modell is, az OpenChatKit, amely GitHub-ról is elérhető.

Az OpenChatKit egy nyílt forráskódú projekt (opesn source Apache-2.0 licenc alatt kerül kiadásra), amelyet speciális és általános célú chatbotok létrehozására terveztek különböző alkalmazásokhoz. Tulajdonképpen egy beszélgetésre hangolt nagy nyelvi modell, mely a GPT-NeoX-20B-ből került finomhangolásra 43 millió utasítással. Az OpenChatKit erősségei közé tartozik

  • az összegzés, a kontextuson belüli kérdésválaszolás,
  • az információkinyerés és
  • a szövegosztályozás.

Az alkotók szerint a következőkön szükséges még finomhangolni:

  • a tudásalapú zárt kérdésválaszolás,
  • a kódolási feladatok,
  • a kontextusváltás és
  • a kreatív írás vagy a hosszabb válaszok.

Számomra az egyik legérdekesebb momentum, hogy a projekt emellett egy bővíthető lekérdezési rendszerrel is rendelkezik (retrieval), amely lehetővé teszi, hogy a chatbot rendszeresen frissített vagy egyéni tartalmakat építsen be a válaszaiba: tehát például folyamatosan betöltse a friss információkat megadott helyről (pl. Wikipedia vagy valamilyen üzleti adatforrás) és így naprakészen tartsa tudását.

Kipróbálható a Hugging Face-en (a linket felvettem az AI Eszközök közé is). Itt találsz eszközt több LLM párhuzamos tesztelésére is!

Forrás: Together