Actualitat

Parlem dels models de llenguatge i la seva capacitat de raonament a L’Altra Ràdio

Parlem dels models de llenguatge i la seva capacitat de raonament a L’Altra Ràdio

El 12 de setembre, a la nostra secció del programa L’Altra Ràdio (Ràdio 4, RNE), Javier Otero i Marcos Montero, responsables de Màrqueting i Transformació Digital d’IThinkUPC, van parlar sobre els models de llenguatge (LLM) que hi ha darrere de sistemes com ChatGPT o Gemini i van explicar les diferències entre els models clàssics i els nous models de raonament.

Durant la conversa, van destacar que els primers models de llenguatge, com GPT, es basen en predir la paraula següent per construir frases coherents, però no raonen. En canvi, els nous models de raonament, entrenats amb milions de cadenes de raonament, són capaços de resoldre problemes complexos de manera molt més eficaç, encara que necessiten més temps per respondre, ja que “pensen” abans de donar la resposta.

També van explicar que podem classificar aquests models segons si són oberts (open source) o tancats. Els tancats, com ChatGPT, ofereixen rapidesa i eficiència però sense transparència sobre el seu funcionament intern. Els oberts, com Llama de Meta o Aina del Barcelona Supercomputing Center, permeten més adaptació i transparència, aspectes crucials per a investigadors i organitzacions que volen controlar els biaixos de les dades d’entrenament.

Si vols aprofundir en com funcionen aquests models i les diferències entre ells, et convidem a escoltar el pòdcast del programa L’Altra Ràdio (minut 6:33).

Comparteix a les xarxes:

Actualitat i referències de la línia

Menú

Cercador