Uusi OpenAI-työkalu ’CriticGPT’ auttaa löytämään virheitä tekoälyn luomassa koodissa

OpenAI näyttää ottaneen käyttöön CriticGPT:n, uuden GPT-4:ään perustuvan tekoälymallin. Kerrotaan, että ChatGPT:n valmistaja OpenAI on suunnitellut uuden tekoälymallin, joka auttaa tunnistamaan käyttäjien virheet ChatGPT:n tuottamassa koodissa.
Raporttien mukaan uusi tekoälymalli CriticGPT, joka on kokeilussa, paransi koodin tarkistustuloksia 60 prosenttia käytettynä verrattuna niihin, jotka eivät sitä tehneet.
Dekoodaus CriticGPT
Lähteiden mukaan OpenAI aikoo sisällyttää CriticGPT:n OpenAI:n RLHF (Reforcement Learning from Human Feedback) -merkintäputkeen. Näyttää siltä, että OpenAI pyrkii tarjoamaan tekoälykouluttajille parempia työkaluja monimutkaisten tekoälytulosten arvioimiseen.
ChatGPT:tä käyttävien GPT-4-mallien odotetaan olevan hyödyllisiä ja vuorovaikutteisia RLHF:n kautta. Tässä prosessissa tekoälykouluttajat vertailevat erilaisia vastauksia ja arvioivat niiden laatua. Uskotaan, että kun ChatGPT:n perustelut paranevat, sen virheet muuttuvat hienovaraisemmiksi, mikä vaikeuttaa kouluttajien tunnistaa epätarkkuuksia.
Tutkimuspaperin ”LLM Critics Help Catch LLM Bugs” mukaan CriticGPT osoitti kunnollista pätevyyttä analysoidessaan koodia ja tunnistaessaan virheitä, jotka auttavat ihmisiä havaitsemaan hallusinaatioita, joita he eivät välttämättä huomaa itse. Paperi korosti myös, että tutkijat kouluttivat CriticGPT:tä tietojoukosta, joka sisältää virheitä sisältäviä koodinäytteitä. Virheiden odotetaan olevan lisätty tarkoituksella, jotta se voisi tunnistaa ja ilmoittaa koodausvirheet.
Mitä seuraavaksi
Raporttien mukaan CriticGPT:tä testaavien kokeiden aikana CriticGPT:tä käyttävät tiimit tuottivat kattavampia arvosteluja ja tunnistivat vähemmän vääriä positiivisia tuloksia verrattuna yksin työskenteleviin. ”Toinen kouluttaja piti Human+CriticGPT-tiimin kritiikkiä parempana kuin avustamattoman arvioijan kritiikkiä yli 60 prosenttia ajasta, kuten ”LLM Critics Help Catch LLM Bugs” raportoi.
Kriitikot kuitenkin väittivät, että CriticGPT:llä on rajoituksia. Näyttää siltä, että CriticGPT on koulutettu lyhyisiin ChatGPT-vastauksiin. Joten se tarvitsee edelleen kehittämistä pidempien ja monimutkaisempien tehtävien hoitamiseksi. Myös ”ChatGPT-halusinaatio”, jolloin tekoälymalli tuottaa virheellistä tietoa, mutta esittää sen ikään kuin se olisi tosiasia, on edelleen porsaanreikä CriticGPT:ssä.
Lisäksi kouluttajat tekevät toisinaan merkintävirheitä, ja tässä tapauksessa yhden pisteen virheiden keskittymistä on laajennettava käsittelemään virheitä, jotka jakautuvat vastauksen useisiin osiin. Tämä avainrajoitus voidaan yhdistää RLHF:ään. Uskotaan, että näistä kehittyneistä malleista voi tulla niin tietoisia, että ihmiskouluttajilla saattaa olla vaikeuksia lisätä merkityksellistä palautetta CriticGPT:hen.