Githubcopilot litigation
Giacomo Tesio
giacomo a tesio.it
Dom 6 Nov 2022 23:24:39 CET
Scusa, evidentemente ho dato per scontato più di quanto fosse scontato. :-)
Ad esempio avevo assunto che avessi già letto la pagina wikipedia a riguardo,
o qualcosa di equivalente.
La trovi qui: https://en.m.wikipedia.org/wiki/GitHub_Copilot
In estrema sintesi, GitHub CopyALot è un software programmato statisticamente
partendo dal software libero caricato su GitHub.
Puoi vederlo come uno zippone indicizzato del codice di partenza che puoi
interrogare attraverso un API e che effettua una ricerca nella codebase di uno
snippet equivalente ad una breve descrizione linguaggio naturale fornita dall'utente.
Il video che ho linkato mostra l'output prodotto da GitHub CopyALot.
L'utente digita il commento iniziale (fast inverse square root) e l'inizio della firma della funzione,
lasciando a CopyALot la scrittura del codice.
CopyALot copia il codice GPLv3 di Quake3 Arena e poi gli assegna una licenza permissiva
simil MIT attribuendolo ad uno sconosciuto invece che alla id Software.
Se si fosse trattato di un codice meno famoso, la violazione del copyright sarebbe
passata inosservata.
Spero che ora il problema sia più chiaro.
A presto!
Giacomo
On November 6, 2022 2:52:26 PM UTC, "Francesco Potortì" <pot a potorti.it> wrote:
> Ciao Giacomo, grazie del tentativo di rispondermi :)
>
> >On Sun, 06 Nov 2022 11:51:54 +0100 Francesco Potortì wrote:
> >> Se ho indovinato giusto, spero che Githubcopilot ne esca vittoriosa e
> >> che a loro sia dato torto, il contrario sarebbe molto grave. Oppure
> >> non ho indovinato giusto e si parla d'altro, qualcuno lo sa?
> >
> >Non so esattamente cosa tu abbia capito.
>
> Ho cercato di spiegarlo nel pezzo che hai tagliato, e che diceva questo:
>
> Se devo tirare a indovinare, Githubcopilot è una IA che si allena sul codice che trova su github (per produrre nuovo codice, forse?) e loro ritengono che (il codice prodotto da Githubcopilot, forse?) debba riportare i nomi degli autori dei programmi che ha letto su Github.
>
> Ma in effetti, come dicevo, non so cosa fa Githubcopilot e per questo ho scritto chiedendo.
>
> >https://peertube.opencloud.lu/w/eW497u3UYXmQwcQu9LYEDR
>
> >In questo breve filmato puoi vedere GitHub CopyALot distribuire codice
> >sotto GPLv3 [0] con una attribuzione sbagliata e una licenza permissiva
> >affinché sia incluso all'interno di un software potenzialmente
> >proprietario.
>
> Grazie, ma non capisco cosa dice (a parte la storpiatura del nome, dal che si deduce che che Githubcopilot sta antipatico all'autore della pagina). È un video dove qualcuno/qualcosa scrive del codice, non si capisce chi lo scrive e come. E non si capisce cosa non va bene, secondo l'autore della pagina. Cercavo una spiegazione da qualcuno che lo sa...
>
> >In altri termini, se a te sta bene che il diritto d'autore degli
> >sviluppatori di software libero venga sistematicamente ignorato [...]
>
> Mi sembra un cattivo inizio per intraprendere una discussione, specialmente con qualcuno come me che sta chiedendo informazioni...
>
> >In pratica GitHub CopyALot serve per riservare il diritto d'autore alle
> >imprese di software proprietario e scardinare i meccanismi di
> >funzionamento dei copyleft tradizionali (dalla GPL alla CAL)
> >sfruttando il loop-hole del "fair use" nel "training" delle "AI".
>
> Sì, ma questa è un giudizio basato su un'interpretazione di fatti che sono avvenuti. Qualcuno sa quali sono i fatti? E no, quel video non mostra fatti, o perlomeno manca il contesto. Se qualcuno conosce gli uni e l'altro sono interessato.
>
> >Se sai un minimo di programmazione statistica (impropriamente narrata
> >come "AI" [1]) sarai d'accordo con me che i "modelli" estratti da un
> >dataset sono opere derivate da quel dataset.
>
> Non so cos'è la "programmazione statistica", e non sono riuscito a trovarne una definizione. Se hai un riferimento lo leggo molto volentieri.
>
> So cos'è la "AI", sia storicamente che nella sua accezione attuale, ho un'idea abbastanza buona delle sue capacità e dei (nuovi) problemi di vario tipo che ne possono derivare.
>
> Cosa intendi per "modelli"? Forse i pesi di apprendimento di una rete neurale, o più in generale i parametri calcolati da un sistema ad apprendimento automatico? Se è così, non non credo di essere d'accordo con te in generale, ma magari lo posso essere in un caso specifico, o una classe di casi. Prima di discutere di conclusioni (cioè se sono d'accordo su qualcosa), sarei interessato a capire cosa esattamente fa Githubcopilot, e non lo so.
>
> >Dunque il modello di CopyALot dovrebbe come minimo essere distribuito
> >sotto AGPLv3 essendo opera derivata anche da codice AGPLv3.
> >Che poi distribuisca parte del codice che lo costituisce, significa
> >semplicemente che anche tutto il software sviluppato includendo parti
> >da esso "suggerite" va licenziato con tale licenza.
>
> Ok, dalle conclusioni che trai sembra che tu conosca la risposta alle mie domande. Mi sapresti raccontare cosa fa Githubcopilot?
Maggiori informazioni sulla lista
discussioni