L’estrazione di testo e dati (text and data mining) è una tecnica automatizzata che processa, tramite specifici software, dati digitali. Un dato o un complesso di dati raccolti in una banca dati (input) è processato e trasformato in un formato comprensibile al software. Il dato è poi ulteriormente analizzato e/o ricombinato secondo un algoritmo che fornisce un risultato (output). Tale tecnica è sfruttata dagli strumenti di c.d. intelligenza artificiale generativa i quali sono addestrati mediante algoritmi di apprendimento automatico che analizzano grandi quantità di dati e imparano ad utilizzarli per generare nuovi contenuti, anche simili ai contenuti preesistenti usati come input di partenza.
In linea di principio, è controverso se e a quali condizioni il suddetto sfruttamento degli input, ovvero l’estrazione e utilizzo di testo e dati da un’opera protetta, possa integrare una violazione delle norme sul diritto d’autore.
Chi sostiene debba sempre prevalere il diritto di libera espressione aderisce alla tesi per cui il diritto esclusivo di riproduzione, proprio dell’autore, non è intaccato dal processo di estrazione, in ragione del fatto che tale diritto di riproduzione riservato all’autore riguarda l’opera nella sua funzione comunicativa e non si estende ai singoli dati di cui l’opera si compone.
Il nostro legislatore europeo mostra tuttavia un approccio più articolato.
Le eccezioni di text and data mining poste dagli articoli 3 e 4 della Direttiva Copyright 2019/790/UE partono infatti dal presupposto che il processo di elaborazione dei dati possa condurre ad una violazione del diritto d’autore in assenza di autorizzazione da parte dell’autore dell’opera da cui i dati sono estratti (la necessità tecnica di copiare il dato e conservarlo comporta, ad esempio, una riproduzione dell’opera, prerogativa questa riservata al suo autore).
Così anche il legislatore italiano, in attuazione della citata Direttiva Copyright, introduce agli artt. 70-ter e 70-quater Legge sul Diritto d’Autore 633/1941 (di seguito anche “LDA”) due apposite eccezioni al diritto d’autore volte a consentire, entro certi limiti, le attività di estrazione di testo e di dati da opere protette dal diritto d’autore.
L’articolo 70-ter LDA prevede un’eccezione per l’estrazione di testo e di dati effettuata per scopi di ricerca scientifica a beneficio esclusivo di determinati destinatari, quali primariamente organismi di ricerca scientifica e istituti di tutela del patrimonio culturale, che abbiano legalmente accesso alle opere/dati.
L’articolo 70-quater LDA, invece, introduce una eccezione per ogni forma di estrazione di testo e di dati da opere o da altri materiali contenuti in reti o in banche dati cui si ha legittimamente accesso, effettuata da soggetti che operano per finalità anche diverse dalla ricerca scientifica o dalla preservazione del patrimonio culturale. In questo caso, tuttavia, l’estrazione di testo e di dati è consentita solo quando l’utilizzo delle opere e degli altri materiali non è stato espressamente riservato dai titolari del diritto d’autore.
Le suddette eccezioni sono inoltre sempre soggette al c.d. “three-step-test”, originariamente sancito dall’articolo 9 della Convenzione di Berna, secondo cui tutte le riproduzioni di opere protette esentate in virtù di eccezioni al diritto d’autore previste dalla legge, per poter essere applicabili, non devono confliggere con il normale sfruttamento economico dell’opera, né pregiudicare ingiustificatamente i legittimi interessi dell’autore.
In conclusione, guardando le eccezioni di text and data mining dal punto di vista del titolare di diritti su opere protette (ad esempio, banche dati), si può notare come la normativa lasci uno spazio di intervento al titolare per escludere o limitare l’estrazione di dati dalle proprie opere, ove l’estrazione avvenga per finalità prettamente commerciali, o comunque per attività di ricerca svolte da soggetti esercenti attività primariamente commerciale. E’ opportuno tuttavia che il titolare dei diritti adotti misure appropriate, anche di tipo contrattuale, per riservare espressamente i propri diritti d’autore sulle opere rese accessibili.
#dati #diritto d’autore #intelligenza artificiale