Reddit ha annunciato questa settimana termini aggiornati per strumenti e servizi per sviluppatori, accesso a pagamento all'API Reddit Data e altri strumenti di moderazione nativi.
Mentre il blog di Reddit ha spiegato i cambiamenti come parte della creazione di un ecosistema sano, il New York Times ha riferito che l'accesso API a pagamento impedirebbe alle grandi aziende di utilizzare i contenuti di Reddit per addestrare gratuitamente modelli di linguaggio di grandi dimensioni (LLM).
La documentazione aggiornata conferma che gli sviluppatori possono utilizzare i contenuti Reddit per la formazione LLM solo previa approvazione di Reddit e che costituisce un accesso commerciale.
Bard non può confermare se Google abbia incluso i contenuti di Reddit nei suoi dati di addestramento come parte dei set di dati pubblicamente disponibili "probabilmente utilizzati".
Screenshot da Google Bard, aprile 2023
ChatGPT non può condividere un elenco specifico di fonti, ma Reddit potrebbe essere una di queste.
Screenshot da ChatGPT, aprile 2023
Bing AI conferma che Microsoft utilizza più fonti di dati, inclusi l'indice e l'algoritmo di Bing con i modelli OpenAI GPT.
Screenshot da Bing, aprile 2023
Considerando che ChatGPT potrebbe aver utilizzato i dati di Reddit, si potrebbe presumere che anche Microsoft possa aver utilizzato, tramite la sua partnership con OpenAI.
Quanto accederà all'API dei dati di Reddit?
Secondo i termini aggiornati per gli sviluppatori, in vigore dal 19 giugno 2023, Reddit addebiterà ciò che considera l'accesso commerciale e l'uso dell'API:
- Se un'attività o un servizio monetizzato si connette all'API, viene considerato un accesso commerciale.
- Se un'azienda o un servizio genera entrate, direttamente o indirettamente, da qualsiasi dato Reddit o da dati derivati.
Di seguito sono riportati esempi specifici di servizi monetizzati dalla pagina della piattaforma per sviluppatori di Reddit:
- Servizi che generano entrate da annunci e paywall.
- Motori di ricerca che generano entrate dagli annunci.
- Servizi che addebitano agli utenti l'accesso a ricerche o dati.
- Servizi per i quali gli utenti pagano canoni di abbonamento.
- Servizi inclusi nell'upsell di un altro prodotto.
- Servizi che pubblicano contenuti Reddit su siti web e app monetizzati.
- Servizi che utilizzano i dati di Reddit per l'addestramento dei modelli.
I ricercatori che utilizzano l'API per scopi non commerciali possono continuare a farlo se accettano di non rilasciare dati sensibili di Reddit o prodotti creati utilizzando contenuti Reddit. L'accesso a grandi volumi di dati può comportare una tariffa per coprire i costi associati all'accesso in blocco all'API.
Christopher Slowe, CTO di Reddit, ha commentato una discussione subreddit di Machine Learning sulla notizia, scrivendo:
“Siamo entusiasti della ricerca LLM e ML e nel complesso molto orgogliosi del ruolo che Reddit ha svolto in quel lavoro nel corso degli anni. Quindi, mentre dobbiamo fare di più per garantire che i dati dei nostri utenti vengano condivisi in modo responsabile, non stiamo cercando di inibire la ricerca accademica o guadagnare denaro dai ricercatori".
Gli sviluppatori devono inoltre riconoscere che il contenuto dell'utente su Reddit appartiene agli utenti ed è soggetto ai diritti e alle restrizioni d'uso specificati dall'utente. L'accordo con l'utente conferma che gli utenti mantengono i diritti sui loro contenuti, ma concedono anche a Reddit una licenza royalty-free per utilizzarli.
Reddit condividerà i dettagli sui prezzi non appena saranno finalizzati.
Reddit ha assicurato ai moderatori che le modifiche all'API non influiranno sugli strumenti che aiutano a far rispettare le regole di subreddit e rimuovere i contenuti che violano le politiche di Reddit.
I moderatori sono incoraggiati a seguire il subreddit Mod News per rimanere aggiornati sugli ultimi sviluppi negli strumenti di moderazione. Secondo quanto riferito, Reddit si sforza di mantenere una moderazione della comunità più rigorosa per mantenere felici gli inserzionisti.
Reddit Data API Strumenti di gestione dei social media?
Se utilizzi uno strumento di terze parti per pubblicare su Reddit, cercare post su Reddit o creare report di analisi per il tuo account Reddit, ci sono tre modi in cui ciò potrebbe influire su di te.
- Potresti aver bisogno di un maggiore accesso alle funzionalità di Reddit tramite alcuni servizi di terze parti.
- Potrebbe essere necessario iniziare a pagare per alcuni servizi di terze parti che una volta offrivano piani tariffari gratuiti per assorbire l'aumento dei costi di accesso all'API di dati Reddit.
- Potresti dover pagare più di quello che già paghi per alcuni servizi di terze parti.
Vedremo l'impatto una volta che Reddit rilascerà i dettagli sui prezzi dell'API. Le piattaforme che si integrano con Reddit includono Zapier, HootSuite, IFTTT, Feedly, Vista Social, Tray.io e Social Rise. Queste piattaforme consentono agli utenti di ottenere preziose informazioni sull'impegno di Reddit.
Screenshot da Social Rise, aprile 2023
Per quanto riguarda il tipo di aumento che potresti aspettarti se il tuo strumento di gestione dei social media passa il costo ai suoi utenti: per i servizi di terze parti con oltre un milione di utenti, potrebbe essere solo un dollaro in più al mese per utente. Per i servizi con meno utenti, potrebbe essere molto di più.
Notizie correlate: In che modo le modifiche all'API di Twitter hanno interrotto i servizi popolari
Due settimane dopo che gli utenti hanno iniziato a far circolare immagini che implicavano prezzi aziendali per l'API di Twitter, Twitter ha ufficialmente aggiornato il suo sito Web con piani tariffari per l'accesso premium all'API di Twitter v2.
Consente agli sviluppatori di creare applicazioni che recuperano e analizzano i dati da Twitter, consentendo a questi strumenti di cercare Tweet su un argomento specifico, scoprire influencer e creare report analitici sul pubblico e sul coinvolgimento di un account Twitter.
L'API consente inoltre alle applicazioni di pubblicare aggiornamenti su Twitter, il che consente agli strumenti di gestione dei social media di pianificare e pubblicare tweet su un account.
Twitter offre tre opzioni di prezzo per l'API v2.
Screenshot da Twitter, aprile 2023
Twitter ha invitato gli utenti che necessitano di più dati a richiedere l'accesso alle API aziendali tramite un modulo Google.
Le API aziendali offrono una copertura in tempo reale dei Tweet pubblici con operatori e regole specifici, filtri di ricerca avanzati, accesso cronologico completo ai Tweet archiviati e attività dell'account da parte di determinati utenti (tweet, risposte, segui, Mi piace, blocchi, ecc.).
Twitter non elenca i prezzi per l'accesso all'API di Twitter a livello aziendale sul suo sito web. Un Tweet condiviso da Wired suggerisce una fascia di prezzo mensile da $ 42.000 a $ 210.000.
Ecco i documenti. Il "pacchetto grande" è di $ 210.000 al mese o $ 2,5 milioni all'anno (suggerimento @techmeme) https://t.co/RfGyWqpIgF pic.twitter.com/xuBiCBzoe7
— Chris Stokel-Walker ~ @stokel@infosec.exchange (@stokel) 10 marzo 2023
Secondo gli utenti delle comunità di sviluppatori Twitter private che hanno contattato la piattaforma per ulteriori informazioni, non offre alcun piano tra Basic (a $ 100 al mese) ed Enterprise.
Twitter ha anche deprezzato le versioni precedenti dell'API, inclusi i livelli di accesso API Standard (v1.1), Essential (v2), Elevated (v2) e Premium.
L'aumento dei costi e la riduzione dell'accesso hanno influito sui seguenti servizi che si basavano sull'API di Twitter.
- Gli avvisi meteorologici salvavita da diversi account del servizio meteorologico nazionale erano limitati.
- IFTTT, un servizio di automazione con 18 milioni di utenti, ha riscontrato problemi con le modifiche API apportate all'inizio di aprile.
- Feedly, un servizio di lettura di notizie che ha integrato le funzionalità AI nel 2020 per oltre 18 milioni di utenti, ha ritirato le funzionalità di Twitter e ha iniziato a esplorare le integrazioni con Mastodon.
- Flipboard, un servizio di aggregazione di notizie con 145 milioni di utenti, ha annunciato che i feed di Twitter sarebbero rimasti interrotti e che Mastodon sarebbe stato nel suo futuro.
- HootSuite, uno strumento di gestione dei social media con 18 milioni di utenti, ha smesso di offrire piani gratuiti agli utenti che gestiscono Twitter e altri profili social.
Abbiamo contattato i creatori di diversi popolari strumenti di gestione dei social media per un commento. Finora, hanno esitato a commentare mentre lavorano con Twitter su soluzioni personalizzate.
Elon Musk, CEO di Twitter (Now X Corp), ha affermato che l'accesso alle API a pagamento ridurrebbe l'abuso di bot.
Ha anche suggerito che il rifiuto di Microsoft di pagare le tariffe dell'API di Twitter potrebbe portare a una causa per presunta "sottrazione del database di Twitter" e "vendita del nostro [Twitter] dati ad altri”.
GitHub, Microsoft e OpenAI devono affrontare un'azione legale collettiva a San Francisco, in California, per presunto sfruttamento dei contenuti generati dagli utenti inviati, violando diverse linee guida sulle licenze open source. Microsoft, GitHub e OpenAI hanno chiesto di archiviare la causa.
La stessa azienda ha anche intentato un'azione legale collettiva contro Stability AI, DeviantArt e Midjourney per l'utilizzo di Stable Diffusion, accusato di utilizzare opere d'arte protette da copyright nei suoi dati di formazione.
SEJ seguirà gli sviluppi come altre società con grandi archivi di dati pubblici e conversazioni faranno in futuro in risposta alle società di intelligenza artificiale che li utilizzano per l'addestramento dei dati.
Foto di presentazione: Dennis Diatel/Shutterstock