Gli esperti del Digital marketing

Potenzia il tuo business online con Monkey Digital SEO: sfrutta al massimo il potenziale del marketing strategico digitale.

Una nuova ondata di sforzi di etichettatura dei contenuti dell’intelligenza artificiale

Kevin Indig's Growth Memo for SEJ

Il nuovo petrolio non sono dati o attenzione. Sono parole. L’elemento di differenziazione per costruire modelli di intelligenza artificiale di prossima generazione è l’accesso ai contenuti quando si normalizza la potenza di calcolo, lo stoccaggio e l’energia.

Ma il web sta già diventando troppo piccolo per saziare la fame di nuovi modelli.

Alcuni dirigenti e ricercatori affermano che la necessità del settore di dati testuali di alta qualità potrebbe superare l’offerta entro due anni, rallentando potenzialmente lo sviluppo dell’intelligenza artificiale.

Anche la messa a punto non sembra funzionare così bene come la semplice costruzione di modelli più potenti. Un case study di ricerca Microsoft mostra che i suggerimenti efficaci possono superare del 27% le prestazioni di un modello ottimizzato.

Ci chiedevamo se il futuro sarà fatto di tanti piccoli modelli perfezionati o di pochi grandi modelli onnicomprensivi. Sembra essere quest'ultimo.

Non esiste una strategia AI senza una strategia sui dati.

Affamati di contenuti di alta qualità per sviluppare la prossima generazione di modelli linguistici di grandi dimensioni (LLM), gli sviluppatori di modelli iniziano a pagare per contenuti naturali e rilanciano i loro sforzi per etichettare i dati sintetici.

Per i creatori di contenuti di qualsiasi tipo, questo nuovo flusso di denaro potrebbe aprire la strada a un nuovo modello di monetizzazione dei contenuti che incentiva la qualità e rende il web migliore.

Credito immagine: Lyna ™

Migliora le tue abilità con gli approfondimenti settimanali degli esperti di Growth Memo. Iscriviti gratuitamente!

KYC: AI

Se i contenuti sono il nuovo petrolio, i social network sono piattaforme petrolifere. Google ha investito 60 milioni di dollari all'anno nell'utilizzo dei contenuti Reddit per addestrare i suoi modelli e far emergere le risposte Reddit in cima alla ricerca. Penny, secondo me.

Il CEO di YouTube, Neal Mohan, ha recentemente inviato un chiaro messaggio a OpenAI e ad altri sviluppatori di modelli secondo cui la formazione su YouTube è vietata, in quanto difende le enormi riserve petrolifere dell'azienda.

Il New York Times, che attualmente sta conducendo una causa contro OpenAI, ha pubblicato un articolo in cui afferma che OpenAI ha sviluppato Whisper per addestrare modelli sulle trascrizioni di YouTube e Google utilizza i contenuti di tutte le sue piattaforme, come le recensioni di Google Docs e Maps, per addestrare la sua intelligenza artificiale. Modelli.

I fornitori di dati di intelligenza artificiale generativa come Appen o Scale AI stanno reclutando scrittori (umani) per creare contenuti per la formazione del modello LLM.

Non commettere errori, gli scrittori non si arricchiscono scrivendo per l'intelligenza artificiale.

Per un importo compreso tra $ 25 e $ 50 l'ora, gli scrittori svolgono attività come classificare le risposte dell'intelligenza artificiale, scrivere racconti e verificare i fatti.

I candidati devono avere un dottorato di ricerca. o master o attualmente frequentano l'università. I fornitori di dati sono chiaramente alla ricerca di esperti e di “buoni” scrittori. Ma i primi segnali sono promettenti: scrivere per l’intelligenza artificiale potrebbe essere monetizzabile.

Credito immagine: Kevin Indig Credito immagine: Kevin Indig

Gli sviluppatori di modelli cercano buoni contenuti in ogni angolo del web e alcuni sono felici di venderli.

Piattaforme di contenuti come Photobucket vendono foto per cinque centesimi a un dollaro al pezzo. I video di breve durata possono costare dai 2 ai 4 dollari; i film più lunghi costano dai 100 ai 300 dollari l'ora di riprese.

Con miliardi di foto, l'azienda ha trovato il petrolio nel suo cortile. Quale CEO può resistere a una simile tentazione, soprattutto perché la monetizzazione dei contenuti sta diventando sempre più difficile?

Dai contenuti gratuiti:

Gli editori vengono schiacciati da più parti:

  • Pochi sono preparati alla morte dei cookie di terze parti.
  • I social network inviano meno traffico (Meta) o peggiorano in termini di qualità (X).
  • La maggior parte dei giovani riceve notizie da TikTok.
  • La SGE si profila all'orizzonte.

Ironicamente, etichettare meglio i contenuti AI potrebbe aiutare lo sviluppo del LLM perché è più facile separare i contenuti naturali da quelli sintetici.

In questo senso, è nell'interesse degli sviluppatori LLM etichettare i contenuti AI in modo da poterli escludere dalla formazione o utilizzarli nel modo giusto.

Etichettatura

L’esplorazione delle parole per addestrare gli LLM è solo un aspetto dello sviluppo di modelli di intelligenza artificiale di nuova generazione. L'altro è l'etichettatura. Gli sviluppatori di modelli hanno bisogno di un’etichettatura per evitare il collasso del modello, e la società ne ha bisogno come scudo contro le notizie false.

Un nuovo movimento di etichettatura AI è in aumento nonostante OpenAI abbia abbandonato la filigrana a causa della bassa precisione (26%). Invece di etichettare i contenuti stessi, il che sembra inutile, le grandi tecnologie (Google, YouTube, Meta e TikTok) spingono gli utenti a etichettare i contenuti dell’intelligenza artificiale con un approccio carota/bastone.

Google utilizza un approccio su due fronti per combattere lo spam basato sull’intelligenza artificiale nella ricerca: mostrando in primo piano forum come Reddit, dove i contenuti sono molto probabilmente creati da esseri umani, e sanzioni.

Da AIfficiency:

Google sta facendo emergere più contenuti dai forum nelle SERP per controbilanciare i contenuti dell'intelligenza artificiale. La verifica è la filigrana AI definitiva. Anche se Reddit non può impedire agli esseri umani di utilizzare l'intelligenza artificiale per creare post o commenti, le possibilità sono inferiori a causa di due cose che la ricerca di Google non ha: moderazione e karma.

Sì, i Content Goblin hanno già preso di mira Reddit, ma la maggior parte dei 73 milioni di utenti attivi ogni giorno fornisce risposte utili.1 I moderatori dei contenuti puniscono lo spam con ban o addirittura espulsioni. Ma il più potente motore di qualità su Reddit è Karma, "il punteggio di reputazione di un utente che riflette i suoi contributi alla comunità". Attraverso semplici voti positivi o negativi, gli utenti possono acquisire autorità e affidabilità, due ingredienti integrali nei sistemi di qualità di Google.

Google ha recentemente chiarito che si aspetta che i commercianti non rimuovano i metadati AI dalle immagini utilizzando il protocollo dei metadati IPTC.

Quando un'immagine ha un tag come compositeSynthetic, Google potrebbe etichettarla come "generata dall'intelligenza artificiale" ovunque, non solo negli acquisti. La punizione per la rimozione dei metadati AI non è chiara, ma la immagino come una penalità di collegamento.

IPTC è lo stesso formato utilizzato da Meta per Instagram, Facebook e WhatsApp. Entrambe le società forniscono metatag IPTC a qualsiasi contenuto proveniente dai propri LLM. Più i produttori di strumenti di intelligenza artificiale seguono le stesse linee guida per contrassegnare e taggare i contenuti dell’intelligenza artificiale, più affidabili saranno i sistemi di rilevamento.

Quando creiamo immagini fotorealistiche utilizzando la nostra funzionalità Meta AI, facciamo diverse cose per assicurarci che le persone sappiano che è coinvolta l'intelligenza artificiale, incluso l'inserimento di marcatori visibili sulle immagini e filigrane invisibili e metadati incorporati nei file di immagine. L'utilizzo sia della filigrana invisibile che dei metadati in questo modo migliora sia la robustezza di questi marcatori invisibili sia aiuta altre piattaforme a identificarli.

Gli svantaggi dei contenuti AI sono piccoli quando il contenuto sembra AI. Ma quando i contenuti dell’intelligenza artificiale sembrano reali, abbiamo bisogno di etichette.

Mentre gli inserzionisti cercano di allontanarsi dall'aspetto dell'intelligenza artificiale, le piattaforme di contenuti lo preferiscono perché è facile da riconoscere.

Per gli artisti commerciali e gli inserzionisti, l’intelligenza artificiale generativa ha il potere di accelerare enormemente il processo creativo e fornire annunci personalizzati ai clienti su larga scala: una sorta di Santo Graal nel mondo del marketing. Ma c'è un problema: molti modelli di intelligenza artificiale delle immagini generano caratteristiche di morbidezza da cartone animato, difetti rivelatori o entrambi.

I consumatori si stanno già rivoltando contro “l’aspetto dell’intelligenza artificiale”, al punto che uno spot inquietante e cinematografico del Super Bowl per l’organizzazione benefica cristiana He Gets Us è stato accusato di essere nato dall’intelligenza artificiale, anche se un fotografo ha creato le sue immagini.

YouTube ha iniziato ad applicare nuove linee guida per i creatori di video che affermano che i contenuti AI dall'aspetto realistico devono essere etichettati.

Le sfide poste dall’intelligenza artificiale generativa sono state un’area di interesse costante per YouTube, ma sappiamo che l’intelligenza artificiale introduce nuovi rischi che i malintenzionati potrebbero tentare di sfruttare durante le elezioni. L'intelligenza artificiale può essere utilizzata per generare contenuti che potrebbero fuorviare gli spettatori, in particolare se non sono consapevoli che il video è stato alterato o è stato creato sinteticamente. Per rispondere meglio a questo problema e informare gli spettatori quando il contenuto che stanno guardando è alterato o sintetico, inizieremo a introdurre i seguenti aggiornamenti:

  • Informativa sul creatore: I creatori saranno tenuti a rivelare quando hanno creato contenuti alterati o sintetici realistici, incluso l'utilizzo di strumenti di intelligenza artificiale. Ciò includerà i contenuti elettorali.
  • Etichettatura: Etichettaremo i contenuti elettorali realistici, alterati o sintetici che non violano le nostre norme, per indicare chiaramente agli spettatori che alcuni contenuti sono stati alterati o sintetici. Per le elezioni, questa etichetta verrà visualizzata sia nel video player che nella descrizione del video e verrà visualizzata indipendentemente dall'autore, dai punti di vista politici o dalla lingua.

La più grande paura imminente è rappresentata dai contenuti falsi dell’intelligenza artificiale che potrebbero influenzare le elezioni presidenziali americane del 2024.

Nessuna piattaforma vuole essere il Facebook del 2016, che ha subito un danno reputazionale duraturo che ha influito sul prezzo delle sue azioni.

Gli attori statali cinesi e russi hanno già sperimentato notizie false sull’intelligenza artificiale e hanno cercato di intromettersi con i taiwanesi e con le prossime elezioni americane.

Ora che OpenAI è vicino al rilascio di Sora, che crea video iperrealistici da prompt, non è un salto lontano immaginare come i video AI possano causare problemi senza un'etichettatura rigorosa. La situazione è difficile da tenere sotto controllo. Google Libri presenta già libri scritti chiaramente con o da ChatGPT.

Credito immagine: Kevin Indig

Porta via

Le etichette, siano esse mentali o visive, influenzano le nostre decisioni. Annotano il mondo per noi e hanno il potere di creare o distruggere la fiducia. Come l’euristica delle categorie nello shopping, le etichette semplificano il nostro processo decisionale e il filtraggio delle informazioni.

Da Messy Middle:

Infine, l’idea dell’euristica delle categorie, i numeri su cui i clienti si concentrano per semplificare il processo decisionale, come i megapixel per le fotocamere, offre un percorso per specificare l’ottimizzazione del comportamento degli utenti. Un negozio di e-commerce che vende fotocamere, ad esempio, dovrebbe ottimizzare le proprie schede prodotto per dare visivamente la priorità all'euristica delle categorie. Certo, devi prima acquisire una comprensione delle euristiche nelle tue categorie e potrebbero variare in base al prodotto che vendi. Immagino che sia quello che serve per avere successo nella SEO al giorno d'oggi.

Presto le etichette ci diranno se il contenuto è scritto dall’intelligenza artificiale o meno. In un sondaggio pubblico condotto su 23.000 intervistati, Meta ha scoperto che l’82% delle persone desidera etichette sui contenuti AI. Resta da vedere se gli standard comuni e le sanzioni funzioneranno, ma l’urgenza è presente.

C’è anche un’opportunità qui: le etichette potrebbero puntare i riflettori sugli scrittori umani e rendere i loro contenuti più preziosi, a seconda di quanto diventi buono il contenuto dell’intelligenza artificiale.

Inoltre, scrivere per l’intelligenza artificiale potrebbe essere un altro modo per monetizzare i contenuti. Sebbene le tariffe orarie attuali non arricchiscano nessuno, la formazione dei modelli aggiunge nuovo valore ai contenuti. Le piattaforme di contenuti potrebbero trovare nuovi flussi di entrate.

I contenuti web sono diventati estremamente commercializzati, ma le licenze sull’intelligenza artificiale potrebbero incentivare gli scrittori a creare nuovamente buoni contenuti e a slegarsi dagli introiti pubblicitari o di affiliazione.

A volte, il contrasto rende visibile il valore. Forse, dopo tutto, l’intelligenza artificiale può rendere il web migliore.

Per le aziende di intelligenza artificiale che divorano dati, Internet è troppo piccola

Il potere della sollecitazione

All'interno della corsa sotterranea di Big Tech per acquistare dati di addestramento sull'intelligenza artificiale

OpenAI rinuncia allo strumento di rilevamento del testo generato dall'intelligenza artificiale

Metadati foto IPTC

Etichettatura di immagini generate dall'intelligenza artificiale su Facebook, Instagram e discussioni

Come l'industria pubblicitaria sta facendo sì che le immagini dell'IA sembrino meno simili all'intelligenza artificiale

Come aiutiamo i creatori a divulgare contenuti alterati o sintetici

Affrontare la disinformazione elettorale generata dall’intelligenza artificiale

La Cina prende di mira gli elettori statunitensi e Taiwan con la disinformazione basata sull’intelligenza artificiale

Google Libri indicizza la spazzatura generata dall'intelligenza artificiale

Il nostro approccio all'etichettatura dei contenuti generati dall'intelligenza artificiale e dei media manipolati

Immagine in primo piano: Paulo Bobita/Search Engine Journal

Le Critiche Crescenti Contro Google
Scoprire lo Sviluppo Web: La Programmazione come Arte
Scopri i Top Podcast SEO del 2024 e Mantieniti Aggiornato
Il ruolo delle finestre di dialogo nella progettazione di un'interfaccia utente web
Guida all'Integrazione di ChatGPT sul Tuo Sito Web
Utilizzo efficace di ChatGPT per la ricerca di parole chiave
Automatizzare le Campagne PPC con l'Intelligenza Artificiale Generativa
Aggiungere Coinvolgimento al tuo Sito con uno Sfondo Video CSS
Importanza delle Pagine di Destinazione per la Generazione di Lead e Incremento delle Vendite
Link Building

Link Building come parte della tua strategia di marketing può portare a risultati rivoluzionari. Seowebsite è specializzato nel Link Building e aiuta gli imprenditori a realizzare un forte profilo di link che contribuisce alla crescita online. Possiamo supportarvi anche in questo?