Gli esperti del Digital marketing

Potenzia il tuo business online con Monkey Digital SEO: sfrutta al massimo il potenziale del marketing strategico digitale.

Come utilizzare Fogli Google per il Web Scraping con l’intelligenza artificiale

Come utilizzare Fogli Google per il Web Scraping con l'intelligenza artificiale

L'estrazione di dati dalle pagine Web è un compito relativamente avanzato che, fino a poco tempo fa, richiedeva un certo grado di competenza tecnica. L'idea di immergersi nel codice o negli script per l'estrazione dei dati sembrava travolgente per molti, me compreso.

Lo scraping dei dati può alimentare molte attività SEO, come il controllo, l’analisi della concorrenza e l’esame della struttura del sito Web e dei dati.

I fogli Google offrono soluzioni semplici per aiutarti.

Una di queste soluzioni è la funzione IMPORTXML che consente agli utenti di recuperare i dati delle pagine Web utilizzando solo pochi parametri. Rende l'estrazione dei dati accessibile a un pubblico più ampio, soprattutto a coloro che non erano esperti nei linguaggi di programmazione.

Sebbene questa funzione sia impressionante, la vera svolta è arrivata con l’adozione e l’integrazione dell’intelligenza artificiale generativa nel mix.

In questa guida ti mostreremo come utilizzare Fogli Google e l'intelligenza artificiale, in particolare ChatGPT, per il web scraping senza bisogno di competenze di codifica avanzate.

Gli strumenti: intelligenza artificiale e chatbot

Ora abbiamo tutti familiarità con AI, ChatGPT e chatbot simili.

In effetti, molti di noi utilizzano soluzioni come ChatGPT per scrivere il proprio codice, script e programmi senza o con conoscenze di programmazione molto limitate.

È semplice come fornire istruzioni dettagliate sotto forma di suggerimenti e collaborare con il chatbot per creare strumenti che solo fino a poco tempo fa credevamo fossero molto al di sopra delle nostre capacità.

Ma, cosa ancora più importante, si tratta di strumenti che stanno cambiando profondamente il modo in cui affrontiamo il nostro lavoro quotidiano.

Ad esempio, se chiediamo a ChatGPT la seguente domanda: "Che cos'è la funzione IMPORTXML e come posso utilizzarla in Fogli Google per recuperare il titolo di una pagina Web HTML?" Fornisci il codice necessario per farlo in Fogli Google", la risposta è estremamente precisa. In pochi secondi abbiamo la nostra formula pronta per l'uso in Fogli Google.

Ma ad essere onesti, si trattava di un compito basilare e semplice che avremmo potuto completare facilmente senza ChatGPT.

L'obiettivo

Quindi, come funziona se vogliamo estrarre dati un po' meno standard rispetto al titolo o alla descrizione di una pagina?

Ad esempio, come funziona se vogliamo estrarre i seguenti dati dalla prima pagina PPC del Search Engine Journal?

Elenca tutti gli articoli in primo piano, i loro autori, gli URL dei collegamenti e la descrizione dell'articolo per le colonne elencate su https://www.searchenginejournal.com/category/paid-media/pay-per-click/.

Possiamo farlo direttamente con ChatGPT?

In esecuzione con ChatGPT

Durante la creazione dei prompt, sono stati necessari alcuni tentativi per fornire istruzioni sufficientemente dettagliate da consentire al chatbot di comprendere appieno l'obiettivo dell'attività e restituire buoni risultati.

In molti casi, sembrava che l’intelligenza artificiale fosse sotto pressione per fornire risultati rapidi nonostante la loro accuratezza.

Ma lasciami spiegare.

Il compito era analizzare la pagina ed elencare tutti gli articoli in primo piano, i loro autori, gli URL dei collegamenti e la descrizione di ciascuno dei 30 articoli elencati nella pagina. Quindi compila i dati in una tabella e infine esportali in un file CSV.

Semplice vero?

Inizialmente, ChatGPT restituiva solo un campione di sette articoli e solo i relativi titoli e URL; dopo una richiesta rielaborata, è riuscito a elencare ed esportare tutti i 30 articoli e i relativi collegamenti.

Ora, è stato bello. Quindi, per completare l'attività, dovevamo solo aggiungere gli autori e le descrizioni degli articoli.

Ma è qui che il bot si è imbattuto e non è stato in grado di fornire una descrizione accurata di ciascun articolo nonostante avessimo fornito esempi dell'elemento della pagina che doveva trovare e copiare.

ChatGPT continuava a ignorare le istruzioni e a fornire ripetutamente le proprie descrizioni degli articoli.

ChatGPT ha fallito anche quando abbiamo provato con un approccio diverso e abbiamo scaricato e caricato una copia della pagina HTML.

Screenshot da ChatGPT, febbraio 2024

Questa volta è stato in grado di fornire dati accurati per sette articoli, ma non è riuscito ad andare oltre. Il problema riportava:

“…la struttura e il contenuto della pagina presentano sfide significative per l’estrazione completa dei dati in un’unica sessione.

La pagina è piuttosto estesa e complessa e non è possibile estrarre tutti i 30 articoli nell'attuale formato di interazione."

Screenshot da ChatGPT, febbraio 2024

ChatGPT + Fogli Google

Quindi, torniamo a IMPORTXML e Fogli Google.

Questa volta, far sì che ChatGPT fornisse le formule per ciascun campo è stato un gioco da ragazzi.

Screenshot da ChatGPT, febbraio 2024

Ecco alcune delle formule, suggerite dal chatbot, che puoi facilmente provare a estrarre in Fogli Google:

Titolo

=IMPORTXML("https://www.searchenginejournal.com/category/paid-media/pay-per-click/", "//*[@id='archives-wrapper']/articolo/div/div[2]/h2/a")

Nome dell'autore

=IMPORTXML("https://www.searchenginejournal.com/category/paid-media/pay-per-click/", "//*[@id='archives-wrapper']/articolo/div/div[2]/P[1]/UN")

Collegamento all'URL

=IMPORTXML("https://www.searchenginejournal.com/category/paid-media/pay-per-click/", "//*[@id='archives-wrapper']/articolo/div/div[2]/h2/a/@href")

Descrizione

=IMPORTXML("https://www.searchenginejournal.com/category/paid-media/pay-per-click/", "//*[@id='archives-wrapper']/articolo/div/div[2]/P[2]")

In pochissimo tempo siamo stati in grado di estrarre i dati nel foglio di calcolo.

Screenshot da Fogli Google, febbraio 2024

Inoltre, utilizzando formule nidificate create semplicemente, possiamo estrarre rapidamente i dati da più pagine contemporaneamente.

Nell'esempio seguente, ho potuto estrarre gli stessi dati relativi a ciascun articolo (titolo, autore, collegamento URL e descrizione) per le prime 10 pagine della sezione PPC.

Il risultato è un totale di 300 articoli raschiati in meno di un minuto!

Screenshot da Fogli Google, febbraio 2024

Confrontando i due

Quindi, come si confrontano ChatGPT e ChatGPT + Fogli Google IMPORTXML?

Nella mia esperienza, non sono riuscito a trovare un modo semplice e veloce per utilizzare ChatGPT per raccogliere i dati che stavo cercando: attenzione, ciò non significa che ciò non sia possibile e potrebbero esserci diversi modi per farlo, ma Non ne ho trovato nessuno.

Ciò che ha funzionato per me è stata una combinazione di diversi strumenti e questo mi è servito molto bene per lo scopo previsto.

ChatGPT è stato estremamente utile per scrivere le formule IMPORTXML che dovevo utilizzare in Fogli Google e quelle formule hanno fatto il resto.

Un ulteriore vantaggio dell'opzione ChatGPT + Fogli Google è che puoi semplicemente utilizzare la versione 3.5 gratuita di ChatGPT e ottenere lo strumento per creare le tue formule IMPORTXML, invece di avere la versione 4 per scansionare la pagina ed estrarre i dati.

Chiave da asporto

Ciò evidenzia un aspetto critico di come l’intelligenza artificiale ha trasformato il modo in cui pensiamo e lavoriamo.

Lo strumento migliore per questo lavoro non è semplicemente utilizzare l'intelligenza artificiale, Fogli Google o qualsiasi software specifico da solo, ma piuttosto una combinazione di strumenti e competenze.

È con questo approccio integrato che sviluppiamo flussi di lavoro efficienti ed efficaci, migliorando così la nostra produttività complessiva.

Le Critiche Crescenti Contro Google
Scoprire lo Sviluppo Web: La Programmazione come Arte
Scopri i Top Podcast SEO del 2024 e Mantieniti Aggiornato
Il ruolo delle finestre di dialogo nella progettazione di un'interfaccia utente web
Guida all'Integrazione di ChatGPT sul Tuo Sito Web
Utilizzo efficace di ChatGPT per la ricerca di parole chiave
Automatizzare le Campagne PPC con l'Intelligenza Artificiale Generativa
Aggiungere Coinvolgimento al tuo Sito con uno Sfondo Video CSS
Importanza delle Pagine di Destinazione per la Generazione di Lead e Incremento delle Vendite
Link Building

Link Building come parte della tua strategia di marketing può portare a risultati rivoluzionari. Seowebsite è specializzato nel Link Building e aiuta gli imprenditori a realizzare un forte profilo di link che contribuisce alla crescita online. Possiamo supportarvi anche in questo?