Con l’avvento dell’intelligenza artificiale, gli utenti hanno notato un aumento dei riassunti generati dall’IA delle recensioni dei prodotti su Amazon. Ma possiamo fidarci di questi riassunti? Amazon ha annunciato lo scorso agosto una soluzione alla stanchezza delle recensioni: un riassunto generato dall’IA che evidenzia in modo sintetico i pro e i contro dei clienti.
Teoricamente, questa funzione è uno strumento utile che aiuta i consumatori a decidere rapidamente quali prodotti acquistare. Tuttavia, l’apparizione di questi riassunti evidenzia i rischi derivanti dall’affidarsi all’IA generativa: inesattezza e informazioni fuorvianti.
Problemi di accuratezza e inesattezze
Una rapida ricerca su Amazon ha evidenziato alcune criticità. Un riassunto delle recensioni per il tappetino da yoga Manduka GRP Adapt generato dall’intelligenza artificiale si riferiva erroneamente ad un diverso tappetino yoga di un marchio concorrente, chiamandolo “tappetino yoga Alo Warrior”. Amazon ha risolto questo specifico problema dopo che Mashable lo ha segnalato. Tuttavia, correggere singole imprecisioni nell’output di un grande modello linguistico è un po’ come giocare a “colpisci la talpa”, dato che nemmeno gli ingegneri comprendono appieno il comportamento di questi modelli.
Problematiche dell’IA generativa
L’intelligenza artificiale generativa può comportarsi in modi imprevedibili o sorprendenti. In alcuni esempi minori, il riassunto generato dall’IA per un prodotto chiamato “Musher’s Secret” si riferiva in modo vago a “forniture per animali domestici” e diceva che mantiene “calde le psa pads”. Trattandosi di una pomata che protegge le zampe dei cani dai marciapiedi ghiacciati, probabilmente intendeva “zampe” invece di “psa pads”, a meno che “psa pads” non sia qualcosa che non conosciamo. In termini di buon senso dell’IA, sembrerebbe che il modello “impari” a scrivere cose come “psa pads” invece di “zampe” dalle particolarità del linguaggio degli utenti reali, il che conferirebbe alle uscite dell’IA una certa autenticità. Ma è ciò che gli utenti dovrebbero desiderare?
Errori minori ma significativi
Questi sono errori minori che non influiscono sull’essenza del riassunto. Inoltre, le recensioni umane contengono spesso errori di battitura che non ne compromettono necessariamente la credibilità. Tuttavia, forse il livello di affidabilità dovrebbe essere più alto per un’intelligenza non umana che non ha ancora guadagnato la nostra fiducia. Quindi, qualsiasi inesattezza o assurdità sembrano essere un segnale d’allarme immediato.
Potenziale danno alla reputazione dei prodotti
Ancora peggio: se inesattezze e allucinazioni passano inosservate, questi riassunti – presentati come più o meno autorevoli – potrebbero danneggiare la reputazione dei prodotti. Un rapporto di Bloomberg ha scoperto che i riassunti delle recensioni dei prodotti esagerano gli aspetti negativi delle recensioni, ingannando i consumatori. Il riassunto generato dall’IA delle palle da tennis Penn con una valutazione di 4,7 stelle evidenziava l’odore come un aspetto negativo. Ma delle 4.300 recensioni, “solo sette menzionano un odore”. Questo non solo inganna i clienti, ma potrebbe creare problemi per i venditori.
L’importanza del controllo di qualità
L’uso di questa tecnologia solleva anche questioni su cosa dovrebbe e cosa non dovrebbe avere riassunti generati dall’IA. Per il controllo di qualità e per garantire che i prodotti non abbiano riassunti generati dall’IA di recensioni truffaldine, Amazon utilizza solo recensioni di acquisti verificati e si concentra su prodotti che hanno “un numero minimo di recensioni” e solo in situazioni in cui “i clienti condividono la stessa opinione”, ha affermato la portavoce Maria Boschetti.
Al momento, Amazon non ha riassunti delle recensioni per i libri, il che sembra una cosa positiva. Ma ha riassunti delle recensioni per medicinali come l’ibuprofene Advil, che potrebbero non rappresentare un potenziale pericolo, ma suggerisce una certa mancanza di prudenza nell’introduzione di questa funzione. Amazon ha dichiarato di avere intenzione di espandersi in più categorie, quindi la prudenza sembra non essere attualmente in programma.
Nonostante non sia stato difficile trovare esempi difettosi, i clienti stanno già trovando utile questa funzione.

