Close
Lingua
Do you know that we are indexing all major social networks in 187 languages
Blog
Tech talk: come Talkwalker utilizza sistemi di AI e deep learning per il social listening

Tech talk: come Talkwalker utilizza sistemi di AI e deep learning per il social listening

Uno dei concetti attualmente più gettonati nel mondo del business è quello di intelligenza artificiale, o AI (Artificial Intelligence). Tuttavia, mentre i termini “training set” e “reti neurali” sono ormai entrati a far parte del linguaggio quotidiano di Talkwalker, l'intelligenza artificiale è ancora avvolta da un'aura di mistero tecnologico. 

Facebook, IBM e Google non sono certo gli unici player del settore. Molti dei nostri potenziali clienti si stupiscono quando spieghiamo loro fino a che punto il deep learning e le reti neurali siano diventati parte integrante di molte funzioni di Talkwalker.

Ho parlato con Benedikt Wilbertz, il nostro Head of Machine Learning and Data Science, per capire i concetti base dell'intelligenza artificiale e i motivi per i quali è così importante per il social listening.

Benedikt, supponiamo che io non abbia mai studiato il computer.Qual è la differenza tra AI, machine learning, and deep learning?

Studiato il computer? Ah, cominciamo bene...

L'intelligenza artificiale o AI si riferisce all'imitazione da parte di una macchina delle funzioni “cognitive” che le persone associano ad altre facoltà della mente umana, come l'apprendimento e la risoluzione dei problemi. Risale agli anni Sessanta, quando i primi modelli basati su regole sono riusciti a ottenere risultati attribuibili all'intelligenza artificiale.

Artificial Intelligence

Questo grafico mostra l'evoluzione dell'AI. Image Cred: Michael Copeland/Nvidia

Il termine “machine learning” è stato utilizzato quando si è resa disponibile una maggiore potenza di calcolo tale da abilitare l'apprendimento statistico per i problemi relativi all'intelligenza artificiale. Supponiamo di voler far riconoscere a un computer un numero tre scritto a mano. Invece di basarsi su una descrizione dell'aspetto del tre, la macchina utilizzerà un algoritmo per analizzare grandi gruppi di esempi scritti a mano per apprenderne il contenuto.

Nel 2012, è stata raggiunta una potenza di calcolo tale da consentire la creazione di reti neurali artificiali. Il deep learning si riferisce all'addestramento delle architetture di rete in modo simile al nostro concetto di cervello umano con tutte le sue connessioni.

Come si riesce, ad esempio, a riconoscere l'immagine di un gatto?

Se prendiamo l'esempio dell'immagine di un gatto, una rete neurale profonda scomporrebbe innanzitutto l'immagine in pezzettini minuscoli e analizzerebbe gradualmente i diversi layer sino a riconoscere le caratteristiche di alto livello.

Neural networks and deep learning

Avanzate reti neuronali segmentano le informazioni in piccoli pezzi per poi analizzarli secondo i diversi layer fino a quando non si riesce a daterminare un risultato. Image cred: Neuralnetworksanddeeplearning.

Nel 2012, le reti neurali che sono state realizzate da un team coordinato da Geoff Hinton dell'Università di Toronto hanno registrato un notevole progresso, che ha avuto un'enorme risonanza all'epoca.

E ora qualsiasi sistema da Siri a Google è in grado di fornirmi suggerimenti basati sull'intelligenza artificiale. Se questa soluzione esiste dagli anni Sessanta, perché solo di recente è stato registrato un boom?

Dal punto di vista tecnico questo è il risultato di molteplici fattori. L'elaborazione è più veloce che in passato e le GPU che utilizziamo per l'apprendimento diventano sempre più potenti. La digitalizzazione inoltre ha semplificato la creazione di ampi gruppi di dati classificati. Il deep learning non può fare a meno di ampi data set.

Per ottenere risultati di elevata qualità, l'addestramento delle reti si basa necessariamente su centinaia di migliaia, spesso persino milioni di immagini. Ogni giorno aggiungiamo 300 milioni di articoli al database di Talkwalker e la nostra tecnologia di riconoscimento delle immagini ne analizza più di 100 milioni.

Bene, tutto chiaro. Ora, come sono correlati social listening e intelligenza artificiale?

Il social listening presenta molte attività complesse che tradizionalmente erano effettuate da persone. La maggior parte delle aziende di media monitoring, ad esempio, ha dei programmatori che filtrano manualmente i risultati del giorno per mappare il sentiment. Ma i dati stanno crescendo in modo esponenziale sul web, al punto che in molti casi non si possono effettuare giornalmente le attività cognitive di base su milioni di documenti e immagini. L'obiettivo è sviluppare un'intelligenza artificiale che possa effettuare queste attività come le persone.

Basta che l'intelligenza artificiale non impari presto anche a scrivere degli articoli... o posso dire addio al mio lavoro! Com’è entrato in gioco Talkwalker?

Diciamo che per molti brand una delle principali sfide è rappresentata dall'analisi delle enormi quantità di immagini che vengono condivise. All'inizio del 2016 abbiamo presentato la tecnologia di riconoscimento delle immagini di Talkwalker, che è la prima applicazione di apprendimento approfondito in grado di riconoscere 30.000 brand e loghi nelle immagini condivise sui social media. Da allora abbiamo rapidamente aumentato le nostre applicazioni basate sull'intelligenza artificiale per le immagini, aggiungendo il rilevamento di paesaggi, oggetti, sesso ed età.

L'elaborazione del linguaggio naturale o NLP (Natural Language Processing), è un altro settore in cui ci siamo piuttosto impegnati sin dall'inizio e nel quale durante gli ultimi mesi abbiamo fatto importanti scoperte, che saranno presto visibili nell'intera piattaforma. I brand devono essere in grado di effettuare l'analisi del sentiment con grande accuratezza attraverso milioni di risultati e questo è un settore in cui il deep learning ci farà fare un salto di qualità quest'anno.

Parliamo di risorse. Non sarebbe meglio collaborare con un grande fornitore per queste attività? Perché lo sviluppo dell'intelligenza artificiale viene fatto in azienda?

Adesso sei tu che tenti di rubarmi il lavoro...

Cerco di lasciarmi aperte tutte le opportunità.

Uno degli aspetti eccezionali di questa tecnologia è che se ne possono variare le dimensioni quasi a costo zero. Ho già parlato del vantaggio di poter usare grandi gruppi di dati che vengono mantenuti in azienda. A parte questo, occupandoci noi stessi dello sviluppo possiamo controllare l'accuratezza dei nostri modelli direttamente nei sistemi di produzione. E possiamo immediatamente riaddestrare i modelli se rileviamo problemi di qualità. Questo è l'unico modo per assicurare costantemente risultati di alta qualità e nessun fornitore esterno lo farebbe con altrettanta cognizione di causa.

Ma non può essere tutto rose e fiori. Quali sono gli aspetti più difficili da risolvere?

Direi che attualmente le principali sfide sono tre. Innanzitutto, le applicazioni si basano principalmente sul supervised learning, vale a dire che abbiamo bisogno di un training set con milioni di istanze classificate. Questi set di dati sono difficili da creare, soprattutto per gli standard qualitativi che stabiliamo.

In secondo luogo, ogni problema richiede un algoritmo altamente specializzato adottato specificamente per quel tipo di problema. Se si aggiunge il fatto che in genere non si sa quale sia l'aspetto dell'algoritmo migliore si capisce l'entità del compito.

Tutte queste fasi, infine, necessitano di una potenza di calcolo molto elevata. Le reti neurali non possono essere addestrate su computer normali, ma richiedono GPU speciali per l'addestramento. E qui si entra nel merito di tutte le sfide dell'HPC (acronimo di High Performance Computing, calcolo ad alte prestazioni).

In quale direzione si sta andando? Qualche anticipazione?

Il boom dell'intelligenza artificiale si basa su un motivo valido. Le tecnologie basate sull'apprendimento automatico sono già entrate nella quotidianità e siamo appena all'inizio. Le aziende come Google, Salesforce e Microsoft stanno utilizzando l'intelligenza artificiale per potenziare i loro prodotti. Lo scorso aprile, Talkwalker è entrata a far parte dell' NVIDIA's Inception Program, che sostiene la crescita delle startup eccellenti che stanno rivoluzionando vari settori con l'intelligenza artificiale e la scienza dei dati. Per noi si è trattato di un'ottima opportunità per continuare a beneficiare della loro esperienza e introdurre nuove feature.

Nel settore del social listening, e in particolare del sentiment, si è finalmente arrivati al punto in cui la tecnologia può mantenere le promesse che alcuni fornitori fanno da anni. Grandi benefici sono in arrivo anche in qualche altro settore, quindi continuate a seguirci

Grazie Benedikt! Torneremo presto per altre novità.

Se vuoi saperne di più sulla pluripremiata tecnologia di riconoscimento delle immagini di Talkwalker, contatta uno dei nostri consulenti oggi stesso.

social data intelligence demo gratuita