Introducing G2.ai, the future of software buying.Try now

Apprendimento Profondo: Come le Macchine Intelligenti Imparano e Progrediscono

Gennaio 22, 2021
da Amal Joby

Il deep learning è il modo in cui una macchina intelligente apprende le cose.

È un metodo di apprendimento per le macchine, ispirato alla struttura del cervello umano e a come apprendiamo.

È una tecnologia critica che rende i veicoli autonomi una realtà ed è anche il motivo per cui l'assistente vocale del tuo smartphone migliora nel fornirti assistenza nel tempo. In altre parole, il deep learning è la nostra migliore possibilità di creare macchine con intelligenza simile a quella umana.

In altre parole, il deep learning è un tipo di machine learning (ML) ispirato alla struttura del cervello umano. In effetti, DL è un'imitazione dei neuroni del cervello umano e cerca di imitarne le funzioni.

Sebbene il deep learning sia un ramo del machine learning, i sistemi DL non sono limitati da una capacità finita di apprendere come gli algoritmi ML tradizionali. Invece, i sistemi DL possono apprendere e migliorare le loro prestazioni con l'accesso a volumi maggiori di dati.

Il deep learning consente ai sistemi di intelligenza artificiale di imitare il modo in cui gli esseri umani acquisiscono certi tipi di conoscenza. Gli algoritmi DL cercano di trarre conclusioni – simili a come fanno gli esseri umani – analizzando continuamente i dati. Per raggiungere questo obiettivo, DL utilizza reti neurali artificiali (ANN).

DL imita il funzionamento del cervello umano, principalmente le funzioni come l'elaborazione dei dati e la creazione di schemi per il processo decisionale. È interessante notare che scienziati e ricercatori di IA hanno iniziato a costruire ANN affinché le macchine potessero eventualmente esibire le caratteristiche dell'intelligenza umana, come le capacità di risoluzione dei problemi, l'autoconsapevolezza, la percezione, la creatività e l'empatia, per citarne alcune.

Il deep learning non sarebbe stato possibile senza che i computer diventassero più economici, veloci e piccoli. Lo stesso vale per i dispositivi di archiviazione poiché grandi quantità di dati devono essere memorizzate ed elaborate affinché il deep learning diventi una realtà. Ecco perché, sebbene il deep learning sia stato teorizzato negli anni '80, è diventato fattibile solo di recente.

2,5

quintilioni di byte di dati vengono generati dagli esseri umani ogni giorno.

Fonte: TechJury

Elaborare tali enormi volumi di dati non strutturati è praticamente impossibile per gli esseri umani. Anche se riuscissimo a ottenere la forza lavoro necessaria, potrebbero volerci anni per analizzare ed estrarre informazioni rilevanti da quei grandi set di dati. Tuttavia, con il deep learning, questo processo è sorprendentemente semplificato.

Con l'aiuto del deep learning, un sistema di IA può apprendere e migliorare senza alcuna supervisione umana. DL consente anche alle macchine di apprendere da dati che sono non etichettati o non strutturati, o entrambi. Tuttavia, si noti che il processo di apprendimento può essere non supervisionato, semi-supervisionato o supervisionato.

Il deep learning è anche una parte critica della scienza dei dati. È utile per i data scientist per raccogliere, analizzare e interpretare grandi volumi di dati e rende i processi come la modellazione predittiva più veloci ed efficienti.

Rami dell'intelligenza artificiale come la visione artificiale e l'elaborazione del linguaggio naturale sono praticabili grazie al deep learning. Prima di approfondire ulteriormente, vediamo come funziona il deep learning per aiutarci.

Come funziona il deep learning?

In termini più semplici, il processo di apprendimento del DL avviene modificando le azioni del sistema basandosi su un ciclo di feedback continuo. Il sistema di apprendimento viene premiato per ogni azione corretta e punito per quelle sbagliate. Il sistema cerca di regolare le sue azioni per massimizzare la ricompensa.

Il deep learning utilizza modelli di apprendimento supervisionato, semi-supervisionato e non supervisionato per l'addestramento.

I neuroni che formano le reti neurali possono essere classificati in tre categorie in base alla loro gerarchia: strati di input, nascosti e di output.

  • Lo strato di input, che è il primo strato di neuroni, riceve i dati di input e li passa al primo strato nascosto.
  • Gli strati nascosti eseguono calcoli specifici, come il riconoscimento delle immagini, sui dati ricevuti.
  • Una volta completati i calcoli, lo strato di output genera l'output richiesto.

Come accennato in precedenza, il deep learning è reso possibile dalle reti neurali artificiali. Sono costruite traendo ispirazione dalle reti neurali del cervello umano. Un numero enorme di percettroni – la controparte artificiale dei neuroni – sono impilati insieme per formare le ANN.

Il termine "deep" è usato per specificare il numero di strati nascosti che le reti neurali hanno. Mentre le reti neurali tradizionali contengono due o tre strati nascosti, le reti profonde possono avere anche 150 strati.

Un modo semplice per capire come funziona il deep learning è guardare le reti neurali convoluzionali (CNN). È uno dei tipi più popolari di reti neurali profonde oltre alle reti neurali ricorrenti (RNN), alle reti generative avversarie (GAN) e alle reti neurali feedforward.

La CNN estrae caratteristiche direttamente dalle immagini, eliminando la necessità di estrazione manuale delle caratteristiche. Nessuna delle caratteristiche è pre-addestrata; invece, vengono apprese dalla rete quando si addestra sul set di immagini fornito. Questa caratteristica di estrazione automatica delle caratteristiche rende i modelli di deep learning altamente efficaci per la classificazione degli oggetti e altre applicazioni di visione artificiale.

Il motivo per cui le reti neurali profonde sono altamente accurate nell'identificare le caratteristiche e classificare le immagini è dovuto alle centinaia di strati che contengono. Ogni strato imparerebbe a identificare caratteristiche specifiche e, man mano che il numero di strati aumenta, aumenta la complessità delle caratteristiche dell'immagine apprese.

Al centro del successo del deep learning c'è un potente algoritmo. Scopri perché la retropropagazione è essenziale per l'accuratezza del modello.

Vuoi saperne di più su Software di Reti Neurali Artificiali? Esplora i prodotti Rete Neurale Artificiale.

Deep learning vs. machine learning

Il machine learning è un'applicazione dell'IA che consente alle macchine di apprendere e avanzare automaticamente dall'esperienza, senza essere esplicitamente programmate per farlo.

L'algoritmo di filtraggio dello spam presente nel tuo account email è un eccellente esempio di un algoritmo di machine learning. Gli algoritmi ML sono anche utilizzati nelle piattaforme OTT come Netflix per raccomandare film e serie che è più probabile che tu guardi e apprezzi.

Gli algoritmi ML sono in grado di analizzare i dati, identificare schemi e fare previsioni. Imparano e si adattano man mano che vengono introdotti nuovi set di dati. In un certo senso, il machine learning rende i computer più umani poiché conferisce la capacità di apprendere e progredire.

ML vs. DL

Come accennato in precedenza, il deep learning è un sottoinsieme del machine learning, che a sua volta è un sottoinsieme dell'intelligenza artificiale. Più specificamente, il deep learning è in realtà machine learning e può essere considerato una versione evoluta di quest'ultimo. Molto spesso, molti usano DL e ML in modo intercambiabile poiché funzionano quasi allo stesso modo.

Tuttavia, le loro capacità sono diverse. Sebbene gli algoritmi ML possano apprendere e migliorare gradualmente, hanno ancora bisogno di una qualche forma di guida. Ad esempio, se l'algoritmo fa una previsione errata, allora è essenziale l'intervento umano per apportare modifiche. Al contrario, gli algoritmi di deep learning possono determinare se le loro previsioni sono accurate o meno con l'aiuto delle reti neurali artificiali.

Il programma AlphaGo sviluppato da DeepMind utilizza ampiamente il deep learning. È il primo programma per computer a battere un giocatore professionista di Go umano. AlphaGo è stato seguito da numerose versioni avanzate, tra cui MuZero, che può padroneggiare un gioco senza che gli vengano insegnate le regole.

È interessante notare che i ricercatori hanno cercato di utilizzare tecniche di machine learning tradizionali per addestrare i robot a padroneggiare il gioco per molti anni. Ma ci sono riusciti solo quando hanno combinato il deep learning con l'apprendimento per rinforzo e altri paradigmi.

Un altro modo per differenziare tra machine learning e deep learning è guardare a come apprendono. Supponiamo che tu debba insegnare a una macchina a categorizzare le immagini di cani e gatti. Se stai usando il modello di machine learning, dovrai fornire dati strutturati – in questo caso, le immagini etichettate di cani e gatti – affinché l'algoritmo apprenda le caratteristiche specifiche che differenziano le immagini di entrambi gli animali. L'algoritmo migliora con ogni immagine etichettata a cui è esposto.

  Machine learning Deep learning
Supervisione umana Richiesta Non richiesta
Dati etichettati Richiesti Non richiesti
Tempo di addestramento Secondi o poche ore Ore o alcune settimane
Numero di punti dati richiesti Migliaia Milioni
Risorse computazionali Meno risorse necessarie Massive risorse necessarie
GPU Non richiesta Richiesta
Se stai usando il modello di deep learning, non devi necessariamente fornire dati strutturati o immagini etichettate in questo caso. Le reti neurali artificiali possono aiutare gli algoritmi a comprendere le caratteristiche distintive di ciascun animale.

Una volta che le immagini sono elaborate attraverso diversi strati delle reti neurali profonde, il sistema avrà accesso a identificatori specifici, che aiuteranno a classificare gli animali e le loro immagini. I diversi output elaborati da ciascuno strato della rete neurale sono combinati per categorizzare efficacemente le immagini.

La presenza di reti neurali significa anche che gli algoritmi di deep learning richiedono grandi set di dati. Questo perché gli algoritmi DL possono apprendere solo quando esposti a un milione o più di punti dati. D'altra parte, gli algoritmi ML possono apprendere e migliorare con linee guida predefinite.

Un'altra differenza notevole tra machine learning e deep learning è il tipo di hardware richiesto per entrambi. Poiché la complessità dei calcoli e la quantità di dati elaborati è significativamente inferiore per il machine learning, i programmi ML possono funzionare su computer di fascia bassa senza richiedere molta potenza computazionale.

D'altra parte, i sistemi di deep learning richiedono enormi risorse computazionali e componenti hardware potenti come le unità di elaborazione grafica (GPU). Lo scienziato informatico Andrew Ng ha determinato che le GPU potrebbero aumentare la velocità dei sistemi di deep learning di oltre 100 volte.

Con l'aiuto delle GPU, il tempo necessario per addestrare i modelli di deep learning può essere ridotto da giorni a poche ore. La maggior parte dei framework di deep learning come PyTorch e TensorFlow sono già accelerati dalle GPU.

Le aziende come Nvidia sono diventate più serie riguardo al deep learning accelerato dalle GPU e stanno modificando i loro prodotti di conseguenza. Inoltre, le GPU sono utili per i calcoli di matrici o vettori.

Il tempo necessario per addestrare gli algoritmi di deep learning e machine learning è anche significativamente diverso. Come avrai intuito, gli algoritmi di deep learning richiedono molto tempo per essere addestrati a causa della grande quantità di dati e dei calcoli complessi coinvolti. Potrebbe volerci qualche ora o addirittura settimane per addestrare un sistema DL, mentre un sistema ML può essere addestrato in pochi secondi o ore.
 

Ancora una volta, scegliere tra deep learning e machine learning dovrebbe essere una decisione altamente informata. La decisione deve essere presa tenendo conto del volume e della natura dei dati, della complessità del problema che si sta cercando di risolvere e delle risorse computazionali disponibili.

Applicazioni del deep learning

Sebbene il deep learning sia considerato un campo in crescita, i ricercatori e le organizzazioni stanno già beneficiando delle sue applicazioni. Ecco alcuni esempi di deep learning che stanno plasmando il mondo intorno a noi, e molto probabilmente, potresti averne incontrato alcuni nella tua vita quotidiana.

Auto a guida autonoma

I veicoli autonomi sono i beneficiari più famosi del deep learning. Milioni di set di dati che replicano numerosi scenari della vita reale vengono inseriti nel sistema, che viene utilizzato per insegnare al veicolo come navigare sulla strada in sicurezza.

Con l'aiuto dei modelli di deep learning, i produttori possono garantire che le auto senza conducente possano gestire scenari imprevisti senza causare danni ai passeggeri o ai pedoni.

Oltre ad aiutare le macchine a risolvere scenari ipotetici, il deep learning le aiuta anche ad analizzare ed elaborare i dati grezzi raccolti da telecamere, GPS e numerosi sensori. In questo modo, i veicoli autonomi possono identificare e distinguere tra corsie e divisori stradali, barriere, segnali, pedoni, auto in rallentamento o ferme e altro ancora.

Elaborazione del linguaggio naturale

L'elaborazione del linguaggio naturale (NLP) è un campo dell'intelligenza artificiale che conferisce alle macchine la capacità di comprendere, interpretare e derivare significato dalle lingue umane. In parole semplici, l'NLP rende possibile per le macchine conversare con gli esseri umani e persino comprendere le sfumature contestuali di una lingua.

Assistenti intelligenti come Siri e Google Assistant e app di traduzione linguistica come Google Translate sono esempi reali di NLP. L'NLP può essere ulteriormente suddiviso in generazione del linguaggio naturale (NLG) e comprensione del linguaggio naturale (NLU).

Consiglio: Dai un'occhiata ad alcuni dei migliori software di elaborazione del linguaggio naturale nel settore.

A prima vista, il riconoscimento vocale può sembrare solo una questione di conversione del suono in parole rispettive. È abbastanza semplice per gli esseri umani poiché la corteccia uditiva del nostro cervello è stata addestrata per anni a riconoscere e comprendere una lingua parlata o più.

Un semplice esempio per rappresentare la complessità della comprensione dei suoni è "recognize speech" e "wreck a nice beach". Entrambi suonano molto simili, sebbene i loro significati siano completamente diversi. Sebbene le macchine possano rilevare le parole in una frase, comprendere il loro significato contestuale è ancora un compito arduo. È qui che entra in gioco il DL per l'NLP.

Quasi tutti gli assistenti intelligenti si affidano al deep learning, e i loro livelli di comprensione e accuratezza aumentano con ogni compito. Google Assistant, che dipende quasi interamente dal DL, ha la massima accuratezza.

Il deep learning consente anche alle macchine di comprendere le complessità di una lingua, come le sfumature tonali, le espressioni e persino il sarcasmo. Comprendere le complessità di una lingua è anche fondamentale per l'analisi del sentiment sui dati testuali. Solo allora le aziende possono monitorare la reputazione del marchio e del prodotto, comprendere l'opinione pubblica e analizzare le esperienze dei clienti.

Un'altra applicazione del deep learning è la riassunto dei documenti. Il riassunto dei documenti o semplicemente la sintesi del testo è il compito di estrarre informazioni cruciali da un ampio passaggio di testo e creare un riassunto conciso di esso. Oltre a risparmiare tempo per gli esseri umani, la sintesi dei documenti può anche aiutare i programmi informatici che devono elaborare grandi quantità di dati in un breve periodo di tempo.

Il riconoscimento del parlante è un'altra applicazione utile del deep learning e sta diventando sempre più accurata. I governi possono utilizzare questa tecnologia per identificare i terroristi che effettuano chiamate anonime abbinando i loro campioni vocali a un database contenente voci riconosciute.

Riconoscimento delle immagini

Prima del deep learning, il campo del riconoscimento delle immagini si basava fortemente sulla regolazione manuale. Ciò significa che molti processi dovevano essere eseguiti dagli esseri umani e richiedevano molto tempo. Il deep learning elimina la necessità di elaborazione delle immagini manuale o tradizionale e accelera significativamente l'intero processo.

In questo decennio, la maggior parte dei sistemi di rilevamento degli oggetti accurati che incontri si basa esclusivamente sul deep learning. Google Photos è un eccellente esempio. Utilizza il deep learning per classificare e raggruppare le immagini.

Anche se non hai fatto alcuna etichettatura manuale, puoi cercare nel tuo album di Google Photos qualcosa come "insetti sui fiori" e ottenere risultati, a condizione che tu abbia immagini correlate memorizzate. Puoi persino cercare animali in base alla loro specie o razze e ottenere comunque tutte le foto contenenti l'animale particolare.

Mentre i sistemi tradizionali non basati sul deep learning hanno difficoltà a identificare gli oggetti di un'immagine, il deep learning va diversi passi avanti. Fa un lavoro impressionante nel riconoscere volti umani, animali, luoghi e cose con alta accuratezza e quasi zero errori.

Produzione

Con l'introduzione dell'Internet delle cose (IoT), le fabbriche stanno diventando più intelligenti che mai. L'automazione non è nuova per l'industria manifatturiera, e il deep learning rende le cose più lineari.

Con l'aiuto di architetture di deep learning come la CNN, le aziende possono sostituire la maggior parte degli operatori umani che altrimenti erano fondamentali per individuare prodotti difettosi nella linea di assemblaggio.

In questo modo, individuare i problemi di qualità diventa più accurato e conveniente, e le possibilità di errore umano vengono eliminate. Tali sistemi sono anche altamente scalabili e possono essere addestrati a rilevare problemi di qualità in qualsiasi punto della linea di produzione.

Un'altra applicazione del deep learning nella produzione è la manutenzione predittiva. Raccogliendo e analizzando i dati sulla salute dei macchinari nel tempo, gli algoritmi di deep learning possono prevedere le probabilità di un guasto di un asset produttivo.

Determinare quando riparare un'attrezzatura è fondamentale dal punto di vista finanziario di un'azienda poiché una macchina difettosa potrebbe fermare l'intera produzione. Poiché la manutenzione irregolare può anche causare danni costosi e irreparabili alle macchine e incidenti catastrofici in fabbrica nel peggiore dei casi, le aziende possono risparmiare molto con la manutenzione predittiva. Sapere quando riparare aiuterà anche le aziende a pianificare in anticipo e cercare alternative per ridurre i tempi di inattività della fabbrica.

L'ottimizzazione degli input di fabbrica è un'altra applicazione vantaggiosa del deep learning. Con i consumatori sempre più preoccupati per l'impronta di carbonio dei prodotti e le riforme ecologiche adottate dai loro creatori, le aziende non hanno altra scelta che ottimizzare l'uso delle risorse fisiche.

Inoltre, ottimizzare le risorse aiuterà le aziende a trarre più profitto da ogni prodotto, quindi l'ottimizzazione degli input di fabbrica. Monitorando l'uso delle risorse (consumo di elettricità e acqua, principalmente) di diverse macchine e processi produttivi, i sistemi di deep learning possono suggerire dinamicamente le migliori pratiche di ottimizzazione.

Scoperta di farmaci

La scoperta di farmaci è incredibilmente dispendiosa in termini di tempo e costosa. Il deep learning può rendere questo processo più economico e veloce. Il deep learning può aiutare a prevedere l'affinità di legame dei farmaci con proteine specifiche e persino gli effetti tossici di composti specifici.

AtomNet è una rete neurale convoluzionale profonda utilizzata per il design razionale dei farmaci. È una tecnologia all'avanguardia in grado di trovare composti farmacologici nuovi e non ovvi e può essere uno strumento straordinario per progetti di riposizionamento dei farmaci accelerati. AtomNet è stato anche utilizzato per prevedere nuovi biomolecole candidate per l'Ebola e la sclerosi multipla (SM).

Ospitalità

L'ospitalità è un'industria multimiliardaria sempre desiderosa di adottare nuove tecnologie, e la tecnologia del deep learning non fa eccezione. Con il DL, le organizzazioni possono trovare nuovi mezzi per migliorare l'esperienza e la soddisfazione del cliente e persino identificare processi costosi e sostituibili.

Il deep learning può aiutare le organizzazioni a pianificare in anticipo prevedendo le richieste stagionali. Un sistema di deep learning può trovare senza sforzo la correlazione tra i fattori che causano le richieste stagionali e prevedere le tendenze future analizzando i dati passati.

Analizzando i dati dei clienti, i modelli DL possono anche aiutare le aziende a costruire strategie per i clienti per migliorare i tassi di fidelizzazione e soddisfazione. Le aziende possono anche utilizzare varie tecniche di machine learning per il pricing competitivo considerando molteplici fattori come la stagionalità, gli eventi in tempo reale, le promozioni di terze parti, gli eventi locali e i dati di prenotazione passati.

Finanza

Poiché l'elaborazione di dati complessi e di grandi dimensioni è una specialità del deep learning, ha un enorme potenziale nell'industria finanziaria. Analizzando i dati storici, vari parametri di mercato e fattori esterni che possono influenzare le prestazioni di un'azienda, gli algoritmi di deep learning possono prevedere i valori delle azioni con un'accuratezza impressionante.

Poiché gli algoritmi DL possono analizzare vasti volumi di dati da più fonti contemporaneamente, è incredibilmente più veloce degli esseri umani e quindi viene utilizzato per creare strategie di trading redditizie.

Le reti neurali profonde sono anche utilizzate nel processo di approvazione dei prestiti. Analizzando i dati storici riguardanti approvazioni e rifiuti, le banche possono valutare correttamente i rischi di approvare un prestito a un'entità.

Restauro delle immagini

Il restauro delle immagini è un'altra impresa impressionante che il deep learning può realizzare. Il restauro delle immagini si riferisce generalmente al recupero di un'immagine chiara non degradata da un'immagine degradata. Il degrado può verificarsi a causa di numerosi fattori, con il rumore dell'immagine essendo uno.

Se il rumore dell'immagine è il colpevole, allora il processo di restauro è chiamato denoising dell'immagine. Allo stesso modo, le immagini possono essere a bassa risoluzione e attraverso il processo di super-risoluzione, possono essere create immagini ad alta risoluzione.

Con il deep learning, tali processi di restauro diventano più accurati e meno dispendiosi in termini di tempo. Metodi di apprendimento come il Deep Image Prior sono utilizzati per il processo di restauro. In termini semplici, il Deep Image Prior è una rete neurale convoluzionale utilizzata per migliorare un'immagine senza alcun dato di addestramento precedente oltre all'immagine stessa.

Nel 2017, i ricercatori del Google Brain hanno addestrato una rete neurale profonda per analizzare immagini a bassissima risoluzione di volti e prevedere i volti. Questo metodo è chiamato Pixel Recursive Super Resolution e può migliorare significativamente la risoluzione delle immagini. La rete neurale può individuare con facilità le caratteristiche distintive di una persona.

Il deep learning è anche ampiamente utilizzato per colorare le foto in bianco e nero. Puoi controllare strumenti online come Algorithmia per vedere come sarebbero apparse specifiche immagini in bianco e nero se scattate con una fotocamera a colori.

Pubblicità mobile

Il deep learning consente agli inserzionisti mobili di pubblicare annunci che possono catturare l'attenzione del loro pubblico di riferimento e offrire un ritorno sull'investimento (ROI) più elevato. Le tecniche di deep learning come la pubblicità predittiva basata sui dati sono utilizzate per aumentare la rilevanza degli annunci.

Numerosi network di annunci mobili in tempo reale utilizzano API di deep learning, che aiutano gli inserzionisti a massimizzare il tasso di clic (CTR). I tempi di risposta più rapidi dei sistemi di deep learning consentono anche agli inserzionisti di servire gli annunci giusti al momento e nello spazio giusti.

Rilevamento dei ritardi nello sviluppo

La diagnosi precoce e il trattamento dei disturbi dello sviluppo, dell'autismo o dei disturbi del linguaggio possono avere un impatto positivo sul futuro di un bambino. Un essere umano non noterebbe numerosi segni in fase iniziale, ma un sistema di deep learning sicuramente sì.

Utilizzando il deep learning, i ricercatori del MIT's Computer Science and Artificial Intelligence Laboratory e del Massachusetts General Hospital's Institute of Health Professions hanno creato un sistema informatico in grado di identificare i disturbi del linguaggio anche prima che un bambino entri all'asilo.

Inoltre, i bambini che si trovano nello spettro autistico hanno difficoltà a riconoscere gli stati emotivi delle persone intorno a loro. Ad esempio, i bambini con autismo avranno difficoltà a differenziare tra un volto felice e uno spaventato.

Come rimedio a questo problema, alcuni medici utilizzano robot amichevoli per i bambini alimentati dal deep learning per coinvolgere i bambini nell'imitare le emozioni e rispondere ad esse in modi appropriati. Mentre il robot interagisce, analizza l'interesse e il coinvolgimento del bambino osservando le loro risposte.

Il deep learning consente al robot di estrarre le informazioni più cruciali dai dati raccolti senza bisogno di alcuna assistenza umana. Con l'aiuto del DL, i ricercatori hanno scoperto numerosi fatti affascinanti come le differenze culturali tra i bambini di diversi paesi.

Hanno osservato che durante gli episodi di alto coinvolgimento, i bambini del Giappone mostravano più movimenti del corpo. D'altra parte, i grandi movimenti del corpo erano collegati a episodi di disimpegno per i bambini della Serbia.

Uno dei motivi principali per cui questo tipo di trattamento è efficace è che il robot è predisposto per attirare l'attenzione dei bambini. Inoltre, gli esseri umani tendono a cambiare frequentemente le loro espressioni e a esprimere la stessa emozione in modi diversi. Ma il robot lo fa sempre nello stesso modo in modo che il processo di apprendimento sia molto meno frustrante per il bambino.

Previsione del suono

La produzione del suono è una parte integrante della realizzazione di film. Sebbene certi suoni come passi, bussare alla porta o pneumatici che stridono possano essere presi in prestito da audio di stock, molte volte devono essere ricreati per migliorare l'esperienza cinematografica.

I ricercatori del MIT's Computer Science and Artificial Intelligence Laboratory (CSAIL) hanno creato un algoritmo di deep learning che prevede il suono. Quando viene fornito un clip video silenzioso di un oggetto che viene colpito, l'algoritmo può produrre suoni realistici. Il suono previsto è abbastanza realistico da ingannare gli esseri umani.

Per addestrare l'algoritmo, i ricercatori hanno filmato circa 1.000 video di quasi 46.000 suoni che costituiscono diversi oggetti colpiti, prodded e raschiati con una bacchetta. Hanno usato una bacchetta specificamente perché offriva un metodo coerente per produrre un suono.

I sistemi di previsione del suono non solo miglioreranno le cose per l'industria cinematografica, ma potrebbero assistere le macchine intelligenti nel navigare nel mondo e comprendere le proprietà degli oggetti.

Traduzione visiva

Hai mai provato a tradurre lingue straniere con l'app Google Translate? Non solo l'app "traduce" le parole, ma sovrappone l'immagine con la traduzione. L'app lo fa con l'aiuto delle reti neurali profonde ed è uno dei tanti modi in cui Google inserisce il deep learning in uno smartphone.

Una volta che l'app trova dove si trovano le lettere nell'immagine analizzando i suoi pixel, una rete neurale convoluzionale addestrata su lettere e non lettere cerca di riconoscere cosa sia ciascuna lettera. Una volta identificate le lettere, l'app cerca in un dizionario per ottenere le traduzioni.

La traduzione viene quindi resa sopra le lettere originali nello stesso stile dell'immagine originale. Tali traduzioni visive sono super veloci se eseguite sui data center di Google. Ma poiché la maggior parte degli utenti possiede uno smartphone di fascia bassa e ha connessioni internet instabili, Google ha sviluppato una piccola rete neurale con numerose limitazioni.

Sistemi di raccomandazione

Gli algoritmi di deep learning sono utilizzati nei sistemi di raccomandazione per suggerire contenuti che gli utenti sono più propensi a guardare. L'efficacia di questi algoritmi è fondamentale per piattaforme come Netflix poiché solo se gli utenti trovano frequentemente contenuti interessanti, continueranno l'abbonamento. Amazon e numerose altre piattaforme di e-commerce si affidano anche pesantemente agli algoritmi di deep learning per raccomandare i prodotti giusti e aumentare le vendite.

Rilevamento delle frodi

Le perdite e i danni legati alle frodi sono una triste realtà dell'industria finanziaria. I truffatori finanziari stanno crescendo.

$1,9 miliardi

sono stati persi a causa del furto di identità e delle frodi nel 2019.

Fonte: Insurance Information Institute

Molte attività fraudolente possono essere rilevate con l'aiuto di sistemi basati su regole. Ad esempio, le transazioni di grandi dimensioni o quelle che avvengono in luoghi insoliti sono ottimi indicatori di frode e possono essere facilmente rilevate.

Tuttavia, ci possono essere numerosi comportamenti degli utenti che i sistemi basati su regole potrebbero non identificare come sospetti, ma i sistemi di rilevamento delle frodi basati su DL sicuramente lo farebbero. La potenza di elaborazione per i sistemi basati su DL è anche notevole, e riducono anche la necessità di lavoro manuale – a differenza dei sistemi basati su regole che richiedono frequente supervisione umana e correzioni manuali.

Come creare e addestrare modelli di deep learning

Ci sono tre modi comuni in cui puoi addestrare un modello di deep learning per eseguire la classificazione degli oggetti. Puoi addestrarlo da zero, utilizzare l'apprendimento per trasferimento o utilizzare una rete come estrattore di caratteristiche. Diamo un'occhiata rapida a ciascuno.

1. Addestramento da zero

Per addestrare reti neurali profonde da zero, devi acquisire grandi volumi di set di dati etichettati – ad esempio, le immagini etichettate di gatti e cani. Dopodiché, devi progettare un'architettura di rete che possa apprendere le caratteristiche distintive degli animali. A seconda del volume di dati, del tasso di apprendimento e della potenza di elaborazione, le reti potrebbero impiegare giorni o settimane per addestrarsi.

2. Approccio di apprendimento per trasferimento

Il modo più comune di addestrare reti neurali profonde è attraverso l'approccio di apprendimento per trasferimento. In questo processo, un modello pre-addestrato viene perfezionato per eseguire un nuovo compito. Puoi iniziare con una rete esistente e fornire nuovi set di dati contenenti classi precedentemente sconosciute.

Puoi modificare la rete in base alle tue esigenze, in questo caso, identificare e distinguere tra le immagini di gatti e cani. Poiché questo processo richiede una quantità minore di dati, il tempo di calcolo diminuisce significativamente.

3. Utilizzo dell'estrattore di caratteristiche

Un altro approccio per addestrare un modello di deep learning è utilizzare una rete come estrattore di caratteristiche. Poiché ogni strato della rete è designato per apprendere caratteristiche specifiche dalle immagini, puoi effettivamente estrarre queste caratteristiche dalla rete durante il processo di addestramento. Queste caratteristiche possono quindi essere inserite in un modello di machine learning. Facendo ciò, si può ridurre la necessità di enormi risorse computazionali.

Deep learning: più, meglio è

Una proprietà interessante del deep learning è che migliora se fornisci più dati e più risorse computazionali. Sebbene gli algoritmi di deep learning possano sembrare troppo esigenti, sono altamente accurati e richiedono meno o nessuna assistenza umana nella maggior parte dei casi.

Il deep learning sarà anche la nostra chiave per sbloccare l'intelligenza artificiale generale, un sistema di IA in grado di pensare, apprendere e agire come gli esseri umani.

Scopri di più sull'intelligenza artificiale generale e vedi tu stesso se una tale macchina intelligente sarebbe un amico o un nemico.

Amal Joby
AJ

Amal Joby

Amal is a Research Analyst at G2 researching the cybersecurity, blockchain, and machine learning space. He's fascinated by the human mind and hopes to decipher it in its entirety one day. In his free time, you can find him reading books, obsessing over sci-fi movies, or fighting the urge to have a slice of pizza.