The Summer Vision Project

Nell’estate del 1956, presso il Dartmouth College di Hannover, si tenne la prima conferenza sull’intelligenza artificiale (AI) con l’intento di raccogliere i contributi dei diversi pionieri della nascente disciplina come John McCarthy , Marvin Minsky ,  Claude Shannon,  Allen Newell e Herbert Simon. Secondo le parole del matematico Marvin Lee Minsky lo scopo di questa nuova disciplina sarebbe stato quello di  “far fare alle macchine delle cose che richiederebbero l’intelligenza se fossero fatte dagli uomini”.

La prima generazione di ricercatori nel campo della AI riteneva fattibile l’utilizzo del computer per risolvere problemi legati al linguaggio naturale o alla visione umana come ad esempio la produzione e la comprensione del linguaggio (NLP/NLU) o il riconoscimento di oggetti (Computer vision).

The Summer Vision Project

describe what it saw,
Marvin Minsky

Nel 1966 Marvin Minsky propose ad una decina dei suoi studenti di trascorrere l’estate a programmare un computer che fosse in grado di utilizzare una videocamera per descrivere gli oggetti della scena.
Minsky lasciò che fosse il suo collega matematico Seymour Papert ad organizzare il gruppo di lavoro, ad esempio nominando Gerald Jay Sussman come responsabile, e a definirne gli obiettivi.
Papert credeva ingenuamente che suddividendo il problema del come e cosa vediamo in sub-problemi sarebbe stato più facile affrontarlo e costruire un sistema di pattern recognition.

Nasceva così il Summer Vision Project con l’intento di riconoscere inizialmente blocchi come cilindri, cubi o palline su una una superficie piana.

Un micro-mondo di blocchi

Alla fine degli anni ’60 Minsky e Papert giunsero alla conclusione che il metodo di ricerca dell’intelligenza artificiale doveva basarsi su un contesto ben limitato come micro-mondi (micro-worlds). Partendo dal presupposto che spesso nelle scienze esatte, come la fisica, i principi di base erano stati compresi meglio usando modelli semplificati come piani senza attrito o corpi rigidi.

Minsky creò un braccio robotico che utilizzava un computer con una videocamera per riconoscere blocchi (blocks) di diverse dimensioni e forme.
Il sistema era in grado di determinare le dimensioni e la posizione dei blocchi su un tavolo per poi ordinarli in ordine di grandezza. Oppure per costruire una torre mentre svolge un task secondario come rendere la torre il più alta possibile.

Questo lavoro fu di ispirazione per il suo libro La società della mente (1986) incentrato sulla moltitudine di processi chiamati agenti, come ha affermato Minsky:

Each mental agent by itself can only do some simple thing that needs no mind or thought at all. Yet when we join these agents in societies—in certain very special ways—this leads to true intelligence.

La mente sarebbe quindi il prodotto dell’interazione di agenti specializzati che possono operare in modo autonomo, a volte competitivo o collaborativo. Ad esempio per bere un caffé  si richiede l’intervento collaborativo di numerosi agenti specializzati nella presa, nell’equilibrio, nel gusto e nel movimento:

Prima di Alexa c’era SHRDLU

Nel 1968 Minsky proclamava che entro una generazione ci sarebbero stati computer intelligenti come l’assistente vocale HAL del film “2001 Odissea nello spazio” di cui era stato anche consulente.

Nello stesso anno il venticinquenne Terry Winograd, allora studente di Seymour Papert, stava programmando SHRDLU uno dei primi sistemi in grado di interagire con l’utente attraverso la comprensione del linguaggio naturale (NLU). Dimostrando che un programma con un ristretto dominio, come quello di un micro-mondo di blocchi, poteva comunicare in modo significativo in linguaggio naturale.

Bibliografia

[1] Marvin Minsky, Società della mente, Adelphi, 1989

Sitografia

[1] Jeremy Bernstein, A.I. , The New Yorker, 1981