Carlo Penco*

Dai Micromondi ai Contesti

testo di un paper dato a parma - convegno AI*IA 1994 - il testo e' a carattere molto generale; su altri temi più specifici vedi

Holism in Artificial Intelligence?

* dipartimento di filosofia - genova - penco

 

1. pensare = usare segni: per una IA. de-psicologizzata

2. Il paradigma procedurale del significato e le fallacie psicologiste

3. Giochi linguistici e micromondi: per una teoria del significato

4. Il contextual reasoning e il problema del significato -

 

Il paper è a carattere molto generale:

in 1) discuto dell'apparente crisi del paradigma simbolico di fronte al paradigma connessionista come una occasione per precisare lo status dell'IA simbolica e dell'idea del pensiero come uso di simboli che sta alla base del paradigma simbolico in IA. Accenno alle posizioni di Paul Smolensky e Andy Clark per distinguere diversi compiti nel campo delle scienze cognitive (sloga: il connessionismo si occupi dei processi mentali; il paradigma simbolico dei processi sociali-culturali).

In 2) cerco di definire uno studio della "comprensione" come studio delle strategie generali del ragionamento, che in parte prescinda dai processi psicologici e neurofisiologici che ne stanno alla base, difendendo l'autonomia del simbolico dal subsimbolico. Le posizioni tradizionali di Winograd e Woods possono essere riviste alla luce di alcuni suggerimenti di Wilks.

In 3) tento un recupero di idee tradizionali (come i "giochi linguistici" di Wittgenstein) come quadro di riferimento per un tipo di strategia di ricerca in IA simbolica, in particolare nellÕambito del Contextual Reasoning.

In 4) accenno ad alcuni problemi, come il problema della rappresentazione lessicale, che si possono porre nellÕambito della formalizzazione dei contesti.

[Ho trattato un problema più specifico, quello dellÕolismo, in un paper (Holism in Artificial Intelligence?) che dovreste trovare allÕindirizzo di cui sopra]

 

 

1. pensare = usare segni: per una IA. de-psicologizzata

Nella tradizione filosofica occidentale l'idea che pensare sia equivalente a usare segni ha una lunga storia da Aristotele (l'uomo è caratterizzato dall'essere padrone di "logo semantico", cioè discorso che produce segni") a Wittgenstein (testualmente "pensare è usare segni"). I contemporanei accettano questa visione tradizionale e la radicalizzano. L'equazione "pensare = usare segni o calcolare" diviene un paradigma portante dell'IA, a partire dai primi lavori fino a consolidarsi nella ipotesi del sistema fisico di simboli di Newell e Simon. Questo paradigma è entrato in crisi per i dubbi posti sull'ipotesi funzionalista della mente come sistema simbolico, specie di fronte all'emergere del paradigma connessionista. Ci troviamo di fronte a una svolta radicale del pensiero occidentale o dobbiamo solo correggere il tiro? A me sembra dobbiamo correggere il tiro.

Uno dei motivi principali di confusione sta nelle distorsioni provocate dall'invadenza della psicologia nelle scienze cognitive e nell'I.A. stessa. Il paradigma dell'I.A. è stato fortemente influenzato da una visione filosofica in cui ogni discorso sul pensiero e sulla comprensione è parte della psicologia. Non è un caso che Fodor stesso, uno dei filosofi che, con l'idea del "linguaggio del pensiero", più hanno contribuito alla iniziale fortuna del paradigma simbolico sia stato un allievo di Chomsky che poneva la linguistica, lo studio dei linguaggi naturali, come una branca della psicologia. Mentre in filosofia del linguaggio alcuni autori sostenevano la necessità di "espungere i significati dalla mente" (Dummett) in I.A. si è accettata prontamente una interpretazione psicologista dei costrutti teorici: le simulazioni erano rappresentazioni del modo in cui funzionava la mente, rappresentazioni dei processi mentali del parlante. Tali rappresentazioni era spesso modellate in analogia con l'analisi dei significati di tradizione logico-filosofica, rendendo le rappresentazioni mentali dei "doppioni" dei costrutti teorici inventati per spiegare la struttura del linguaggio e la struttura del significato delle espressioni linguistiche. Ma i processi mentali sono processi complessi che danno origine alla produzione linguistica, ma non si identificano con essa. Una volta messo in evidenza questo, è stata giocoforza criticare l'approccio "simbolico" allo studio della mente, mostrando che i processi mentali non funzionavano in modo esclusivamente simbolico. Ma quello che viene criticato è un passo falso: é l'applicazione ingenua di tecniche di analisi linguistica all'analisi dei processi mentali.

Alla chiarificazione di questo punto ha contribuito senz'altro lo sviluppo del paradigma connessionista; ma una riflessione sulla portata del paradigma connessionista ha contribuito anche a separare in qualche modo quello che era stato troppo facilmente identificato: il processo mentale e la struttura del linguaggio. Ad es. Smolenski sostiene che mentre il Connessionismo è lo studio dei meccanismo subsimbolici della mente, l'I.A. simbolica è lo studio dei meccanismo simbolici della cultura. Di qui una distinzione tra le reti neurali come simulazione del funzionamento delle connessioni neurali del cervello e della mente, e le reti semantiche come rappresentazione della conoscenza condivisa in una cultura.

Un paragone aiuta: l'IA simbolica sarebbe analoga a una spiegazione in termini di meccanica newtoniana, mentre il Connessionismo rappresenterebbe la spiegazione in termini di meccanica quantistica; il Connessionismo rappresenterebbe cioè la "vera" spiegazione. Ma anche questa immagine è piuttosto ambigua e tende a far dimenticare la autonomia di diversi livelli di descrizione. Un certo tipo di spiegazione "fine" a livello quantistico non "spiega", se non in linea di principio, interrelazioni a livello macroscopico: a livello macroscopico occorre utilizzare altri concetti e altri calcoli: sarebbe insensato o inutile una descrizione di oggetti macroscopici e loro interrelazioni (es. un sistema solare) in termini di elettroni, ecc. Le leggi che valgono a livello gravitazionale sono scritte in un linguaggio che ha la sua autonomia rispetto alla descrizione del movimento delle particelle elementari. Andy Clark ha sostenuto una posizione analoga quella di Smolensky, con una differenza: il modello connessionista non è i "vero" modello, di cui i modelli simbolici sono approssimazioni vaghe; al contrario considera "i costrutti dell'IA simbolica non come mere approssimazioni alla verità cognitiva connessionista, ma come un mezzo per illuminare un livello superiore di unità tra gruppi di sistemi cognitivi altrimenti molto diversi." (p.270 ed.it.). L'idea di fondo è che proprietà di alto livello, emergenti dai processi subsimbolici, possono essere in qualche modo "invisibili" a livello subsimbolico. L'analisi subsimbolica resta corretta, in linea di principio, ma non vanifica la necessità di una analisi di livello superiore. Se il simbolico è una proprietà emergente dal subsimbolico, tale proprietà emergente ha le sue leggi e la sua autonomia. Forse lo studio del "simbol grounding" avrà interesse per la produzione di sistemi di riconoscimento di oggetti, ma difficilmente riuscirà a dire qualcosa di nuovo sulla struttura sul funzionamento dell'attività linguistica, le cui leggi sono depositate socialmente nella cultura di una comunità linguistica.

Nel momento in cui si fa acuta l'esigenza di integrazione dei diversi paradigmi in discussione è utile non perdere quello di valido nella tradizione IA. E guardare con occhi diversi alla storia dell'IA può aiutare a cogliere uno sviluppo teorico più continuo di quanto sembri a prima vista. Per questo è però essenziale distinguere accuratamente quelle che si possono chiamare "visione psicologica" e "visione procedurale", che corrispondono grosso modo alla distinzione di Smolensky tra studio dei meccanismi mentali e dei meccanismi sociali. Distinguendo questi aspetti si può guardare in modo nuovo ai lavori dell'IA simbolica, a partire dalle prime intuizioni degli anni 70 sulla visione procedurale del significato, depurate dall'infarcitura psicologica che le assimilava a simulazione di processi mentali. Esse possono essere considerate simulazione di tipi di processi simbolici riconoscibili socialmente o intersoggettivamente, rappresentazioni di una attività strutturata, simbolica, come è appunto il linguaggio naturale.

 

2. Il paradigma procedurale del significato e le fallacie psicologiste -

Uno studio dei processi simbolici è uno studio del significato e di cosa si intende per significato. Se si parla di significato in stretta connessione con l'intenzione, si accentua il problema dell'aspetto psicologico, dei processi mentali che accompagnano e che permettono o sottostanno alla produzione simbolica; se si parla di significato come uso dei simboli si accentua l'aspetto procedurale del funzionamento e delle relazioni inferenziali tra simboli. Nella breve storia dell'IA vi è stato un unico paradigma di teoria del significato che si differenziava in modo originale dai lavori dei linguisti e dei filosofi: il paradigma procedurale.

Quali strategie generali sono state adottate per una analisi procedurale del significato? Winograd, nei suoi primi lavori anni-70, sembra quasi una riformulazione moderna e aggiornata della visione fregeana per cui il senso di una espressione determina il suo riferimento: a un termine singolare è connessa una procedura che determina l'oggetto, se ve ne è uno, cui il termine si riferisce; a ogni predicato è associata una procedura che determina la classe di oggetti che cadono sotto il predicato; a ogni enunciato è associata una procedura che indica la forza illocutoria dell'enunciato e fa eseguire azioni corrispondenti: a un'asserzione una valutazione del valore di verità e una acquisizione di informazione; a un ordine una esecuzione; a una domanda una risposta. Il tutto è dato nella prospettiva dei micromondi: restringi il mondo per analizzare meglio il linguaggio. Negli anni 80 Winograd insiste di più sull'importanza degli atti linguistici; viene lasciato in disparte il discorso dei micromondi. L'accento si è spostato sulle interazioni nel mondo "reale" nella sua complessità. Si è perso così di vista il valore strategico della ricerca sui micromondi, lasciando allo stesso tempo in disparte lo sviluppo del paradigma procedurale del significato, su cui solo pochi, tra cui Woods, hanno continuato a lavorare. Tra le critiche principali alla visione di Winograd è che essa tende a ridurre il significato all'algoritmo di riconoscimento: ma posso conoscere il significato di una parola anche se non so riconoscere immediatamente l'oggetto cui essa si riferisce (vale ad es. nel caso della parola "uranio" e, per la maggior parte di noi, per la parola "oro"). Woods ritiene così che le procedure con cui devono essere identificati i significati siano più astratte delle procedure di riconoscimento. Alcune caratteristiche caratterizzano i significati-come-procedura di Woods, che accoglie alcuni aspetti dell'idea originaria di Winograd sviluppandola e integrandola: (i) sono classi di equivalenza di procedure (programmi le cui subroutines possono avere diverse realizzazioni) (ii) sono eseguibili non solo in situazioni concrete modellate nello specifico micromondo, ma anche i condizioni simulate, che coinvolgono momenti e oggetti non accessibili alla percezione diretta. (iii) sono strutturate e risultano essere una integrazione della semantica modellistica. Infatti le "intensioni" della logica modellistica sono funzioni da espressioni linguistiche a entità del dominio, funzioni di cui non è specificata alcuna procedura associata. D'altra parte nella semantica modellistica sono "strutturate" le funzioni di verità (connettivi e quantificatori hanno specifiche procedure associate); se la semantica modellistica dà effettivamente condizioni di verità di enunciati complessi, la semantica procedurale può dare condizioni di verità effettive degli enunciati atomici.(iv) sono riducibili a combinazioni funzionali di primitivi percettivi (combinazioni che rappresentano le procedure fondamentali).

Insieme all' aspetto strettamente procedurale, troviamo due interpretazioni di questo tipo di semantiche che si possono definire in qualche modo due tipi di fallacia:

- la fallacia della rappresentazione dei processi mentali: presente chiaramente in Winograd 1973, dove si ritiene che la rappresentazione procedurale del significato corrisponda ai processi mentali che reggono la comprensione. Abbiamo già accennato ai limiti di questa interpretazione evidenziati dagli studi dei nuovi paradigmi emergenti.

- la fallacia della fuga, così chiamata da Wilks 1986, consiste nel pensare che in un linguaggio simbolico si possa uscire dal mondo dei simboli verso una qualche mondo non simbolico che dia ad essi significato. Se abbiamo una simulazione su macchina non usciamo dal modo dei simboli: il problema dell'aggancio al mondo o dei primitivi percettivi è un problema di robotica che non deve essere necessariamente affrontato da altri tipi di simulazione. L'aggiunta di terminali sensori a una macchina pensante non aggiunge nulla, in linea di principio, a ciò che si intende per "significato" dal punto di vista procedurale. Ma è possibile ripensare il modello procedurale di significato senza questa doppia fallacia? E in quale tipo di strategia di ricerca un tale modello ha senso?

 

3. Giochi linguistici e micromondi: per una teoria del significato.

Alcuni suggerimenti si trovano nelle riflessioni sul significato che Wittgenstein elaborò negli anni 40. E' vero che oggi Wittgenstein à soprattutto ricordato come "anticipatore" delle idee dei prototipi e di una visione del concetto stile "frame" (vedi Minsky, Rosch, Lakoff). Ma la strategia generale in cui colloca la sua analisi può essere chiarita e a sua volta aiutare a chiarire la visione procedurale del significato. La visione di Wittgenstein è in parte analoga a quella della prima IA degli anni 70, almeno nei due punti seguenti: (1) analizzare micromondi (giochi linguistici) per comprendere meglio il funzionamento del linguaggio (2) considerare il significato di una parola come il suo uso nel contesto: comprendere è saper usare una parola appropriatamente.

Nella strategia di Wittgenstein negli anni '40 vi è però qualcosa di più rispetto alla strategia dei micromondi degli anni '70, e cioè i giochi linguistici (esempi di micromondi) sono intesi sia come strumenti di analisi linguistica che come oggetto di analisi linguistica (i) nel primo caso le esigenze sono simili a quelle di Winograd: mondo e linguaggio sono sempre inestricabilmente uniti (al punto che diventa ridicolo parlare del rapporto del linguaggio con il mondo come se fossero due entità che si contrappongono). Per capire il funzionamento del nostro linguaggio occorre studiarlo in situazioni ristrette, facendo una specie di esperimento ideale (come in fisica) dove non si trovano tutte insieme le complessità dei vari aspetti del linguaggio. Restringendo il mondo si potrà vedere il funzionamento del linguaggio all'opera in un ristretto contesto e studiare con maggiore cura aspetti particolari del suo funzionamento. (ii) Nel secondo caso sembra che Wittgenstein consideri il linguaggio come un insieme interconnesso di giochi linguistici. Non è possibile dare una rappresentazione del funzionamento del linguaggio se non come una rappresentazione delle diverse modalità di funzionamento delle espressioni linguistiche in diversi contesti ristretti. Il linguaggio stesso non è solo un elenco di termini (la visione del linguaggio come nomenclatura criticato alle origini della linguistica scientifica da Saussure) o un insieme di regole di formazioni di frasi (la visione della linguistica moderna influenzata dagli sviluppi della logica), ma è strutturato come un insieme di diversi giochi linguistici, in cui linguaggio e azione sono intrinsecamente connessi. Comprendere il linguaggio è un tipo di attività che consiste nell'usare appropriatamente le parole a seconda dei contesti; dare una rappresentazione della comprensione è dare una rappresentazione di questo tipo di attività e della abilità o capacità a realizzarla (la competenza linguistica). Da questo punto di vista una descrizione completa del linguaggio è impossibile in linea di principio; ma dal punto di vista pratico si possono trovare ordini parziali, che mostrino come funziona la comprensione. Queste indicazioni del tutto programmatiche e generali devono essere integrate con alcune restrizioni:

1. significato-come-uso: l'idea che il significato delle espressioni linguistiche si riduce all'uso di esse nel contesto richiama l'idea che il significato è qualcosa di oggettivamente cotrollabile e condividibile: e l'identificazione del significato di una espressine con le procedure associate che ne determinano l'uso sembra essere una delle traduzioni migliori di questa idea. Ma questo comporta rivedere ciò che si intende per "significato" dal punto di vista del comprendere come una attività sociale e pubblica, che può prescindere dai processi mentali che la generano.

2. giochi linguistici: l'idea che il linguaggio è strutturalmente organizzato come un insieme di micromondi o contesti interconnessi (e sempre nuovi se ne possono inventare) pone il problema dello studio del funzionamento del linguaggio all'interno dei singoli micromondi (giochi linguistici) e delle regole che permettono di porre in relazioni tali mondi tra di loro. Non è una rete semantica universale che aiuterà a capire il funzionamento del linguaggio, ma una analisi sempre più ricca di diversi possibili contesti e delle relazioni inferenziali all'interno di ciascun contesto e tra diversi contesti.

 

 

4. Il contextual reasoning e il problema del significato -

Questi due tipi di restrizioni generali sembrano essere contemplate nei lavori sul Contextual reasoning che da alcuni anni si sono sviluppati a partire dai lavori seminali di McCarthy. McCarthy e i logicisti non hanno mai pensato di costruire modelli della mente, ma modelli formali delle capacità inferenziali di agenti razionali limitati e finiti. I contesti sono teorie parziali del mondo che codificano un insieme di conoscenza necessaria per affrontare un dato scopo. Normalmente sono considerati espressione di un punto di vista "soggettivo-individuale"(Giunchiglia 1993); ma questo non mi sembra che comporti necessariamente impegni di spiegazione dei processi mentali a livello psicologico e/o neurobiologico. Un tempo (con il primo Winograd ad es.) si sosteneva che l'IA potesse simulare la competenza di un singolo parlante (e i suoi peculiari processi mentali). Era una visione che rispecchiava alcuni aspetti della filosofia di Frege, che sembra a volte identificare il linguaggio con l'idioletto di un singolo parlante (per cui il significato di una espressione varia da parlante a parlante per la differenza di informazioni e descrizioni a essa associata). Potrebbe sembrare che i contesti rappresentino i diversi idioletti di diversi parlanti; ma questa mi sembra solo una approssimazione. I contesti possono essere considerati piuttosto "punti di vita" condivisibili da più parlanti, che per semplicità vengono attribuiti a singoli soggetti epistemici.

Se vogliamo seguire, sia pur vagamente, le restrizioni date al puto precedente, dobbiamo porre i due seguenti problemi: (1).- Il ragionamento su contesti è in qualche modo erede della strategia dei micromondi. Il lavoro nell'ambito del Contextual Reasoning è soprattutto svolto a livello di strategie inferenziali. Manca ancora, per così dire, la "carne", cioè l'analisi del significato delle espressioni del lessico; e qui forse la visione procedurale del significato potrebbe dare i suoi contributi. Il problema è elaborare una definizione di contesto sempre più ricca, senza per questo renderla necessariamente una simulazione psicologica. Ma l'analisi dei rapporti inferenziali tra enunciati in diversi contesti può essere la strada maestra per una definizione del lessico via postulati di significato. (2) - Il problema che si pone oggi è quella di una rappresentazione del funzionamento del linguaggio visto come insieme di diversi contesti: sembra impraticabile una risposta che tenda a definire il significato di una parola una specie di media delle informazioni ad esse connessa in diversi contesti. Più facilmente la strada consiste nel distinguere diversi gradi di generalità del significato di una espressione, a seconda dei contesti in cui la parola può essere usata. L'idea di procedura ancora una volta è proficua: il significato è la procedura che permette di attivare altre procedure per una sempre maggiore finezza della conoscenza del termine Conosci il significato di "oro" anche se non so distinguere una collana d'oro da una di ottone lucido, ma so che c'è differenza, e so che esistono gli esperti, ecc. Già Quine in Epistemology Naturalized parlava di "gradi" di appartenenza alla stessa comunità linguistica. Gradi di significato corrispondono a gradi di finezza nell'uso delle parole. Non è possibile un ordine definitivo del funzionamento del linguaggio, ma ordini rispetto a certi scopi renderanno necessario organizzare diversi gradi di comprensione e diverse assunzioni su enunciati che hanno a che fare con il linguaggio e che hanno a che fare con informazioni fattuali (la distinzione è vaga e dipende a sua volta dal contesto, a resta un requisito per ogni analisi linguistica). L'idea di un ordinamento parziale tra contesti pare un primo passo in questa direzione.

La morale di questo lavoro è la richiesta di distinguere ambiti di interesse per la IA teorica che la distinguano dall'esuberanza mentalistica delle scienze cognitive; è in fin dei conti un questione di diversi tipi di domande che si possono porre: dal punto di vista psicologico ci si chiederà come si formano certi concetti in vista di certi problemi, e quali processi portano alla elaborazione di tali concetti; da un punto di vista procedurale ci si domanderà che concetti sono necessari per risolvere un problema e come questi concetti si collegano ad altri.

 

A. Clark 1991 Microcognizione, Il Mulino, Bologna, 1994.

M. Dummett 1988 Alle origini della filosofia analitica, Il Mulino, Bologna, 1990.

F.Giunchiglia 1993 "Contextual reasoning" in Epistemologia 16 (145-158).

J.McCarthy 1993 "Notes on formalizing contexts" in IJCAI 1993.

D. Marconi 1993 "Comprensione e riferimento" in Epistemologia 16 (191-213).

C. Penco 1992 "Significato, uso e procedure" in Lingua e stile, (251-263).

P. Smolensky 1988 Il Connessionismo, Marietti, Genova, 1992.

Y.Wilks 1986 "Reference and its Role..." in Versus 44-45 (221-238).

T. Winograd 1972 Understanding Natural language, Academic Press, New York.

T. Winograd 1973 "A procedural Model ..." in Schank-Coldby (eds) Computer models of thought and language.

L. Wittgenstein 1953 Ricerche filosofiche, Einaudi, Torino, 1967.

W.A.Woods 1981 "Procedural semantics as a theory of meaning" in A.K.Joshi,B.L.Webber,

(eds.) Elements of Discourse Understanding, Cambridge U.P., Cambridge.