Natural and artificial language acquisition and processing
Project information
Abstract: 

The issue of abstract representations in the domains of language acquisition and adult language processing is addressed in this project. Is it possible to learn a subdomain of language without prior linguistic knowledge in this domain? Can one achieve the final learning stage (adult performance) without developing abstract representations ? A new methodology will be used to study these questions. The research will explicitly combine the techniques that are used in three separate disciplines: language acquisition research, psycholinguistics, and artificial intelligence. Whereas the former two take the real language learner/user as their object of study, the latter one studies the artificial language learner/user. Thus far artificial learning models have always been used to simulate effects observed in actual language use. Whereas simulation reveals the computational power of the learning system and suggests interesting hypotheses on the real language learner/user, it does not falsify hypotheses generated in, for instance, psycholinguistic work. In our research we want to use artificial language learners/users in a radically different way. Apart from having them simulate effects from real language use we want to isolate factors that affect the model's behaviour and then study the effects of these same factors in psycholinguistic experiments and in language acquisition data. In case of a different outcome, the effects observed in real language users can then be used to adapt the architecture of the artificial learning model and see whether its performance can eventually be matched to that of the language user. This method of relating the results from acquisition and psycholinguistic research to computational work and vice versa is essentially a heuristic for discovering properties of the representational architecture for language in the real language learner/user.

This basic issue, and the methodology to study it, will be approached in two linguistic domains: phonology and inflectional morphology. In phonology, the linguistic representation of stress patterns, phonotactic restrictions, and syllable structure will be studied. In morphology, irregularity effects in the past tense formation in Dutch will be used to study the issue of the single-route versus dual-route architecture (i.e., rules for regular forms, a lexicon for the irregular ones). A study of the factors causing interference errors in the spelling of (highly regular) past tense forms in Dutch (regular forms affecting other regulars) will shed light on the issue.

 

Abstract Dutch: 

Zijn taalverwerving en (volwassen) taalgebruik mogelijk zonder aanname van abstracte linguïstische representaties? Deze vraag wordt bestudeerd aan de hand van een nieuwe methodologie: technieken uit drie verschillende disciplines worden gebruikt, nl. het taalverwervingsonderzoek, de psycholinguïstiek en de artificiële intelligentie. De eerste twee disciplines bestuderen de reële taalleerder/-gebruiker, terwijl de laatste de artificiële taalleerder/-gebruiker bestudeert. In het verleden werden artificiële leermodellen gebruikt om effecten te simuleren die in het reële taalgebruik werden geobserveerd. Hoewel simulaties de computationele kracht van het leersysteem demonstreren en interessante hypothesen suggereren omtrent de eigenlijke taalgebruiker, werden ze nooit gebruikt om hypothesen te falsifiëren uit (ontwikkelings)psycholinguïstische studies. In het voorgestelde project willen we artificiële taalleerders/-gebruikers niet enkel inzetten om het reële taalgebruik te simuleren maar tevens om factoren te isoleren die het gedrag van het model beïnvloeden en vervolgens de effecten van diezelfde factoren te bestuderen in psycholinguïstische experimenten en in taalverwervingsonderzoek. Als de effecten bij de artificiële leerder/gebruiker verschillen van die bij de reële leerder/gebruiker, kan het leermodel worden aangepast om uiteindelijk zijn gedrag in overeenstemming te brengen met dat van de taalgebruiker. Deze methode waarbij de resultaten omtrent taalverwerving en psycholinguïstiek worden gerelateerd aan computationeel werk en omgekeerd is dus een heuristiek om eigenschappen te ontdekken van de representatie van taal in de reële taalleerder/-gebruiker.

De centrale vraag en de methodologie om ze te bestuderen komen in twee linguïstische domeinen aan bod: de fonologie en de inflectionele morfologie. In de fonologie zullen de linguïstische representatie van klemtoonpatronen, fonotactische restricties en syllabestructuren onderzocht worden. In de morfologie zullen irregulariteitseffecten in de vorming van de Nederlandse verleden tijd gebruikt worden om het zg. enkelkanaal verwerkingsmodel ('single-route model') af te zetten tegen het dubbelkanaalmodel ('dual-route model'). Onderzoek naar de factoren die interferentiefouten veroorzaken in de spelling van de verleden tijd van (strikt regelmatige) Nederlandse werkwoorden zal ook licht werpen op deze problematiek.

 

Project Leader(s): 
Walter Daelemans
Steven Gillis
Georges De Schutter
Period: 
01/07/1998 - 31/12/2003
Sponsor(s): 

BOF Onderzoeksfonds, Geconcerteerde Onderzoeksactie (Vlaamse Gemeenschap, Gemeenschappelijke Onderzoeksraad UA)

Syndicate content