En av menneskets mest bemerkelsesverdige egenskaper er evnen til kompleks språkbruk – et kraftfullt verktøy for å uttrykke tanker med stor rikdom og nyanse. Mennesker i alle kulturer bruker flere timer daglig på å snakke, ofte med imponerende letthet og flyt. Forskning viser at vi produserer rundt 1200 ytringer hver dag, med en hastighet på minst 10 talelyder per sekund, organisert i ord og meningsbærende morfemer. Samtaleanalyser viser at talere ofte ikke trenger mer enn 200 millisekunder for å planera en setning i en konversasjon, der titals meningskomponenter kombineres til sammenhengende ytringer. Et sentralt mål innen lingvistikken er å forklare hvordan talere kan produsere og forstå strukturer med slik kompleksitet og hastighet. Dette krever eksplisitte modeller av det mentale leksikonet – de lagrede byggeklossene i språket – og den interne grammatikken som kombinerer leksikale eninger, samt modeller av hvordan hjernen anvender denne grammatikken i sanntid. Et annet mål er å forklare mangfoldet av grammatikker i verdens språk: Selv om måtene elementer kombineres på varierer sterkt, er variasjonen likevel begrenset.
ExSynOp-prosjektet fokuserte på ett aspekt av grammatikk: ordstilling. Innenfor et gitt språk er ordstilling vanligvis overraskende rigid. Setningen "I dag har jeg allerede drukket ni kopper kaffe" inneholder for eksempel ni ord, som teoretisk kan arrangeres på 362 880 måter. Selv om noen alternativer kan uttrykke lignende betydninger, vil de fleste permutasjoner føre til avvikende tolkninger eller ugrammatiske setninger. Samtidig bærer ordstillingen i seg selv lite informasjonslast, og lyttere kan ofte forstå ikke-standard ordstilling ved hjelp av kontekst. Likevel opprettholder språk sterke preferanser for bestemte koblinger mellom mening og lineær rekkefølge. Målet i ExSynOp var å forstå hvorfor: Hva driver fremveksten av strikte ordstillingsmønstre?
Vi nærmet oss spørsmålet ved å undersøke tilfeller der ordstillingen er variabel – altså der to elementer kan forekomme i begge rekkefølger – i kontrast til minimalt forskjellige kontekster der ordstillingen er fast. Ideelt sett undersøkte vi konstruksjoner i nært beslektede språk, som svensk og norsk, der ett språk har variasjon og det andre ikke. Svensk tillater for eksempel både «Igår tvättade bakaren sig» og «Igår tvättade sig bakaren», mens norsk krever at subjektet står før det refleksive pronomenet (ikke "*i går vasket seg bakeren"). Vi undersøkte også konstruksjonspar innen ett enkelt språk, som f.eks. norsk partikkelplassering, der objekt–partikkel-rekkefølgen kan variere («Han kastet ut hunden» / «Han kastet hunden ut»), i kontrast til subjekt–partikkel-rekkefølgen, som er fast («I går sprang hunden ut», ikke *«I går sprang ut hunden»).
Når slike par var identifisert, undersøkte vi deres tilegnelse, prosessering og mønster i korpuser, og stilte følgende spørsmål: Gjør strikt ordstilling tilegnelse enklere? Fremmer fast ordstilling produksjon? Vi fant at talere kan utnytte variabel ordstilling for å få ordstillingen å bedre passe med større prosodiske eller semantiske preferenser. Likevel er kontekster der slik fleksibilitet er reelt brukbar sjeldne, og språk tilbyr ofte andre, fullt grammatikaliserte strategier for informasjonsstrukturering. Dette tyder på at den funksjonelle nytten av valgfrihet er begrenset og neppe kan forklare hvorfor den oppstår. Samtidig finner vi ingen tegn til at valgfrihet er kostbar for produksjonssystemet.
I førstespråkstilegnelse finner vi ingen tendenser for regularisering av variable ordstillinger, uten i stedet det motsatte: barn produserer variasjon der voksne viser strikte mønster. Barn reduserer gradvis den variasjonen over tid, og enkelte fall av inkorrekt variasjon vedvarer inn i ungdomstiden. Dette står i sterk kontrast til voksnes andrespråkstilegnelse, der andrespråksinnlærere unngår variasjon og følger én rekkefølge. Dette kan enten være for å unngå feil eller men våre funn viser også at det kan være en følge av overføring førstespråket: L2-talere som har førstespråk med variabel ordstilling, viser mer variasjon i L2.
Utvikling av strikt ordstilling skyldes derfor neppe alene prosesseringsbegrensninger eller barns tilegnelsesbiaser. Det er heller ikke sannsynlig – om enn mulig – at L2-tilegnelse i stor grad påvirker lavfrekvente ordstillingsmønstre. Vi ser at frekvens påvirker hastigheten for innlæring av strikte ordstillingsmønster.
Hyppig førekommende ordstillingspar tilegnes tidlig, mens sjeldnere kombinasjoner stabiliseres senere. Det er høgst sannsynlig at analogi spiller in stor rolle i innlæringen lav-frekvente mønster både i L2 og L1 utvikling: L2-innlærere kan anta fast ordstilling der lignende strukturer er faste i L1, og L1-innlærere kan slutte seg til et strikt mønster i lavfrekvente konstruksjoner utefra variasjonsmønster i mer frekvent forekommende konstruksjoner.
In the project, we gained extensive insight into the limitations of current tools for speech analysis, particularly regarding the precise measurement of speech onset and offset—measures that are crucial for psycholinguistic studies of speech production. We explored available options and developed pipelines for semi-automatic analysis that increased accuracy and reduced analysis time. Scripts for analysis will be made available through personal GitHub repositories. We are also collaborating with other linguistics departments in Norway on the development of tools for speech analysis, ranging from automatic transcription to manual correction and export of variables (in collaboration with Kristiansand, Oslo and Trondheim).
We also pushed the limits of experimental work on variation, particularly dialect variation, applying both psycholinguistic and neurolinguistic methods to study current variation and ongoing language change. This line of research will be further pursued in Jade Jørgen Sandstedt’s (postdoc) recently funded RCN project on neurocognitive signals in dialect processing.
Finally, our results provide new insights into the role of child and adult learners in the process of language regularisation. Whereas previous studies have attributed a central role to L1 learners in regularisation, our findings suggest quite the opposite: the emergence of strict patterns takes place late in language acquisition.
The natural languages of the world are characterized by largely rigid, often highly idiosyncratic rule systems. Within any given language, it is hard to find instances of true optionality (i.e. a many-to-one mapping from form to meaning). The ExSynOp project sets out to explore this central puzzle: what drives the evolution of complex, rigid rule systems in natural languages? We do this by investigating the sources of regularisation, i.e., the reduction of variation in a language. Our focus on regularisation will bring new insights to one of the most debated issues in linguistics: are languages shaped predominantly by the usage patterns of adults (evident in processing, register/style choices, MacDonald 2013, Bybee 2015), or the learning preferences/limitations of children (Clark 1987, Newport 2005, Yang 2017, Chomsky 1986)?
This project takes as its starting point a unique naturally-occurring case study in (apparent) optionality: word order variation in the closely related Mainland Scandinavian languages and varieties. We have identified four word order variables where at least one variety shows optionality, and another a strict rule: subject shift, particle shift, object shift and long object shift. By studying acquisition (L1 child and L2 adult), and processing (production/comprehension) of variable and non-variable grammars in the context of closely related languages, we can identify where preferences for regular systems arise. We will address three fundamental issues in the establishment of rigid grammars: (1) are there processing benefits (or costs) associated with categorical rules; (2) is the L1 language learner pre-disposed to categorical rules, or do categorical tendencies develop later and (3) is low-frequent syntactic variation in speakers conditioned by register/dialect? To address these issues, we will use novel large-scale experiments for speech elicitations, combined with methods for text-speech alignment, which will be developed within the project.