2018 год
Языки проекта (кетский, селькупский, хантыйский, телеутский, чулымско-тюркский) находятся в разной степени изученности с позиции типологии порядка слов и информационной структуры предложения. Тем не менее, ни по одному языку нет детального описания проблематики по заявленной теме проекта. Согласно запланированным работам и в соответствии с целью проекта в 2018 году были проведены корпусные исследования по языкам с целью выявления тенденций развития базовых синтаксических конструкций в условиях языкового сдвига.
Для корпусных исследований по каждому из языков проекта были отобраны тексты для проведения сопоставления в диахронической перспективе. Языковой материал относится к двум синхронным срезам: первый срез – тексты, записанные в XX веке, второй – материалы, относящиеся к XXI веку. Разница по времени сбора языкового материала на этих двух срезах в каждом языке составляет не менее 40 лет.
Все языки проекта относятся к бесписьменным языкам, даже при условии наличия официальной орфографии, букварей и других печатных источников, письменными их можно назвать весьма условно, так как сами носители языков не используют свои языки в письменном дискурсе. Это накладывает ряд сложностей c выделением отдельных сегментов (клауз) при работе с языковым материалом для проведения исследования.
В текстах, записанных в XX веке, во всех языках проекта базовый порядок слов SOV и OV доминирует, он встречается в два раза чаще, чем остальные. Материалы по языкам проекта, которые были собраны в XXI веке, указывают на изменение структуры простого предложения в языках проекта под влиянием интерференции со стороны русского языка: происходит замена базовой структуры SOV / OV на порядок следования элементов SVO / VO. Следует отметить, что, с одной стороны, развитие синтаксических конструкций идет в сторону упрощения структуры простого предложения в целом, а именно увеличилось употребление двусоставных и односоставных предложений, в том числе именных, не осложненных второстепенными членами предложения. С другой стороны, все чаще встречаются предложения с эксплицитным подлежащим, что противоречит принципу языковой экономии, в тех случаях, когда это не обусловлено прагматическими, коммуникативными или другими факторами. Однако, это оправдано в тех случаях, когда морфология глагольной словоформы в языке упрощается и показатели, указывающие на субъект действия носителями языка в речи опускаются. Повсеместно в языках наблюдается упрощение морфологической структуры самого глагольного предиката: нейтрализуются различные виды спряжения.
Структура простого предложения во многом зависит от жанровой принадлежности изучаемых текстов. Впервые был исследован синтаксис в таком жанре как загадки на материале кетского языка и в жанре частушки на материале селькупского языка. Синтаксическая структура кетских загадок отличается однотипностью. Базовый порядок слов SOV сохраняется во всех загадках, инверсия предиката и его основных актантов не допускается. В селькупских частушках встречаются практически все возможные порядки следования предиката и его основных актантов: SOV / OV, SVO / VO, OVS, OSV, SV, VS, причем невозможно выделить, какая модель доминирует. Такое разнообразие обусловлено не только влиянием русского языка, но и условием соблюдения ритмического рисунка частушки.
From the standpoint of the word order typology and the information structure, the project languages (Ket, Selkup, Khanty, Teleut, and Chulym-Turkic) have been currently studied to varying degrees. Still, to date, none of the languages has a detailed description of word order and information structure, which is stated as the project’s main topic. According to the work planned and in accordance with the project goal in 2018, we conducted corpora studies on the languages in order to identify trends in the development of basic syntactic structures in the context of language shift.
For the corpora studies, we selected a range of texts in order to compare them in a diachronic perspective in each of the project languages. The selected language data refer to two synchronic periods: to the first period belong texts recorded in the 20th century, to the second one — materials related to the 21st century. The time difference between these two periods in the language data of each project language is at least 40 years.
All the project languages can be said to belong to unwritten languages. Although they have official orthographies as well as primers and other printed materials, one can hardly regard these languages as written ones, since native speakers themselves do not use them in written discourse. This complicates defining individual segments (clauses) in the data selection for the study.
In the texts recorded in the 20th century, in the languages under study, the dominating basic word order is SOV and OV, as it is found twice as often compared to the other word orders. The language data that were collected in the 21st century indicate the project languages undergo a change in the structure of a simple sentence under the influence of the Russian language: the SOV / OV basic structure is being replaced by the SVO / VO order of elements. It should be noted that, on the one hand, the development of syntactic structures goes towards simplifying the simple sentence structure as a whole, namely, the use of two-part and one-part sentences has increased, including nominal ones not expanded by secondary sentence parts. On the other hand, sentences with an explicit subject have become increasingly common in cases where this is not due to pragmatic, communicative or other factors, which contradicts the principle of language economy. However, this can be justified in cases where the morphology of a verb word form in a language has become simplified and the verbal markers indicating subject are omitted in speech by native speakers. In general, one can observe simplification of the morphological structure of the verbal predicate in the project languages: various types of conjugations have become neutralized.
The structure of a simple sentence also greatly depends on the genre of texts under study. For the first time, we studied syntax in such folklore genres as riddles (on the material of the Ket language) and chastushki (on the material of the Selkup language). The syntactic structure of the Ket riddles is rather uniform. The basic SOV word order is preserved in all of the riddles in our corpus, the inversion of the predicate and its main actants is not allowed. In the Selkup chastushki, there are almost every possible order of the predicate and its main actants: SOV / OV, SVO / VO, OVS, OSV, SV, VS, and it is impossible to identify which word order dominates. Such a diversity can be attributed not only to the influence of the Russian language, but also to fullfilling the condition of compliance with the rhythmic pattern of the chastushka.
2019 год
Исследование типологии порядка слов в языках проекта (кетском, селькупском, хантыйском, телеутском, чулымско-тюркскогом) проводилось комплексно с помощью современного инструментария корпусной лингвистики. С одной стороны, пополнялись уже созданные корпуса текстов с поморфемной аннотацией по языкам проекта, с другой стороны, сами корпуса служили базой для экспериментальных исследований.
Сравнительное исследование порядка слов в простом предложении проводилось как минимум на двух временных срезах с разницей 30-60 лет. Порядок следования элементов SOV/OV встречается чаще в 2 раза (и более) чем SVO/VO в материалах, собранных в XX веке (первый временной срез) в кетском, селькупском, хантыйском и телеутском языках. Исключение на данном срезе (середина XX века) представляют данные случайной выборки в нижнечулымском диалекте (чулымско-тюркский язык), однако другие более ранние опубликованные тексты обнаруживают стабильную частотность порядка SOV/OV.
По проведенному анализу материалов собственных экспедиционных исследований, собранных участниками проекта в XXI веке, на данном этапе можно сделать вывод о том, что установилась тенденция превалирования частотности употребления современными носителями языков (кетского, селькупского, хантыйского, телеутского, чулымско-тюркского) клауз с последовательностью SVO/VO. Это, с одной стороны, может быть связано с тем, что базовый порядок слов подвергается изменению под воздействием факторов, связанных с информационной структурой предложения. С другой стороны, порядок слов легко поддается влиянию доминирующего языка при определенных условиях в сложившейся социолингвистической ситуации.
Окончательные выводы о том, в какой степени отклонение от базового порядка слов SOV в языках проекта зависит от влияния факторов актуального членения предложения, будет определено по результатам анализа звучащей речи с помощью программы Praat на следующем этапе реализации проекта.
Описание информационной структуры языков обско-енисейского языкового ареала является одной из наиболее слабо разработанных разделов частного языкознания. Следует отметить, что информационная структура простого предложения тюркских языков проекта (телеутского и чулымско-тюркского) исследуется впервые. По другим языкам проекта (кетскому, восточно-хантыйскому и селькупскому) существует небольшое количество работ, сделанных с позиции коммуникативного синтаксиса и актуального членения предложения.
Для всех языков проекта характерно использование сходного инвентаря языковых средств актуализации информационной структуры простого предложения, а именно – использование маркированного порядка слов (отклонение от базового порядка SOV), просодические характеристики и лексико-грамматические средства.
Что касается просодических характеристик клаузы, то известно, что наличие в ней акцентного пика коррелирует с особым прагматическим статусом, неким выдающимся характером информации, т. е. фокусом. Одной из задач на завершающем этапе проекта будет характеристика взаимосвязи между просодическими параметрами, с одной стороны, и прагматическими функциями элементов предложения (в частности, фокуса), с другой стороны.
Comprehensive study of the typology of word order based on the project languages (Ket, Selkup, Khanty, Teleut, Chulym-Turkic) was carried out with the help of modern corpus linguistics tools. On the one hand, the already existing text corpora of the languages were further supplemented with morphological annotation, on the other hand, the corpora themselves served as the basis for experimental research.
The comparative study of the word order in a simple sentence involved at least two time periods with the difference of 30-60 years between them. The study has shown that in the Ket, Selkup, Khanty and Teleut materials collected in the 20th century (which is the first time period), the SOV / OV order of constituents is found twice more often than the SVO / VO order. The only exception is represented by the mid-20th century data from a random text sample in the Lower Chulym dialect (Chulym-Turkic). However, the earlier published texts from this dialect show a predominance of the SOV / OV order as well.
Based on the analysis of the 21st century data (the second time period) collected by the project participants during fieldwork, it is possible to conclude that there is a prevailing tendency among the modern native speakers of the project languages (Ket, Selkup, Khanty, Teleut, an Chulym-Turkic) to use the SVO / VO order in simple clauses. On the one hand, this may be due to the fact that the basic word order is subject to change under the influence of factors related to the information structure. On the other hand, under certain conditions, the word order is prone to be influenced by the dominant language, especially, in a sociolinguistic situation, when the dominant language prevails in all spheres of communication.
Final conclusions about the extent to which various deviations from the basic SOV word order in the project languages are influenced by factors related to the information structure of the sentence are to be made at the next stage of the project, after getting the results of a speech analysis using the Praat program.
Information structure in the languages spoken in the Ob-Yenisei language area is one of the most underdescribed parts of their grammars. Moreover, with regard to the Turkic languages of the project (Teleut and Chulym-Turkic), it is the first time they are to receive any description of information structure of the simple sentence. For the other languages of the project (Ket, East Khanty and Selkup) there exist only a small number of works done from the perspective of communicative syntax and actual division of the sentence.
All languages studied within the project are characterized by the use of a similar inventory of language means for encoding the information structure of a simple sentence, including the use of a marked word order (deviation from the basic SOV order), prosody, various lexical and grammatical means.
As for the prosodic characteristics of the clause, it is known that the presence of an accent peak in it correlates with a special pragmatic status, a prominent piece of information, i.e., the so-called “focus”. One of the tasks during the final stage of the project will be to characterize relations between prosodic parameters, on the one hand, and the pragmatic functions of clause elements (in particular, focus), on the other hand.
2020 год
Исследование типологии порядка слов в языках проекта (кетском, селькупском, хантыйском, телеутском, чулымско-тюркском) проводилось комплексно с помощью современного инструментария корпусной лингвистики. С одной стороны, пополнялись уже созданные корпуса текстов с поморфемной аннотацией по языкам проекта, с другой стороны, сами корпуса служили базой для экспериментальных исследований.
В рамках данного исследования все языки проекта рассматриваются как бесписьменные, этот факт имеет прямое значение для проекта, посвященного описанию аргументной и информационной структуры простого предложения, т. к. вносит определенную специфику в процесс выделения отдельных синтаксических сегментов в данных устной речи. Для графических записей полевых архивов ориентирами для определения синтаксических сегментов послужили пунктуационные маркеры в оригинальных источниках, расставленные исследователями, зафиксировавшими тексты. В материалах, записанных в мультимедийных форматах, границы синтагм были установлены как правило на основе определения интонационных единиц, по паузам между синтагмами, завершенным интонационным контурам, фразовым ударениям, изменениям темпа.
Сравнительное исследование порядка слов в простом предложении проводилось как минимум на двух временных срезах с разницей 30-60 лет. По проведенному анализу материалов собственных экспедиционных исследований, собранных участниками проекта в XXI веке, на данном этапе можно сделать вывод о том, что установилась тенденция превалирования частотности употребления современными носителями языков (кетского, селькупского, хантыйского, телеутского, чулымско-тюркского) клауз с последовательностью SVO/VO. Это, с одной стороны, может быть связано с тем, что базовый порядок слов подвергается изменению под воздействием факторов, связанных с информационной структурой предложения. С другой стороны, порядок слов легко поддается влиянию доминирующего языка при определенных условиях в сложившейся социолингвистической ситуации.
Следует отметить, что, с одной стороны, развитие синтаксических конструкций в исследуемых языках происходит в сторону упрощения структуры простого предложения в целом; все чаще встречаются предложения с эксплицитным подлежащим в тех случаях, когда это не обусловлено прагматическими, коммуникативными или другими факторами. Тем не менее, это оправдано в тех случаях, когда морфология глагольной словоформы в языке упрощается и показатели, указывающие на субъект действия, носителями языка в речи опускаются.
Данное исследование проводилось с помощью современного инструментария корпусной лингвистики, но тем не менее на материале ограниченного объема и репрезентативности. За рамками задач проекта остался анализ типологии порядка слов и информационной структуры простого предложения в контексте жанрового разнообразия текстов. Этот аспект рассматривается в качестве дальнейшей перспективы исследования в области коммуникативного синтаксиса на материале языков Обско-енисейского ареала.
Comprehensive study of the typology of word order based on the project languages (Ket, Selkup, Khanty, Teleut, Chulym-Turkic) was carried out with the help of modern corpus linguistics tools. On the one hand, the already existing text corpora of the languages were further supplemented with morphological annotation, on the other hand, the corpora themselves served as the basis for experimental research.
The unwritten nature of these languages affects the description of the argument and information structure of simple sentences and the selection of pragmatically significant elements in them.
In written field materials, punctuation marks are treated as reference points; in oral materials, we focused on the prosodic characteristics of texts – intonation, pauses, phrasal stress, and speech rate.
Based on the analysis of the 21st century data collected by the project participants during fieldwork, it’s possible to conclude that there is a prevailing tendency among the modern native speakers of the project languages (Ket, Selkup, Khanty, Teleut, Chulym) to use the SVO / VO order in simple clauses. On the one hand, this may be due to the fact that the basic word order is subject to change under the influence of factors related to the information structure. On the other hand, under certain conditions, the word order is prone to be influenced by the dominant language, especially, in the current sociolinguistic situation.
There is a simplification of the structure of simple sentences in the languages of the project as a whole; in particular, sentences with an explicit subject are encountered with increasing frequency, but not due to pragmatic, communicative, or other factors.
The cause of this may be the simplification of the verb morphology and the reduction of indicators of the subject of an action.
This study was based on limited material from corpora of each of the languages.
Further research on the information structure of simple sentences in the languages of the Ob-Yenisei area will additionally involve taking into account the genre and stilistic features of texts.