WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     | 1 |   ...   | 2 | 3 || 5 |

для получения правильного ответа. А является ли хотя бы одно из этих требований необходимым для получения правильного ответа Безусловно, нет. Дело в том, что правильный ответ можно вообще получить не с помощью алгоритма перевода, а, например, на основании разного рода разрозненных соображений ad hoc или даже на основании неосознанных интуитивных соображений. Если все же ответ достигается с помощью алгоритма, то, по-видимому, необходимо только соблюдение требования 1; прочие требования могут и не соблюдаться. Более того, существуют случаи, когда одновременное соблюдение всех четырех требований невозможно. Так, невозможно одновременно соблюсти требования 2 и 4, например, в задаче со следующими исходными данными:

Язык A Язык B 1. ты шел you went 2. ты шла you went Заметим, что, решая такую задачу, мы, разумеется, пожертвуем требованием 4, но не требованием 2.

Из всего сказанного вытекает следующая программа действий при решении задач рассматриваемого типа. Прежде всего, мы пытаемся построить частичный алгоритм перевода, удовлетворяющий всем четырем сформулированным выше требованиям. Если это удалось, мы переводим с его помощью контрольные фразы и считаем задачу решенной. Если это не удалось, мы стараемся проверить, не являются ли в данном случае требования 2 и несовместимыми. Если мы каким-либо образом убедились в том, что это действительно так, мы пытаемся построить частичный алгоритм перевода, удовлетворяющий хотя бы трем первым требованиям. В случае новой неудачи, по-видимому, можно и далее снимать поставленные вначале требования, однако наша уверенность в правильности ответа будет при этом каждый раз уменьшаться.

Во всех трех рассматриваемых ниже задачах имеет место оптимальный случай, то есть удается построить алгоритм, удовлетворяющий всем выдвинутым выше требованиям.

Решение задачи Ход решения излагается сокращенно.

Единицей перевода, как указано выше, в данной задаче должна служить морфема. Основной способ установления соответствия между морфемами обоих текстов состоит в сопоставлении арабских слов, русские переводы которых имеют одинаковое лексическое значение при разном грамматическом или наоборот, одинаковое грамматическое значение при разном лексическом.

В результате удается получить частичный алгоритм перевода с русского языка на арабский, удовлетворяющий всем основным требованиям (см. выше, стр. 27).

Приведем основные правила передачи грамматических значений, входящие в этот алгоритм (лексические соответствия мы опускаем, поскольку они очевидны).

В арабских словах, соответствующих русским существительным, выражаются: 1) падеж «именительный», т. е. падеж субъекта (показатель -u); «винительный», т. е. падеж прямого объекта (-a) или «родительный», т. е. падеж несогласованного определения (-i); последний выступает также после предлогов; 2) степень определенности (не выражается только в том случае, если слово имеет показатель обладателя или за ним следует определение в родительном падеже); различаются определенная форма (показатель s- перед s, s- перед s, l- в прочих случаях) и неопреде..

ленная форма (показатель -n, ставится после показателя падежа);

3) лицо и род (пол) обладателя (если таковой имеется): 1 л. -, 2 л. м. р. -ka, ж. р. -ki, 3 л. м. р. -hu, ж. р. -h; показатели обладателя ставятся после показателя падежа; при этом - «поглощает» показатель падежа. Кроме того, в состав словоформы могут входить элементы: li- (по функции соответствует английскому предлогу to), wa- «и» (соединяет однородные члены предложения), fa- «и» (соединяет предложения). Никакого выражения грамматической категории числа обнаружить не удается.

В арабских словах, соответствующих русским глаголам, выражаются: 1) время настояще-будущее или прошедшее; это различие выражается противопоставлением двух основ, имеющих одинаковый набор согласных, но разный набор гласных, например: dhaku, klu основы наст.-буд. времени, dahika, kla осно......

вы прошедшего времени ; 2) лицо и род (пол) субъекта: в наст.буд. времени 1 л. ’a-, 2 л. ta-, 3 л. ya-; в прош. времени 3 л. м. р.

нуль, ж. р. -t; 3) лицо и род (пол) объекта, если он имеется (выражается так же, как лицо и род обладателя у имени). Кроме того, в 21 Разделить словоформы типа tadhaku, klat на основу и показатель субъекта...

можно и другими способами, например ta-dhak-u, t-adhak-u, kl-at.

.....

состав словоформы могут входить элементы: ’a- «ли» (показатель вопроса), wa- «и», fa- «и» (см. выше).

Полученный алгоритм дает следующий перевод контрольных фраз:

1. kassat hihi linnyatu kissata safkatih fadahika smiuh.

..........

2. yalamu samruka, y saby, ’alfa kissatin wam yamliku dirha....

man.

Этот перевод действительно правилен с точки зрения арабского языка.

Решение задачи Эта задача может быть решена многими способами. Описанный ниже путь решения представляется нам одним из самых простых.

Как уже указано выше, эта задача, в отличие от задач 2 и 4, в принципе может быть решена с помощью алгоритма пословного перевода с B на A. Таким образом, здесь нет необходимости разбивать слова на морфемы (хотя это и нетрудно сделать).

Каждая пара переводящих друг друга фраз состоит из четырех слов. Обозначим эти слова по порядку в каждой паре: A I, A II, B I, B II.

Замечаем, что изменение B I, при неизменном B II (фразы 1 и 3, 2 и 5), отражается в языке A в виде изменения A II (при неизменном A I); c другой стороны, изменение B II, при неизменном B I (фразы 1 и 6, 4 и 5), отражается в виде изменения A I (при неизменном A II). Отсюда мы можем заключить, что слова фраз A и слова фраз B соответствуют друг другу (переводят друг друга) перекрестно: B I A II, B II A I.

Выпишем оба ряда соответствий (в направлении от B к A):

B I A II B II A I th (3) pinte zbwb (1, 3) miz tw (2) pinin hzbwb (6) yth (1, 6) pi zbwbym (2) miza ytw (4, 5) pin hzbwbym (4) mizat Эти ряды соответствий сами по себе можно рассматривать как частичный алгоритм перевода с B на A. Как нетрудно проверить, этот алгоритм удовлетворяет всем четырем основным требованиям (см. выше, стр. 27).

Применяем этот алгоритм к контрольным фразам:

1) th hzbwb miza pinte; 2) tw hzbwbym mizat pinin.

Полученные переводы действительно правильны с точки зрения взятых реальных языков.

Решение задачи 1. Внутренний анализ каждого из двух одноязычных текстов.

Каждая фраза языка A состоит из следующих четырех «мест».

I arrek, aek или нуль.

II urdea(k), labanak или нуль. Внутри этого «места» мы можем выделить два ряда морфем: IIa (основы) urdea-, labana-, нуль; IIб (окончания) -k, нуль III agindu(tzen) или billatu(tzen). И здесь легко выделить два ряда морфем: IIIa agindu-, billatu-, IIIб -tzen, нуль.

IV одно из 13 разных слов, начинающихся на de- или di-. Можно выделить следующие ряды: IVa de-, di-; IVб -zki-, нуль; IVв -o-, нуль; IVг нуль, -zu, -te, -zute, -tezu, -tezute (разбить ряд IVг на ряды нуль/zu и нуль/te нельзя из-за возможности разного порядка элементов zu и te).

Каждая фраза языка B состоит, вообще говоря, тоже из четырех «мест»: 1) ezt, ezeket или нуль; 2) одно из слов с основой igrили keres-; 3) нуль или одно из слов с основой nek-; 4) a serts(eke)t, a ks(eke)t или нуль (слово a явно не составляет самостоятельного «места»). Легко заметить, однако, что «места» 1 и 4 тесно связаны между собой, а именно, если одно из них занято, то другое свободно (представлено нулем), и наоборот; кроме того, слова, выступающие на этих местах, имеют формальное сходство они обнаруживают одно и то же противопоставление -t/-eket. Это позволяет нам рассматривать «места» 1 и 4 как единое «место».

Таким образом, мы выделяем во фразе языка B только три «места»:

I (= 1 и 4) ez(eke)t, a serts(eke)t или a ks(eke)t. Выделяются ряды: Ia ez-, a serts-, a ks-; Iб -t, -eket.

II одно из слов с основой на igr- или keres-. Выделяются ряды: IIa igr-, keres-; IIб -i, -ik, -ed, -itek, -te, -tk, -ted, -ttek. Восемь окончаний, выступающих в IIб, явно противопоставлены друг другу по трем бинарным признакам:

22 При анализе учитываются также контрольные фразы.

Тип i (нет согласных, Тип ed (есть согласная t кроме начального t и или d, кроме начальконечного k) ного t и конечного k) не оканчи- оканчи- не оканчи- оканчивается на k вается на k вается на k вается на k Не начинается с t -i -ik -ed -itek Начинается c t -te -tk -ted -ttek Можно предположить, что здесь в каждом окончании три морфемы: 1) t или нуль, 2) i или ed, 3) k или нуль, но при их соединении происходят изменения (ed + k дает itek; t + i дает в середине слова t, в конце слова te). Однако подтверждение этому мы получим лишь в том случае, если окажется, что каждая из этих морфем имеет самостоятельное отражение в языке A.

III нуль или одно из слов с основой nek-. Выделяются ряды:

IIIa нуль или nek-; IIIб (только для слов с nek-) -i, -ik, -ed, -tek.

Заметим, что полученные окончания явно сходны с первым рядом окончаний в IIб.

2. Сопоставление результатов раздельного анализа текстов.

Выписываем для каждого ряда морфем (Iа, Iб и т. д.) обоих языков распределение членов этого ряда по фразам, например:

B IIIа нуль (1, 2), nek- (остальные фразы). Сравниваем последовательно распределение членов в каждом ряде морфем языка B с распределением членов в рядах морфем языка A. (При рассмотрении рядов B IIб и IIIб учитываем также гипотезу о многоморфемном составе «окончаний».) Если мы обнаруживаем два ряда морфем (разных языков), имеющие одинаковое распределение членов, мы считаем, что эти ряды соответствуют друг другу, а входящие в них морфемы переводят друг друга. Например, для рассмотренного выше ряда B IIIа мы найдем соответствующий ему ряд A IVа с распределением: de- (1, 2), di- (остальные фразы). Отсюда правило перевода с B на A: нуль в B IIIа de- в A IVа, nekв B IIIа di- в A IVа.

Действуя таким способом, мы обнаруживаем следующие соответствия.

B Iа A IIа: ez- нуль, a serts- urdea-, a ks- labana-.

B Iб A IVб и A IIб: -eket -zki в A IVб и -k в A IIб (если только A IIа не нуль), -t нуль в A IVб и A IIб.

B IIа A IIIа: igr- agindu-, keres- billatu-.

B IIб имеет более сложные соответствия:

1) наличие или отсутствие начального t отражается в A IIIб:

есть t нет -tzen, нет t есть -tzen;

2) противопоставление типов i и ed и наличие или отсутствие конечного k отражается в A I: тип ed нуль, тип i не нуль, а именно: если есть конечное k aek, если нет конечного k arrek. Как отражается в языке A наличие или отсутствие k в окончаниях типа ed, остается пока неясным.

B IIIа A IVа: нуль de-, nek- di-.

B IIIб: противопоставление типов i и ed отражается в A IVв:

тип i o, тип ed нуль. Как отражается в языке A наличие или отсутствие конечного k, неясно.

Таким образом, на данном этапе решения остается невыясненным лишь то, как отражаются некоторые элементы рядов B IIб и B IIIб и что отражает ряд A IVг. Естественно искать связь между самими этими рядами. Такая связь действительно есть: чтобы в этом убедиться, достаточно сравнить, например, фразы 4 и 5.

Выпишем из каждой пары фраз представленные в этой паре члены рядов B IIб, B IIIб и A IVг. Например, для первой пары фраз получим тройку -ed, нуль, -zu, для шестой пары тройку -ttek, -ik, -tezute и т. д. Сравнивая эти тройки, замечаем следующие соответствия: 1) конечное k как члена B IIб, так и члена B IIIб отражается в A IVг в виде элемента te; 2) любой элемент типа ed (то есть -ed, -ite-, -te-, -te-) как члена B IIб, так и члена B IIIб отражается в A IVг в виде элемента zu. При этом элементы te и zu располагаются внутри члена A IVг в строго определенном порядке. Если обозначить через te2 и zu2 отражения элементов члена B IIб, а через te3 и zu3 отражения элементов члена B IIIб, то этот порядок можно записать так:

zu3 te3 zu2 te2.

Итак, мы можем теперь уточнить составленные выше правила соответствия следующим образом.

Член B IIб:

1) наличие или отсутствие начального t отражается в A IIIб (см.

выше);

2) противопоставление типов i и ed отражается в A I и A IVг:

тип ed нуль в A I и zu2 в A IVг, тип i не нуль (arrek или aek) в A I и отсутствие zu2 в A IVг;

3) наличие или отсутствие конечного k отражается в A I и A IVг: есть k aek (если не нуль, см. выше) в A I и te2 в A IVг, нет k arrek (если не нуль, см. выше) в A I и отсутствие te2 в A IVг.

Член B IIIб:

1) противопоставление типов i и ed отражается в A IVв и A IVг:

тип ed нуль в A IVв и zu3 в A IVг, тип i o в A IVв и отсутствие zu3 в A IVг;

2) наличие или отсутствие конечного k отражается в A IVг:

есть k te3, нет k отсутствие te3.

Теперь нам удалось найти в языке A отражение всех элементов фразы языка B; в то же время каждый элемент фразы языка A получил объяснение, т. е. мы выявили, что он отражает.

. Из наших наблюдений следует, что первоначальное деление члена A IV было неполным и не совсем точным. Теперь мы могли бы выделить в нем следующие ряды морфем: 1) de-, di-, 2) zki, нуль, 3) zu3, o, нуль, 4) te3, нуль, 5) zu2, нуль, 6) te2, нуль.

Ряд 1 отражает B IIIа, 2 B Iб, 3 и 4 B IIIб, 5 и 6 B IIб.

Сформулированные выше правила соответствия можно рассматривать как частичный алгоритм перевода с B на A (в алгоритм должна также быть включена формула расположения элементов внутри A IVг). Этот алгоритм, как показывает проверка, удовлетворяет всем четырем основным требованиям (см. выше, стр. 27).

Применяя этот алгоритм к контрольным фразам, получаем следующие переводы:

1. Arrek labana agindutzen dio.

2. Urdeak billatutzen dizkiotezu.

3. Aek agindu dizute.

Полученные переводы действительно правильны с точки зрения взятых реальных языков.

РЕШЕНИЯ ЗАДАЧ НА ВНУТРЕННЮЮ РЕКОНСТРУКЦИЮ. 1. В приводимых ниже решениях сокращение записи и обобщение формул произведено не везде, где это возможно, а только там, где это действительно упрощает запись. В некоторых случаях (см., например, формулу 3 в решении задачи 5) обобщение сделано не по форме, описанной на стр. 18, а выражается только в том, что обобщаемые формулы получают единый номер. Во всех таких случаях имеется в виду тип обобщения A B, где в качестве значений A выступают левые части формул, а в качестве значений B правые.

2. В большинстве решений в исходный алфавит вводятся дополнительные буквы. Разумеется, в качестве таковых могут быть использованы, вообще говоря, любые знаки. Выбор дополнительных букв в наших решениях определяется фонетическими ассоциациями. Выбор знака H в решении задачи 7 соответствует современной практике сравнительного языкознания (Ф. де Соссюр использовал в своей работе знак A).

Решение задачи «Первообразная» система словоформ В исходный алфавит, помимо букв, встречающихся в заданной системе словоформ, включаем букву i2.

: sk-, nk-, jauk-, nes-, vrs-, met-, jaut-, cep-, kp-.

: инфинитив -t; наст. время -u, -i2, нуль; прош.

время -u, -i, -a.

: -j-. Он используется в наст. времени глаголов jaukt, vrst, jaust, kpt и в прош. времени глаголов nkt, jaukt.

Цепь формул перехода 1. j(+i2) нуль 4. tt st 2. k(+i2) c 5. i2 нуль 3. kj c sj tj Решение задачи «Первообразная» система словоформ В исходный алфавит, помимо букв, встречающихся в заданной системе словоформ, включаем букву j2. Буквы a,, e, i считаются гласными, все прочие согласными. В формулах C обозначает любую согласную.

: y-, ved-, rj2-, bhaj-, vac-, va-, dves-.

.

(ставятся после корня): 1 л. -m-, 2 л. -s-, 3 л. -t-.

: наст. время -i (ставится после показателя лица), прош. время a- (ставится перед корнем).

Цепь формул перехода s 1. A + B, 3. s(+#) h.

t 4. ks где A: соответственно, B:

ks.

ts.

d t tt st...

c или j k 5. j2 j, s или j2 t..

s 2. (C+) (+#) нуль t (C+) m (+#) am Решение задачи «Первообразная» система словоформ В исходный алфавит, помимо букв, встречающихся в заданной системе словоформ, включаем буквы H и r. Буквы a,, i,, u,, r, r, e, o считаются гласными, все прочие согласными. В формулах V обозначает любую гласную, а C, C1, C2 любые согласные.

: yuj-, bhid-, vrj-; puH-, ksiH-, strH-; ru-, ji-, bhr-; bhuH-,.

niH-, trH-.

:

. :

Первый способ (первые шесть глаголов) в 3 л. ед. ч. инфикс -n-, вставляемый перед последней буквой корня, и суффикс (окончание) -ti; в 3 л. мн. ч. инфикс -n-, вставляемый перед последней буквой корня, и суффикс (окончание) -nti;

Второй способ (вторые шесть глаголов) в 3 л. ед. ч. суффикс (окончание) -ati, в 3 л. мн. ч. суффикс (окончание) -anti; ударение в обеих формах на корне.

:

Первый способ (все глаголы, кроме четырех, см. ниже) суффикс -t;

Второй способ (глаголы с корнями bhid-, ksiH-, strH-, trH-).

суффикс -n.

: суффикс -tum, ударение на корне.

Pages:     | 1 |   ...   | 2 | 3 || 5 |






















© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.