?

Log in

No account? Create an account

Прошлый пост | Следующий пост

Понимаю, что сейчас в комментарии может набежать комментаторов не по делу но, как айтишник, не могу не поднять вопрос. Кто-нибудь из специалистов по системам компьютерного перевода может пояснить, почему переводчик Google так странно переводит фразы про самолёт Путина и Украину?

Самолёт Путина входил или не входил в воздушное пространство Украины

Я правильно понимаю, что Google использует некие контекстные технологии, и берёт какие-то выборки "наиболее распространённых фраз" из интернета, для более точного перевода? Какой именно механизм приводит к тому, что "не" полностью игнорируется в одних предложениях, и не игнорируется в других? Судя по тому, как переводится текст, популярные фамилии система знает и учитывает, но у одних "не" учитывается, а у других нет.

Собственно, увидел такие скриншоты в комментариях к одному из политических постов, решил сам проверить, под катом результат.

P.S. Обратите внимание на вариант с Меркель.


1.
Самолёт Путина входил или не входил в воздушное пространство Украины

2.
Самолёт Путина входил или не входил в воздушное пространство Украины

3.
Самолёт Путина входил или не входил в воздушное пространство Украины

4.
Самолёт Путина входил или не входил в воздушное пространство Украины

5.
Самолёт Путина входил или не входил в воздушное пространство Украины

6.
Самолёт Путина входил или не входил в воздушное пространство Украины

Проверил себя, любимого, и результат совсем эпичный. Я понимаю, что новости последних месяцев всё чаще не про Васильева, а про Васильеву... но нельзя же так.

7.
Самолёт Путина входил или не входил в воздушное пространство Украины

А вот вариант перевода по версии Яндекса:

8.
Самолёт Путина входил или не входил в воздушное пространство Украины

Ну и опрос, чтобы два раза не вставать:

Опрос #1975947 Почему такой странный перевод у Google

Ваша версия?

Это просто частная техническая ошибка
3(5.5%)
Это особенность современных систем компьютерного перевода
4(7.3%)
Это заговор против России и Путина
14(25.5%)
Это 3.14$#ец
22(40.0%)
Это неведомое
9(16.4%)
Другое
3(5.5%)





Проверить можно тут: translate.google.com

Другие мои посты по тегу #хайтек:

Comments

( 28 комментариев — Оставить комментарий )
global_avantur
21 июл, 2014 18:22 (UTC)
Ха!
Такие "странности" не впервые.

Люди давно заметили, что Гугля (да и Яндекс) часто играет в одни ворота.
И явно не за Россию.

А заговор это или ошибка (такая частая в отношении России) - это уж решать читателям.
Имеющий разум да поймёт.
mixturka
21 июл, 2014 20:09 (UTC)
Сноуден на днях сказал, что Гуглом и скайпом лучше не пользоваться. Без объяснений сказал.
global_avantur
22 июл, 2014 03:50 (UTC)
умные люди давно об этом знают )

Я вам больше скажу - НИКОГДА и НИЧЕГО не удаляется из Инета.
Даже если это становится недоступно. Но не для спецслужб в нужный момент.

Поэтому если человеку есть что скрывать, то к Инету лучше даже не подходить. Ибо даже по одному банальному поисковому запросу, по переходу по ссылке, можно узнать очень многое. И использовать против него.
aka_mik
21 июл, 2014 18:35 (UTC)
Все просто - добавляй всем заявлениям Путина "не" - не ошибешься
vzanuda
21 июл, 2014 19:52 (UTC)
Я думаю мы все понимаем, что весь поиск и не только, в России и для России модерируется. Уверен, что и тут аналогично.
Стоит попробовать увидеть те же результаты, только с не наших IP.
l0st_paradise
21 июл, 2014 20:55 (UTC)
Самый настоящий Миланский айпи, ос на итальянском, все дела...
Картина та же.
victoria_kay
21 июл, 2014 20:36 (UTC)
то что вы пишете и демонстрируете- это бред сумасшедшего или троллинг.
то что вы пишете и демонстрируете- это бред сумасшедшего или троллинг
q3d
21 июл, 2014 22:53 (UTC)
то что вы пишете и демонстрируете- это бред сумасшедшего или троллинг.
то что вы пишете и демонстрируете- это бред сумасшедшего или троллинг
l0st_paradise
21 июл, 2014 20:58 (UTC)
Вспомни, например, вот это - http://bash.im/quote/397276. Или "Путин едет на желтой калине". Все эти переводчики очень рандомны.
q3d
21 июл, 2014 22:58 (UTC)
Да, прекрасно. А про Путина и Калину не помню ( Что там было?
l0st_paradise
22 июл, 2014 05:11 (UTC)
Долгое время, если ввести "Путин едет на желтой Калине", гугл выдавал "Putin goes yellow Mazda" или что-то подобное.
simonsg
21 июл, 2014 21:14 (UTC)
Помнится Жириновский возмущался похожей комбинацией:
http://std3.ru/4b/9c/1393867617-4b9c323c889974915c6c32e66725bacd.jpg

тогда об'ясняли что Google translate ищет предложения со всеми ключевыми словами, наиболее частый вариант воспроизводится невзирая на предлоги и другие частицы.
q3d
21 июл, 2014 22:58 (UTC)
Фактически, получается, переведённый текст можно разделить на две части: (1) имя (2) событие. Тогда не совсем понятно, почему в этом ключе выбивается Меркель, у которой принципиально другой перевод всегда.
Ksenia Shilova
21 июл, 2014 21:19 (UTC)
Да...Очень интересно...Я не поленилась и ввела эту фразу в своем Гугл-переводчике...Результат такой же,как у Вас:Путин входил...
q3d
21 июл, 2014 23:00 (UTC)
Вот это и странно. Выше есть объяснение про поиск расхожих фраз, но тогда Меркель выбивается (
smertvichdreng
21 июл, 2014 21:56 (UTC)
думаю дело в следующем: западная пропаганда намеренно искажает восприятие русских текстов для читателей которые хотят разобраться в какой-то политической новости из России, например часто используется отрицание чего-то что навлекает негативную окраску. Например новость про то, что Путин не делал чего-то что ему приписывается нашим противником: западом или конкретно допустим Америкой.

Теперь предположим какой-нибудь американец хочет почитать новости из России но не знает языка, он забивает текст в переводчик, для этого надо всего-лишь кинуть ссылку с новостью в окошко, дальше гугл сделает все сам, и с большой долей вероятности ему выдаст искаженную новость.
global_avantur
22 июл, 2014 03:52 (UTC)
абсолютно в дырдочку!
Империя Лжи никогда не спит.
shakhmanov
22 июл, 2014 03:20 (UTC)
а если всё писать с маленькой буквы то картина меняется)
q3d
22 июл, 2014 12:15 (UTC)
Логично предположить, что тогда оно перестаёт воспринимать это как фамилии, и переводит уже как текст.

Эх... далеки же ещё современные технологии машинного перевода от человеческой логики. Интересно было бы посмотреть, как может выглядеть политический диалог двух разноязычных оппонентов, пользующихся гуглотранслейтом в реальном времени ) Ведь это уже почти на пороге выхода - ты говоришь голосом, а оно переводит голосом же.
shakhmanov
22 июл, 2014 13:42 (UTC)
Ну значит переводим всё с маленькой буквы и не паримся. К чему насиловать мозг?
Это особенности компьютерной аналитики гугла, искуственный интелект далёк от совершенства). Просто Я искренне не понимаю зачем ломать над этим голову. Нужно учить языки - это тренирует память, да и вообще полезно)) имхо конечно же
q3d
22 июл, 2014 17:29 (UTC)
Языки учить надо, не спорю, но и системы машинного перевода должны развиваться, за ними будущее. Всегда останутся языки, которые не изучишь, и люди, увлечённые другими вещами.
shakhmanov
23 июл, 2014 05:37 (UTC)
Должны та должны, только вопрос как вы себе это представляете? Я вот не знаю как заставить машину думать как человек). На данном этапе развития эволюции думаю это фантастика. Дай бог конечно чтоб я ошибался)
smertvichdreng
22 июл, 2014 19:22 (UTC)
но ведь никто не будет писать фамилии с маленькой буквы.

во-первых это безграмотно, во-вторых долго самому менять и в-третьих статья не об этом же написана "как перевести текст гугелтранслейтом" а о том, почему такое вобще возможно.
semer777kin
22 июл, 2014 03:29 (UTC)
Мда, забавно...вот некоторый результат:
Самолет не шлялся над Украиной - The plane did not wandered over Ukraine
Самолет Путина не шлялся над Украиной - Putin's plane wandered over Ukraine


Обама педераст - Obama bugger -

Раз два три четыре пять, Путин не вышел погулять над Украиной -
One two three four five, Putin did not went for a walk over Ukraine


Раз два три четыре пять, самолет Путина не вышел погулять над Украиной -
One two three four five, Putin's plane went for a walk over Ukraine


Раз два три четыре пять, самолет Обамы не вышел погулять над Украиной
One two three four five, Obama's plane went for a walk over Ukraine
lugner17
22 июл, 2014 14:42 (UTC)
Там в окне перевода есть кнопка редактировать (предложить перевод), при достаточно большом количестве людей, предложивших изменение перевода гуглу, он начинает выдавать фразу, ту которую в него засовывали. Можно заставить его переводить белое как черное.
kvazimoda24
22 июл, 2014 17:38 (UTC)
Давно уже заметил косяк с гуглопереводчиком. Когда активно им пользовался, он очень часто убирал или добавлял предлог "не", т.е. полностью переворачивал смысл предложения. С тех пор стараюсь за этим следить.
( 28 комментариев — Оставить комментарий )

Подписаться на этот блог




Новые обзоры в блоге</a>

Обзор AfterShohz Bluez 2 с костной проводимостью

Обзор Plantronics Voyager Legend

Обзор Canon 7D Mark II

Обзор PowerGorilla

Обзор PowerGorilla

Календарь записей

Декабрь 2016
Вс Пн Вт Ср Чт Пт Сб
    123
45678910
11121314151617
18192021222324
25262728293031

Теги

Разработано LiveJournal.com
Designed by Tiffany Chow