Станислав Васильев (q3d) wrote,
Станислав Васильев
q3d

Categories:

Самолёт Путина входил в воздушное пространство Украины?!

Понимаю, что сейчас в комментарии может набежать комментаторов не по делу но, как айтишник, не могу не поднять вопрос. Кто-нибудь из специалистов по системам компьютерного перевода может пояснить, почему переводчик Google так странно переводит фразы про самолёт Путина и Украину?

Самолёт Путина входил или не входил в воздушное пространство Украины

Я правильно понимаю, что Google использует некие контекстные технологии, и берёт какие-то выборки "наиболее распространённых фраз" из интернета, для более точного перевода? Какой именно механизм приводит к тому, что "не" полностью игнорируется в одних предложениях, и не игнорируется в других? Судя по тому, как переводится текст, популярные фамилии система знает и учитывает, но у одних "не" учитывается, а у других нет.

Собственно, увидел такие скриншоты в комментариях к одному из политических постов, решил сам проверить, под катом результат.

P.S. Обратите внимание на вариант с Меркель.


1.
Самолёт Путина входил или не входил в воздушное пространство Украины

2.
Самолёт Путина входил или не входил в воздушное пространство Украины

3.
Самолёт Путина входил или не входил в воздушное пространство Украины

4.
Самолёт Путина входил или не входил в воздушное пространство Украины

5.
Самолёт Путина входил или не входил в воздушное пространство Украины

6.
Самолёт Путина входил или не входил в воздушное пространство Украины

Проверил себя, любимого, и результат совсем эпичный. Я понимаю, что новости последних месяцев всё чаще не про Васильева, а про Васильеву... но нельзя же так.

7.
Самолёт Путина входил или не входил в воздушное пространство Украины

А вот вариант перевода по версии Яндекса:

8.
Самолёт Путина входил или не входил в воздушное пространство Украины

Ну и опрос, чтобы два раза не вставать:

Poll #1975947 Почему такой странный перевод у Google

Ваша версия?

Это просто частная техническая ошибка
3(5.5%)
Это особенность современных систем компьютерного перевода
4(7.3%)
Это заговор против России и Путина
14(25.5%)
Это 3.14$#ец
22(40.0%)
Это неведомое
9(16.4%)
Другое
3(5.5%)





Проверить можно тут: translate.google.com

Другие мои посты по тегу #хайтек:
Tags: вам слово, загадка, косяки, хайтек
Subscribe
promo q3d июнь 12, 2014 11:01 41
Buy for 300 tokens
Окончательно понял, что зачем нужна выдержка, диафрагма и ISO нужно написать как можно понятнее, простыми словами. Слишком много идёт вопросов от учеников и читателей, проще давать ссылкой. Выдержка Итак, выдержка. Это время, за которое свет падает на матрицу. Измеряется в секундах и долях…
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 28 comments