«Ать-ать»: попросите переводчик прочитать 78945738793857 (и он не поймет, что происходит)
В 2019 году пользователи Siri обнаружили забавный баг голосовой помощницы: если попросить ее произнести что‑то вроде «Ахахахахххахххахахах», то она издаст какие‑то странные, захлебывающиеся и даже пугающие звуки. Оказывается, в российском «Яндекс.Переводчике» можно получить еще более необычный результат.
Пользовательница тиктока @thelizamaps1 опубликовала ролик, в котором голос «Яндекс.Переводчика» зачитывает очень длинную последовательность цифр — 627193939303922928272625… — записанную через знак доллара. Сначала механический голос успешно справляется с ней, но потом запинается и произносит странные и забавные звуки: «ать-ать-ати-ати-ати», «эвэ-эвэ» и «два-о-о-о-о».
Эксперимент можно повторить в домашних условиях: достаточно написать в поле перевода с русского любую, но главное, очень длинную последовательность цифр (можно даже обойтись без символа доллара), а потом нажать на значок зачитывания. Работает это только в «Яндекс.Переводчике» — Google Translate спокойно, но не очень выразительно зачитает число любой длины. Компания «Яндекс» не смогла оперативно прокомментировать необычный глитч в голосе «Переводчика».
Мифы о техническом переводе
Вокруг технического перевода существует немало мифов, которые часто дезориентируют участников рынка и прежде всего заказчиков. Рассмотрим некоторые из них.
1. Технический перевод — это редкий и мало востребованный вид перевода.
Обратимся к статистике, которую легко найти на сайтах бюро переводов:
Как видим, среднестатистическое БП в 30% случаев занимается именно техническим переводом. А есть и такие БП (в частности, мое TTS, GEF, «Интент» и ряд других), которые занимаются практически только техническим переводом и вполне процветают. Более того, на конференции «Индустрия перевода-2019», которая прошла в Перми, были озвучены данные статистики, согласно которым до 80% всех переводимых в мире текстов относятся к технической литературе.
Как сформировался этот миф? Технический перевод не любит маркетологического шума. Интернет забит в основном сайтами, блогами, постами устных переводчиков нетехнического профиля, а технических переводчиков еще надо поискать: это редкий вид, всегда заваленный работой на месяц вперед.
Заказы по технической тематике через Интернет не приходят (ну нельзя же серьезно полагать, что крупные промышленные компании будут на Facebook или ProZ искать специалиста для перевода документации на атомный реактор или широкофюзеляжник). К тому же в большинстве случаев технический перевод – это конфиденциальные тексты, обсуждать которые в сети нельзя. Вот и получается, что технического перевода очень много в жизни, но мало в Интернете.
2. Главное для технического переводчика — знание терминов. При наличии глоссарии можно перевести любой текст.
Как возник этот миф – понятно. Он позволяет многим некомпетентным лицам с дипломом переводчика смело браться за перевод документации на оборудование, принципа действия которого они не понимают. Результаты, правда, чаще всего катастрофические, но горе-переводчик этого даже не понимает.
Хороший пример – пресловутый термин «арматура». В русском языке, увы, им называют две принципиально разные вещи. И в глоссарии может быть вполне обоснованно написано, что «арматура» — это “valves”. И это так, когда речь идет о запорной арматуре – кранах, клапанах, задвижках, т.д., Но есть еще и строительная арматура – металлические или полимерные стержни, закладываемые в бетон. Они переводятся «reinforcement bars». Очень часто в одном и том же документе упоминается и строительная арматура, и запорная. В итоге «переводчик букв» начинает «заливать клапаны и краны бетоном»…
И в качестве вишенки на торте – слово «armature» в английском языке существует, но оно вообще не из той оперы: это якорь электродвигателя.
Ну и пресловутая «проблема pin-а». Получает переводчик состав изделия, т.е. перечень входящих в изделие деталей и узлов. И там в одной из строчек написано «Pin». И все: контекста нет, чертежей нет. Открываем словарь и видим:
Pin: палец; бочка; ввертная деталь резьбового соединения; ниппель бурильного замка; нагель; цевка; ножка; пестик сцепной арматуры; стержень шарнира; шпенёк; шток клапана; охватываемая деталь резьбового соединения; ригель замка; ниппель c резьбой; штепсельный штырь; игла принтера; дюбель… и еще штук 50 значений.
Помог словарь, да? В таком случае нужно попросить у заказчика чертежи или 3D-модели (и, соответственно, уметь их читать, а также владеть CAD-системами, в которых эти чертежи и модели создаются). А самое главное – четко знать, как выглядит на чертеже тот pin, который «шток клапана», а как – тот, который «нагель».
Резюме: СЛОВАРЬ НЕ ВСЕГДА ПОМОЖЕТ! Поможет, прежде всего, глубокое понимание конструкции и принципов работы оборудования.
3. Технический переводчик дословно перекладывает то, что написано, на другой язык. Понимать смысл текста не обязательно.
Источник этого мифа тот же, что и у предыдущего. Известна история, когда в тексте попалось словосочетание “tractormuffler, 2 pcs.”. Это глушитель трактора, через который выпускаются выхлопные газы двигателя. Переводчик, ничего не знающий о тракторах, смело открыл Мультитран, увидел, что слово “muffler” означает «кашне» и не менее смело написал «Кашне для трактора – 2 шт.».
Когда ему указали на ошибку, человек стал возмущаться: «Я переводчик! Меня так учили – берешь словарь и переводишь! Я не обязан понимать смысл!»
Вот это «я не обязан понимать смысл» — самое страшное. Технический перевод – это не «word to word», но «sense to sense».
Надо понимать, что последствия неверного технического перевода будут крайне тяжелыми. Это не художественные тексты, а инструкции по монтажу, эксплуатации и ремонту совершенно реальных и нередко очень опасных объектов. Достаточно вспомнить известную историю «да горите вы там все синим пламенем!», когда в сборнике аварийных процедур самолета (эта книга лежит в кабине, ее достают, если что-то пошло не так, и точно выполняют все, что там написано) в переводе написали, что при пожаре в кабине на высоте свыше 10 тыс. футов первое дело – ВКЛЮЧИТЬ подачу кислорода. Ну, чтоб уж наверняка!
Разумеется, в исходнике было написано совсем другое – «PUSHOXYGENOFF». Но тут пришел переводчик-убийца…
4. Автор всегда прав. Переводчик не имеет права вносить какие-либо изменения в текст.
Это давняя концепция «прозрачного стекла», столь популярная в вузах, которую с полным правом можно назвать вредительской. Согласно этой концепции, переводчик – это прозрачное стекло, и в идеале его деятельность не должна замечаться читателем вообще.
Применительно к художественным текстам такой подход не вызывает вопросов. Мы воспринимаем тексты Конан Дойла и Киплинга в переводах Чуковского и Маршака «как родные».
Увы, современные технические тексты пишут вовсе не люди с талантом Киплинга. Как сейчас выглядит усредненный автор англоязычной технической документации в любой западной компании? Как правило, это вовсе не носитель английского языка, а представитель Латинской Америки, индус, китаец. Он находится за десятки тысяч километров от разработчиков и в глаза не видел то оборудование, про которое пишет. Более того, в его родном языке чаще всего отсутствует нужная терминология, и он не может осознать, что пишет глупость.
Для ускорения процесса 40-страничный документ одновременно пишут пять человек, что приводит к появлению очередного «письма из Простоквашино». Иллюстрации в текст вставляются без согласования с содержанием написанного. Очень поощряется так называемый reuse, когда новая документация собирается из кусочков старой. Разумеется, эти кусочки (как и работу коллектива авторов) никто между собой не согласует, поэтому с 1 по 25 страницу один и тот же объект называется «lattice conveyor», с 26 по 45 – «feeder», с 46 по 55 – «conveying lattice» и т.д.
Как абсолютно верно отмечает корифей технического перевода Израиль Соломонович Шалыт, «тексты на перевод бывают двух видов: плохие и очень плохие». Скажем, тексты на русском страдают путаностью и словоблудием – видимо, авторам не дают покоя лавры Л.Н. Толстого, – а также наличием огромного количества лишней, повторяющейся, давно устаревшей и никому не нужной информации. Кроме того, до сих пор сохраняется грубый, недружелюбный, «совковый» язык различных инструкций и даже рекламных материалов.
В английском же характерна противоположная болезнь – насаждение маркетингового стиля в чисто технических текстах. Доходит до того, что обычное руководство по эксплуатации теперь стали называть Customer Expectations Guide, а вместо нужной инженеру-эксплуатационнику информации по десять страниц расписывают о том, как сильно компания привержена высоким стандартам обслуживания заказчиков …
Вот почему в техническом переводе, чем дальше от текста — тем ближе к истине. Процитирую еще одного уважаемого коллегу и прекрасного специалиста В. Афанасьева: «Переводчику платят не за перевод, а за то, чтобы в дальнейшем с переведенным документом не возникало проблем». Переводчику сегодня платят за превращение мутного, путаного, кишащего ошибками текста в нормальное, гладкое повествование, отвечающее всем нормам написания и оформления технической документации.
В моей практике был случай: прислали испанцы текст на перевод про высоковольтную установку. И там была написана вроде бы безобидная фраза “For maintenance, connect points A and B”. Я, привыкший «копать» текст, нашел электросхему, где были отмечены эти точки. И убедился, что если электрик их и правда перемкнет, то это будет последнее, что он сделает в своей недолгой, но яркой жизни. Потому как произойдет короткое замыкание, а сила тока достигнет уровня в несколько тысяч ампер. В данном случае въедливость переводчика спасла заказчика от крупных неприятностей.
5. С техническим переводом прекрасно справляется Google Translate.
Миф про машинный перевод (МТ) – один из самых устойчивых. Причем если в России простой обыватель в принципе понимает, что МТ выдает чушь, то на Западе крайне агрессивная рекламная компания уже убедила большинство принимающих решения лиц, что «за перевод платят только лузеры, а все прогрессивные компании пользуются только МТ».
Сплошные ахи слышатся на тему «MT! Bigdata! Нейронные сети!». В итоге не так давно я получил на перевод с английского основные сведения о швейцарской компании-производителе очень дорогих хроматографов. Компания с оборотом в полтора миллиарда евро перевела свой слоган, миссию и прочие важнейшие декларации с немецкого на английский с помощью машинного перевода. И результат МТ (абсолютно невменяемый) прислали мне.
МТ имеет право на существование, но где-то на периферии, когда надо бегло ознакомиться с содержанием текста (и то не факт, что цель в результате будет достигнута, так как нейронные сети склонны делать перевод с точностью до наоборот). Но запуск в дело текстов после МТ – это преступление.
Например, в 2016 году вышел ГОСТ Р ИСО 30042-2016 «Системы управления терминологией, базами знаний и контентом. Обмен терминологическими базами [TermBase eXchange (TBX)]». В нем сказано, что стандарт «подготовлен Автономной некоммерческой организацией «Институт безопасности труда» (АНО «ИБТ») на основе собственного перевода на русский язык англоязычной версии международного стандарта». Весь текст этого ГОСТа представляет собой машинный перевод, понять в котором ничего нельзя. Вот пример одного из перлов:
«В бегущем тексте названия категории данных установлены от использования передовых разрезов и курсива. В случае документа ТВХ случай верблюда (например,
Еще раз – ЭТО ДЕЙСТВУЮЩИЙ ГОСУДАРСТВЕННЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ. И правда – «случай верблюда».
Недавно мне довелось прочитать исследование, в котором сравнивались два «белковых» перевода художественного текста и перевод от Яндекса. Яндекс.Переводчик выдал вполне хороший текст, чем очень обрадовал автора. Но в этом исследовании допущена типичная «ошибка выжившего». Хорошее качество машинного перевода объясняется именно тем, что данный роман дважды переводился на русский, его переводы имеются в сети и в базе данных Яндекс.Переводчика. Если бы роман изначально не переводился человеком, то результат вышел бы гораздо более плачевным. Данный фактор необходимо всегда учитывать при анализе качества МТ.
Границы применимости МТ, выполненного по любой технологии (rule-based, статистический, нейронные сети), вполне очевидны: МТ обрабатывает исходный текст. В техническом переводе это не работает в принципе из-за неизбежного наличия грубых ошибок в исходном тексте.
Возвращаясь к вышеприведенному примеру: никакой машинный перевод не сможет заглянуть в электросхему и понять, что нельзя писать в переводе «перемкните точки А и В». Поэтому любые попытки применения МТ в техническом переводе – глупое и опасное занятие.
Постредактирование никак не спасает ситуацию: время на него превышает время на перевод с нуля по той же причине: технический перевод не может быть «текстоцентрическим». Законы природы, логика, знание принципов работы оборудования, чертежи и схемы имеют абсолютный приоритет над путаным и ошибочным исходным текстом. В практике работы агентства TTS машинный перевод не пригодился ни разу.
6. Технический переводчик может переводить тексты по любой отрасли техники.
Техногенная цивилизация, созданная человечеством за последние 250 лет, крайне сложна и многообразна. Времена таких универсальных гениев, как Леонардо да Винчи, давно прошли. ХХI век – век узких специалистов. С другой стороны, законы природы универсальны, а подшипник остается подшипником и в автомобиле, и в марсоходе. Поэтому техническому переводчику, конечно, легче освоить новую область техники, чем, скажем, юридическую либо медицинскую тематику (которые я лично считаю еще более сложными, чем техническая). Но для этого надо иметь базовые естественнонаучные знания, которых выпускник обычной переводческой кафедры, увы, лишен напрочь.
Выводы:
1. В техническом переводе исходный текст не является основным источником информации.
2. Машинный перевод к техническим текстам неприменим в принципе.
3. Знание терминов бесполезно без понимания их смысла.
4. Править ошибки и глупости оригинала — прямая обязанность технического переводчика.
Троицкий Дмитрий Игоревич — руководитель и владелец агентства переводов и разработки программного обеспечения TTS, работал в АО «Атомэнергопроект». В настоящее время также ведет курсы перевода («Машиностроительный перевод», «Перевод в науке и образовании», «Борьба с Runglish», «Автоматизация труда письменного переводчика» и др.) в школе переводчиков и в университетах страны.
Комментарии 0
Чтобы оставить комментарий, пожалуйста, войдите или зарегистрируйтесь
Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/-hosting-/roman/data/www/toptr.ru/core/cache/includes/elements/modsnippet/12.include.cache.php on line 416
Тиньков назвал причины срыва сделки с «Яндексом»
Российский предприниматель и основатель Тинькофф Банка Олег Тиньков к причинам срыва сделки TCS Group с «Яндексом» отнес рост акций группы и позицию менеджмента ИТ-компании. Об этом он рассказал в документальном фильме о Тинькофф Банке «Он такой один», премьера которого состоялась в Москве вечером 1 декабря. Картину снял журналист Андрей Лошак. По словам Тинькова, о сделке он договаривался в течение месяца, лежа в инфекционном боксе: «Вот я месяц лежал с телефоном и сделал эту сделку с Грегом Абовским (экс-финансовый директор «Яндекса». — РБК), Тиграном Худавердяном (управляющий директор группы «Яндекс». — РБК) и с Аркадием (Воложем, сооснователь и генеральный директор группы компаний «Яндекс». — РБК)». В марте 2020 года стало известно, что у Тинькова диагностирована лейкемия. Бизнесмен борется с ней с октября 2019 года. «Что пошло не так: во-первых, я болел и дико росли акции в цене. Мы начали сделку по цене там типа $20, а когда заканчивали, она там $40, что ли, была, не помню», — сказал Тиньков.
В результате сделки должен был быть создан «национальный чемпион», где у Тинькова не было бы контроля, но была бы возможность консультировать ведение бизнеса — такой взгляд был у самого бизнесмена. По его словам, такого подхода «менеджмент [«Яндекса»] испугался». «Они говорят: «Ну на хрена нам. У нас есть Аркадий, который нам клюет [мозг], еще тут Тиньков появится, харизмат такой». И они его заболтали, Аркадия, что «зачем нам Тиньков». Я говорю: «Нет, подожди, а если вы не хотите, чтобы я вообще как-то принимал участие, то это просто покупка <. >. Тогда больше денег и бабки сразу», — описал ситуацию предприниматель. Бизнесмен считает, что Волож сейчас жалеет о срыве сделки, потому что в прошлом году TCS Group стоила «копейки» — ее цена составляла треть от текущей стоимости. В сентябре 2020 года акции TCS Group торговались по $26,45, на 2 декабря 2021 года — $100,75. TCS Group, контролирующая Тинькофф Банк, объявила о возможной сделке с «Яндексом» 22 сентября 2020 года. Предполагалось, что технологическая компания приобретет весь акционерный капитал TCS Group за $5,48 млрд, часть суммы должна была быть профинансирована акциями «Яндекса». После сообщений рынок оценивал потенциал объединенной структуры в $30 млрд.
Как каруселят вайтишников: одного 5 месяцев, другого 6 часов. Результат одинаковый
dev.by обратился к читателям с просьбой рассказать про незабываемый «карусельный» собес. И узнал, что чудеса случаются при устройстве не только на работу, но и на стажировку, и даже при поступлении на ИТ-курсы. Вот две истории.
Текст: Отдел новостей Фото: PANDARAMA Теги: собеседования, #войтивайти, карусель, яндекс, mic
Нашли ошибку в тексте-выделите ее и нажмите Ctrl+Enter. Нашли ошибку в тексте-выделите ее и нажмите кнопку «Сообщить об ошибке».»
Читайте также
12 VPN-сервисов, которые помогут обходить блокировки
Сделали обзор VPN-сервисов, которые лидируют в рейтингах, и сделают вашу работу в интернете быстрой и безопасной.
Как разработчик в Польше работал курьером (но потом всё получилось)
@dzikpic, канал для айтишников в Польше, рассказал историю Александра. Перед тем, как попасть в польскую компанию, он два месяца доставлял еду в Glovo. Каково это — ездить на велосипеде по 10-12 часов в день и почему маникюрщица зарабатывает больше разработчика.
Айтишник купил дом в Польше. Как получить разрешение в 2023, когда отказов больше
@dzikpic, канал для ИТ-экспатов в Польше, рассказывает историю белорусского айтишника, который купил дом в Гданьске, с комментариями эксперта. Обсудить историю можно в чате.
Belka Games уволила сотрудников в Беларуси, России и Литве
Хотите сообщить важную новость? Пишите в Telegram-бот
Главные события и полезные ссылки в нашем Telegram-канале
Обсуждение
Комментируйте без ограничений
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.
7 сентября 2021, 11:18
опа, 2й кейс был и у меня)) а комнания итр..))
user112334
7 сентября 2021, 11:33
strikerdimabel Software Engineer в EPAM
9 сентября 2021, 00:58
Ахах, как же это знакомо )))
7 сентября 2021, 11:27
«Вообще-то фидбек раз в месяц — это очень неудобно, но выбирать мне не приходилось.» — мне кажется Волож должен был лично принести извинения.
«В мире всегда есть точно такая же вакансия на точно такую же зарплату, но без лишних временных затрат.» — есть, в евроопте кассиром. Зарплата как у джуна на старте и напрягаться на собесе не надо.
Нужно просто не в одну дырку тыкаться было 6 месяцев. Велкам ту риал лайф, мазафаки.
Siarhei S Full Stack Developer в EPAM
7 сентября 2021, 11:44
Вторая история 100% про Itransition. Проходил их отбор на тестировщика, очень похоже на описание выше. Ну и бородатый мужик известная личность в итре, с его странным подходом к обучнению.
7 сентября 2021, 12:14
Это же почти как лицо компании получается.
Почему его не погонят оттуда тряпками?
kong_en_ge пенсионер в Сад и Огород
7 сентября 2021, 13:26
потому что если прогнать лицо, останется только [censored, П. 4.1.2. Пользовательского соглашения — https://dev.by/pages/agreement»]
kong_en_ge пенсионер в Сад и Огород
7 сентября 2021, 13:36
клево: в статье, значит, слово ввернуть можно, а в комментах уже моралисты на редактуре
Вадим Рупец
7 сентября 2021, 14:11
Может потому, что с ним на похожих позициях работают похожие люди по мировоззрению?
superavik Dev в CTDEV
7 сентября 2021, 11:55
У нас в ситидеве справляются максимум за две недели ( если тестовое задание за сутки сделал ) , увольняют гораздо оперативнее за 2 часа .
kong_en_ge пенсионер в Сад и Огород
8 сентября 2021, 07:58
т.е. у вас еще с заданием на сутки садят?
superavik Dev в CTDEV
8 сентября 2021, 19:45
Да , тречат , чтобы выполнил , иначе в блек лист и игнор
victory-sett
7 сентября 2021, 12:13
Эх, вторая история вызвала ностальгию. Воспользуюсь случаем и передам привет компании Itransition 🙂
ade автор в t.me/adeby
7 сентября 2021, 12:42
Неправильно: «потому что объяснить их выбор логикой абсолютно невозможно».
Правильно: «потому что я не способен объяснить их выбор логикой».
7 сентября 2021, 13:06
Интересно, работает ли ещё кто-то в итране с [censored, П. 4.1.2. Пользовательского соглашения — https://dev.by/pages/agreement»]
Я был на какой-то встрече со студентами в их офисе.
Человека с бОльшими комплексами не встречал пока что.
Высокомерие через край, хотя, казалось бы, работает не в BellLabs поди.
Здесь я не исключаю, что человек может быть эрудированным, но когда ты ведёшь себя как самодур в бизнес среде, для меня это показатель.
7 сентября 2021, 13:41
Ну вы поняли о ком я.
Вадим Рупец
7 сентября 2021, 14:11
Имя на П, фамилия на Л
anegin Principal JSON Architect в WWW
7 сентября 2021, 14:24
Подходы в яндексе я смотрю не меняются от слова совсем. Так же проходил всех эти этапы собеса на позицию дева, в итоге — отказ. И к счастью — требования как в faang, зп хорошо если дотягивает до уровня среднерыночной, гордиться строчкой «яндекс» в резюме — только для студентов.
Вадим Рупец
7 сентября 2021, 14:26
После прочтения второй истории об Itransition я словил вьетнамские флешбеки.
Сам прошёл через этот многочасовой отбор, это было очень утомительно и долго. В самом начале тебе дают тест с 120+ вопросов по логике. Вопросы в стиле «В каком году затонул Титаник?». После тест на знание языков программирования. В имейле от эйчара перед тестированием было сказано, что рекомендуется знать любой C-подобный язык. Тест был на 200+ вопросов и давалось на всё 2.5 часа. Вопросы были как и адекватные (регулярки и основы ООП), так и хитрые про особенности Java, Python, C#, C++, Javascript, которые вайтишник вряд ли знает.
Последней каплей стало организационное собрание для тех, кто прошёл этот мега-отбор. Пришёл главный инженер компании, который по моему мнению просто самоутверждался за счёт студентов. Мерзкие шутки, странное чувство юмора, токсичная атмосфера и установка на то, что хорошие программисты должны хорошо знать всё про все платформы и языки, должны быть готовы взять любую таску.
Само собрание было в пятницу. Главный инженер выдал домашнее задание: 4 небольших проекта на разных языках программирования, один из который что-то вроде MS Paint только web-версия с облачным хранилищем, drag and drop и другими фишками. Этот пэйнт надо было сдать к следующей пятнице, а другие 3 задания к среде.
Распределение по языкам (Java, Python, C#) происходит без твоего мнения и желания, как будто рандомно. После всего этого я ушёл оттуда и зарёкся как-либо сотрудничать с этой компанией. Это ужасный подход к найму начинающих. Так нельзя поступать.
16 сентября 2021, 12:26
Ну это не найм начинающих, это же отбор на курсы.
Про то что должны быть готовы взять любую таску- а че нет то? ты ж инженер а не манки кодер) просто вопрос времени выполнения
Paul Just Paul HR в DZENSOFT SOLUTION
7 сентября 2021, 15:06
Друг устраивается в Google, Amazon, fB и у них примерно одинаковый найм:
собес потом решение задач по программированию за 90 минут потом еще собес
С чего вы решили что найм должен быть простым?
Каждая фирма сама решает как ей работать
Вадим Рупец
7 сентября 2021, 15:17
Люди делятся своими впечатлениями о собеседованиях. Рассказывают о том, что им понравилось или не понравилось. Оценивать это надо как фидбек от кандидата, а не требование к компаниями.
Олег Грамович Lead QA Engineer в IDT Belarus
7 сентября 2021, 18:04
Аплодирую рассудительности Ярослава