Общество

Переводчик ChatGPT против моего: кто кого?

Я видел много статей и восхищенных отзывов, в которых переводчик ChatGPT не уступает по качеству DeepL и Google, а иногда их даже превосходит. Как основателю компании Lingvanex, которая уже 6 лет занимается разработкой собственных решений по переводу, мне стало интересно насколько наше решение сопоставимо с ChatGPT.
Переводчик ChatGPT против моего: кто кого?

Нужно ли мне бояться такого сильного конкурента?

Для сравнения качества перевода мы подготовили тесты на семи языковых парах:

  • Английский-испанский

  • Английский-немецкий

  • Английский-русский

  • Английский-французский

  • Английский-итальянский

  • Английский-португальский

  • Английский-финский

Каждый тестовый датасет включает в себя в районе 2500 строк и охватывает предложения разной тематики, длины, стилистики и форматирования, чтобы исключить подбор текста под конкретный переводчик.

Совсем недавно ChatGPT предоставил API версии 4 в ограниченный доступ. На текущий момент доступ к нему имеют только ранее созданные аккаунты, которые уже платили за версию 3.5. Судя по отзывам, новая версия сильно продвинулась в плане качества относительно версии 3.5. И это мы тоже проверим! 

Для тестирования возьмем 2 метрики BLEU и COMET:

BLEU – общепризнанный стандарт для тестирования качества перевода.  По умолчанию будем использовать версию SacreBleu. Эта версия используется в конференции по машинному переводу WMT и различных международных соревнованиях. В этой метрике сравнение перевода идет по количеству n-gram (комбинаций слов), которые идут друг за другом. Цель метрики в том, чтобы найти максимально совпадающие комбинации между переводом, сделанным человеком и машиной. Сравнение начинается с кластеров в четыре слова. Если таковых не обнаруживается, но идет поиск трех n-gram. При дальнейшем отсутствии совпадений можно дойти до одного n-gram. Очки начисляются за каждые последовательности слов (токенов), которые нашла программа. Минус метрики в том, что она не учитывает синонимы и если в переводе мысль передана верно, но другими словами, то она покажет 0. 

COMET – метрика, разработанная для решения проблемы сравнения синонимов, с которыми не справляются метрики, основанные на символьном сравнении двух строк. Если результатом перевода будет похожая по смыслу фраза, но описанная другими словами, то метрика покажет похожие результаты. Стоить отметить, что ее результат также будет зависеть от разнообразия языкового корпуса, на котором будет построен классификатор для сравнения. Данная метрика широко используется, как альтернатива метрике BLEU. 

Промпты, которые мы использования для перевода через ChatGPT:

You are TranslateGPT. You translate user messages from English to Italian (Finnish / French / German / Portuguese / Russian / Spanish). You are the most accurate English to X translator in the world.

Ниже показаны графики с результатами тестов:

Перевод англо-финский

Мы взяли эту пару как пример языка, который имеет сложную грамматику. На графике видно, что по обоим метрикам наше решение превосходит обе версии ChatGPT.

Перевод англо-французкий

На этой паре языков заметно улучшение качество перевода ChatGPT 4 относительно версии 3.5. По метрике COMET ChatGPT4 уже немного превосходит Lingvanex.

Перевод англо-немецкий

При переводе на немецкий язык ситуация такая же, как с французским. Но отставание по метрике COMET у Lingvanex - минимальны.

Сведем все отличия в таблицу. Красным шрифтом покажем где ChatGPT  уступает Lingvanex. Зеленым шрифтом пометим, где превосходит. Данные актуальны на 31 июля 2023 года.

Цена перевода Lingvanex рассчитывалась исходя из стоимости месячной аренды GPU сервера начального уровня (150 дол) + цена перевода за языковую модель Lingvanex в месяц (от 100 дол) и количества символов, которых можно перевести за месяц на этой конфигурации.

Выводы:

По результатам теста видно, что если ChatGPT 3.5 в большинстве случаев уступает Lingvanex в качестве перевода, то ChatGPT4 нередко достигает по метрике COMET. 

Стоит учитывать, что на данный момент перевод больших объемов текста с помощью ChatGPT4 является очень дорогим. Для того чтобы проделать тесты для этой статьи и перевести около 20 тысяч строк с помощью ChatGPT4, было потрачено 45 долларов. Расчет цены перевода может сбивать с толку, поскольку заранее сложно рассчитать в токенах, сколько вы заплатите за перевод.

На текущий момент скорость перевода через ChatGPT 4 нестабильна, скорей всего она зависит от текущей загруженности их серверов. Между запросами нам приходилось делать перерыв 3-4 секунды. В целом, на тестовом датасете скорость перевода составила около 8 слов в секунду. Наше решение позволяет переводить несколько тысяч слов в секунду даже на слабых серверах. К тому же было замечено цензурирование перевода: если в строке присутствует сквернословие и мат, ChatGPT не будет переводить все предложение.

Таким образом, ChatGPT лучше использовать для стилистического перевода небольших объемов текста без особых требований по безопасности. Причем стили и тематики можно менять на лету. С помощью подбора промптов можно добиться улучшения качества под конкретную задачу, но для этого придется перебрать достаточное их количество.

Решения по переводу Lingvanex лучше использовать там, где нужны большие объемы перевода по низкой цене, безопасность,  скорость и стабильность. 

Я допускаю что на каких-то парах языков, разница в качестве перевода может быть другой, но тестировать все возможные пары долго и дорого. 

В целом, решения от ChatGPT и Lingvanex предназначены для разных целей и их надо выбирать в зависимости от задачи.

Если вам подходит решение нашей компании, то мы предоставляем бесплатную двухнедельную пробную версию нашего сервера, мобильного SDK и Cloud API.  Наша компания также предлагает решения по транскрипции речи (аудио в текст).

Если хотите протестировать наше решение, пишите на info@lingvanex.com

Ещё раз: как продвигать свои посты на «Клерке»

Если вы видите это сообщение, значит продвижение работает.

Ещё раз: как продвигать свои посты на «Клерке»
9

Комментарии

3
  • Марин@@

    А почему не проанализирован вариант английский-русский? И чат я лично использую наоборот для перевода с русского на английский 

  • alrudak

    Англо-русский смотрите в таблице, колонка 6

    • Марин@@

      Увидела, спасибо. Но интересно еще увидеть данные по переводу с других языков, особенно с русского, на английский 

Налоговые перспективы на 2025 год. Прогрессивная шкала НДФЛ

Какими будут налоговые ставки НДФЛ в 2025 году и можно ли этот налог оптимизировать.

Курсы повышения
квалификации

22
Официальное удостоверение с занесением в госреестр Рособрнадзора

🚚 Грузоперевозка в страну ЕАЭС может облагаться разным НДС

При сделках с контрагентами из стран ЕАЭС взимание косвенных налогов при работах, услугах идет в стране, территория которой признается местом реализации. При грузоперевозках место реализации – страна исполнителя.

Цены на наушники на маркетплейсах оказались завышенными по сговору

ФАС выявила картель продавцов наушников на маркетплейсах. Продавцы общались в чате мессенджера, писали негативные комментарии конкурентам и заказывали наушники «в никуда».

Лучшие спикеры, новый каждый день

💥 Бодрящие скидки на курсы повышения квалификации и профессиональной переподготовки! Ведем запись на первый летний поток обучения

Набираем первый летний поток-2024 на курсы повышения квалификации и переподготовки с максимальными скидками, чтобы вы не ограничивали траты на отпуск и получили полезные знания. Начало обучения 1 июня, присоединяйтесь!

💥 Бодрящие скидки на курсы повышения квалификации и профессиональной переподготовки! Ведем запись на первый летний поток обучения
2

💥 Бодрящие скидки на курсы повышения квалификации и профессиональной переподготовки! Ведем запись на первый летний поток

Набираем первый летний поток-2024 на профкурсы. Успейте записаться до 3 июня, чтобы за лето повысить квалификацию и выйти на новый уровень знаний!

Итоги 35 месяцев инвестиций. 3,83 млн рублей

1 июня, значит пора защищать детей и подводить итоги мая! Ежемесячно я пишу отчёт о том, что произошло с моими инвестициями. Напоминаю: я начал копить на квартиру в Сочи в июле 2021. 35 месяцев позади. Погнали!

Итоги 35 месяцев инвестиций. 3,83 млн рублей
Опытом делятся эксперты-практики, без воды

Горящие глаза, «ген предпринимательства» и Борис Мальцев 

Студенты из акселератора «БизнесКуб» КубГУ, мечтая о собственных стартапах и предпринимательских прорывах, направлялись на встречу с успешными бизнесменами.

Горящие глаза, 
«ген предпринимательства» и 
Борис Мальцев 
1
Бесплатно с УСН

Как в 2024 году уменьшать налоги по УСН и ПСН на страховые взносы: таблица для ИП и ООО

При расчете налога на УСН «доходы» для фиксированных взносов факт уплаты не имеет значение, для взносов за работников — важен факт уплаты. На доходно-расходной упрощенке факт уплаты имеет решающее значение. Для подтверждения этого факта может понадобиться заявление о зачете. Смотрите в нашей таблице, когда и как можно учитывать взносы при УСН и ПСН.

Как в 2024 году уменьшать налоги по УСН и ПСН на страховые взносы: таблица для ИП и ООО

О чем говорят бухгалтеры — топ 5 обсуждаемых тем на этой неделе. 👂«Ночной бухгалтер» № 1694

Говорили не только о реформах, обычные рабочие проблемы никуда не делись. Кто-то в Китай не может перевести деньги, у кого-то налог на УСН — выпади глаза, а у кого-то вообще счета заблокировали. Но всегда есть коллеги-спасители, которые и словом утешат, и делом помогут.

Иллюстрация: Вера Ревина / Клерк.ру
Валюта

Стартовал сезон скупки долларов

Интерес к валюте вырос в преддверии сезона отпусков, на спрос также повлияло укрепление рубля.

3

Иван Никитенко: «Я точно не готов продавать душу и работать с клиентами-говнюками»

Это второй сезон проекта «ТоТ еще разговор». Хочется говорить с предпринимателями об их бизнесе. Мы пригласили краснодарского предпринимателя Ивана Никитенко.

Иван Никитенко: «Я точно не готов продавать душу и работать с клиентами-говнюками»
3
Банки

Доля просроченных микрозаймов сократилась до 32%

80% клиентов МФО получают займы дистанционно.

Миникурсы, текстовые и видеоинструкции для бухгалтеров
УСН

Изменения по УСН: НДС и новые лимиты

К каким переменам ИП и организациям на УСН надо приготовиться в 2024-2025 гг.

Иллюстрация: Вера Ревина/Клерк.ру
Зарплата

Большинство компаний МСП повысили зарплаты: каким именно специалистам

В основном бизнес повысил оклады линейным специалистам и руководителям отделов. Доходы выросли, в том числе и у бухгалтеров.

При назначении налоговых выплат будут учитывать детей до 23 лет

Семьи могут претендовать на налоговые вычеты, если дети до 23 лет получают очное образование.

Отпускные

Топ-4 трудностей с отпусками: с чем столкнулись бухгалтеры в 2024 году

Собрали ответы Роструда на частые вопросы об отпусках без сохранения зарплаты и компенсации за неиспользованный отпуск.

Иллюстрация: Вера Ревина/Клерк.ру
Общество

В поездах можно перевозить животных без их владельцев

Оформить документы и забронировать билет владельцы питомцев смогут на сайте РЖД, в информации нужно указать особенности ухода за домашним животным.

Какой будет налоговая система с 2025 года: реальность и предложения экспертов

30 мая 2024 года в рамках Ильинского клуба предпринимателей при ТПП прошли общественные обсуждения налоговых реформ и изменений в НК, в том числе предложенных Минфином с 2025 года.

Какой будет налоговая система с 2025 года:  реальность и предложения экспертов
НДС

Медицинские товары облагаются НДС 10%, если на них есть регудостоверение

По медицинским изделиям может быть ставка НДС 10%, если они входят в перечень, не быть вообще НДС, если они входят в другой перечень или НДС 20%, если ни в один перечень этот товар не входит.

Интересные материалы

Теперь рассчитывать дни станет проще, на «Клерке» появился удобный калькулятор

Калькулятор вам поможет быстро найти ответ на вопрос «сколько дней между датами». Если вам нужно быстро что-то рассчитать, воспользуйтесь бесплатным калькулятором на Клерке». Задайте начальную дату, конечную дату — и получите результат.

Теперь рассчитывать дни станет проще, на «Клерке» появился удобный калькулятор
3