10 сентября 2024
Обсудить

Искусственный интеллект МТС научился писать на татарском языке

img
Компания МТС представила разработанную MTS AI новую версию большой языковой модели Cotype Lite для работы с текстами на татарском языке. Она получила название Rehmet — что в переводе означает спасибо.

MTS AI, один из ведущих центров компетенций по искусственному интеллекту в России, показал новую версию своей большой языковой модели Cotype на форуме Kazan Digital Week. LLM способна обрабатывать документы объёмом до 8 тысяч токенов (примерно 5 листов A4), извлекать и суммаризировать данные за несколько секунд.

Cotype Rehmet можно использовать в архивах, библиотеках, в государственных и частных организациях — везде, где есть потребность в обработке информации и анализе документов на татарском. Например, с помощью большой языковой модели можно ускорить обработку заявлений в государственные органы. Cotype извлечёт ключевую информацию, такую как тематика запроса, местоположение и личные данные заявителя, и передаст их в соответствующую базу данных. Как и другие модели семейства Cotype, эту версию можно устанавливать в контуре организации, что позволяет исключить утечки информации.

— Создавая большую языковую модель на татарском, разработчики MTS AI преследовали несколько целей, — рассказал исполнительный директор MTS AI Дмитрий Марков. — Во-первых, мы хотели поддержать многообразие языков, существующих в России, помочь им развиваться и быть востребованными в цифровую эпоху. Во-вторых, этот проект показал, что мы умеем адаптировать наши модели под любые научные и бизнес-задачи, в том числе и такие нетривиальные как обработка информации на языках народов России.

Чтобы модель Cotype Rehmet смогла понимать незнакомый язык, разработчики собрали датасет и перевели его с русского на татарский. После этого все данные и ответы модели проверили специалисты-тюркологи и носители языка.

По словам разработчиков, Cotype Rehmet входит в число лучших LLM в своём классе: она содержит 8 миллиардов параметров. При необходимости MTS AI может создать LLM на татарском с большим количеством параметров — до 70 миллиардов параметров, а также большим контекстным окном до 32 тысяч токенов, — чтобы модель умела выполнять такие задачи как перевод и генерация длинных текстов. Также компания MTS AI готова адаптировать модели семейства Cotype для других региональных языков России.

MTS AI — дочерняя структура ПАО «МТС» и один из крупнейших в России центров компетенций в сфере искусственного интеллекта. Компания разрабатывает продукты и решения на базе генеративного ИИ, технологии обработки естественного языка, синтеза и распознавания речи, а также компьютерного зрения. MTS AI также проводит научные и прикладные исследования, консультирует корпорации по вопросам внедрения искусственного интеллекта в бизнес-процессы. В структуре компании есть венчурный фонд, который инвестирует в перспективные разработки.

Ранее стало известно, что искусственный интеллект от МТС начнёт анализировать звонки и чаты с клиентами экосистемы.

Автор:
Анна Инина
Фото:
Мария Давыдова
Подписывайтесь в Telegram
Отправьте свою новость в редакцию, расскажите о проблеме или подкиньте идею для публикации. Присылайте свои фото и видео!
Отправьте новость

Оставить комментарий

Нажимая кнопку «Отправить», вы даёте согласие на обработку персональных данных в соответствии с «Политикой обработки персональных данных».

Опубликованные сообщения являются частными мнениями лиц, их написавших. Редакция сайта за размещенные сообщения ответственности не несет.
  • Лента новостей
    • img
      Космонавт Олег Платонов передал с орбиты привет челябинской школе, в которой учился
    • img
      С Днём ВДВ военнослужащих и ветеранов Челябинской области поздравил губернатор
    • img
      В Челябинской области 30-летний водитель устроил смертельное ДТП и попытался скрыться в лесу
    • img
      «Банщик на опыте»: медведь Малыш из зоопарка показал челябинцам яркое шоу с водными процедурами
    • img
      Режим «чёрного неба» на три дня объявили в семи городах Челябинской области
    • img
      Уголовное дело возбудили после гибели четырёхлетнего ребёнка на озере Калды в Челябинской области
    • img
      Бывшую воспитательницу в Челябинске будут судить за истязания детей
    • img
      Склад с алкогольной продукцией загорелся в Челябинске
    • img
      Для стройки челябинского метротрама закупают локомотивы, платформы и вагонетки
    • img
      Эксперты составили рейтинг «дорогих» вакансий с зарплатой до 200 тысяч рублей в Челябинской области
    • img
      Челябинские ветераны спецоперации прошли федеральную программу «СВОй бизнес»
    • img
      Как продвигается ремонт трамвайных путей на улице Кирова, рассказали челябинцам
    • img
      В Челябинской области расчистят участки двух рек протяжённостью более 800 метров
    • img
      На озере Калды в Челябинской области утонул четырёхлетний ребёнок
    • img
      В Челябинске на Шершнях восемь вагонов сошли с рельсов
    • img
      Красивую набережную, уютный двор и сквер благоустроили в Тракторозаводском районе Челябинска
    Все новости